本数据集提供了白银期货从2016年1月至2026年1月长达十年的完整每日价格序列。白银作为兼具金融投资属性与重要工业用途的关键贵金属,其价格数据是观察市场波动、进行宏观经济与商品分析的宝贵资源。此外,数据集基于提供的分析模型,包含了对2026年第一季度(1月至3月)的每日价格预测,使之成为一个融合历史回溯与前瞻性洞察的综合研究工具,适用于时间序列分析、预测模型验证与金融市场研究。
制造
图像
表格
本数据集以2024年多个国家的生活质量指标为核心,整合社会经济与环境要素,综合反映各国生活水平与整体福祉。涵盖生活质量、购买力、安全、医疗保健、生活成本及污染六大指数,从多维度呈现全球生活状况。该数据支持跨地区比较,可用于探索性分析、统计对比与可视化研究,帮助揭示不同指标间的内在联系,为学术、政策与数据科学应用提供结构化参考。
社会治理
文本
图像
表格
本数据集系统追踪了全球10个最具影响力超大城市的太阳能与风能原始资源可用性。它提供了直接影响可再生能源发电效率的逐小时大气条件快照数据,并包含一个经过定制计算的“绿色评分”,用以表征任一时刻太阳能与风能资源的综合潜力。该数据集旨在为可再生能源的时空分布研究、城市级能源系统规划,以及高能耗活动的绿色调度优化提供高分辨率、可比较的数据基础,支持与清洁能源部署相关的决策与创新。
能源
图像
表格
本数据集聚焦于薪资预测这一经典回归问题,记录了不同员工的薪资水平及其对应的工作经验、职位类别、教育背景等多项特征。该数据集是进行回归分析与机器学习入门的优质资源。其可被应用于线性回归、决策树等基础模型,或XGBoost、LightGBM等高级算法。通过此项目,不仅能掌握预测建模的完整流程,还能深入理解各特征对薪资的实际影响,提升模型可解释性分析能力。
人力资源
表格
本数据集收录了孟加拉国在2024年1月至2025年1月期间的心血管疾病风险综合评估数据,包含1,529份完整的患者记录及22项临床、生化和生活方式属性。它整合了人口统计、人体测量指标、临床读数、生化标志物及生活方式因素,并提供了“低/中/高”三级风险分类及量化风险评分。该数据集适用于开发心血管疾病风险预测的机器学习模型、开展南亚人群心血管流行病学研究以及构建临床决策支持系统。
医疗
文本
图像
表格
本数据集系统收录了2025年全球6个主要城市的空气质量数据,包含超过5.2万条记录。数据旨在量化不同城市的污染水平差异,为研究污染物暴露对呼吸系统和心血管健康的短期及长期影响提供实证基础。该数据集适用于环境流行病学研究、污染时空模式分析,并为开发高精度的空气质量预测与预警模型提供关键的训练与验证数据,有助于推动基于证据的环境健康决策与公共干预。
其他
文本
图像
本数据集是一个包含10万条记录的高质量合成数据集,模拟了大学生群体在生活方式、学业表现与心理健康方面的横断面调查。它完整收录了年龄、专业、睡眠、学习、社交媒体使用、运动、压力水平及抑郁状况等11项关键指标,且无缺失值。其生成机制模拟了现实变量间的相关性,旨在为探究心理健康影响因素、构建学业或抑郁风险的预测模型、以及进行学生群体聚类分析,提供一个安全、可控且富含洞见的标准化研究平台。
教育
文本
图像
表格
本数据集基于QS排名方法论模拟生成了2025年全球前1500所大学的排名数据。它包含了学术声誉、雇主声誉、师生比例、单位教员论文引用数、国际教职员工比例与国际学生比例共六项核心指标的量化分数,以及一个综合总分。该数据集在模拟真实排名趋势与分数分布的同时,完全独立于官方数据,确保了使用的合规性与安全性,旨在为教育研究、数据分析与机器学习项目提供一个理想、多维度的全球高等教育机构性能评估与比较平台。
教育
图像
表格
本数据集是一个专为预测维生素与矿物质缺乏疾病而构建的综合临床数据集,包含4,000份模拟患者记录。它系统整合了人口统计学信息、生活方式、膳食摄入模式、临床症状及关键的实验室检测数值等多维度特征,旨在为机器学习模型提供从风险因素到疾病诊断的完整推理样本。数据集的核心目标是支持多类疾病分类、早期风险识别与特征重要性分析,尤其适用于开发能够辅助临床鉴别诊断的实用型预测模型,并为公共卫生领域识别高危人群提
医疗
图像
表格
本数据集源自一项已发表的医学研究,包含了用于预测心力衰竭患者死亡率的关键临床记录。数据整合了12项临床与人口统计学特征,涵盖年龄、贫血、糖尿病等基本风险因素,以及射血分数、血清肌酐等核心生理指标。其目标变量记录了患者在随访期结束时的生存状态,为构建端到端的二分类预测模型提供了监督信号。本数据集旨在帮助研究者开发机器学习模型,以识别高危患者、辅助临床决策,并探究影响预后的关键因素。
医疗
图像
表格
本数据集提供了一个专家级的全球AI与数据科学就业市场全景视图,涵盖了从2020年至2026年间、跨越多个国家的5万条职位记录。它旨在支持深入的探索性数据分析,具体用途包括薪资分析与预测、技能需求分析、远程与现场招聘趋势对比,以及国家层面和时序层面的洞察。该数据集经过清洗,具有关系型、时序分析就绪的特点,非常适合初学者、专业人士和研究人员用于构建分析仪表板或个人作品集项目。
人力资源
文本
表格
图&网络
本数据集包含了于2025年收集的匿名调查数据,旨在深入探究学生群体的学业压力与心理健康状况。该调查重点关注不同年龄和教育阶段学生的压力水平、睡眠习惯以及主要的学业压力来源。数据以CSV格式呈现,每一行代表一名学生的匿名回答,每一列对应一个与学业压力频率、睡眠时长及压力成因等相关的问题,所有个人身份信息均已移除,确保隐私安全。
教育
文本
图像
表格
本数据集是一个全面的全球机场目录,收录了7859个全球机场的核心信息。每条记录代表一个独立的机场,包含其广泛用于航空、旅行和物流系统的三字IATA代码、机场全称、所在城市、州/省、国家以及精确的地理坐标。数据经过标准化处理,为整合航班时刻、航线分析、交通物流及地理空间应用提供了统一的参考基准,非常适合用于地图可视化、旅行规划或物流网络分析等任务。
交通
文本
图像
表格
该数据集整合了患者层面的人口统计学特征、生活方式习惯(如详细吸烟史)、环境暴露因素及临床健康指标等多维度信息,并包含用于标识高风险个体的二分类目标变量。其结构化数据适用于构建肺癌风险预测模型,支持从探索性分析(如风险因子关联挖掘)到机器学习分类任务(如逻辑回归、随机森林)的全流程研究,可为疾病早期筛查、风险分层及预防性医疗策略制定提供数据驱动的决策依据。
医疗
文本
图像
表格
本数据集汇集了全球194个国家和地区在2012年至2024年间每年的海洋健康指数综合评分。该指数是一项全面评估海洋生态系统健康状况的权威指标,它通过整合食物供应、清洁水域、生物多样性、海岸保护等十个关键社会与生态目标的达成情况,计算出一个0到100分的综合评分,以衡量海洋可持续地为人类提供福祉的能力。数据集已移除冗余信息,结构清晰,便于研究人员直接进行跨国比较、趋势分析和海洋保护政策的成效评估。
其他
图像
表格
图&网络
本数据集系统探讨了快餐消费习惯与多维度健康指标间的潜在关联,它通过合成但贴近现实的数据,整合了个人的饮食习惯(特别是快餐摄入频率与类型)、日常身体活动水平、睡眠质量与时长,以及血压、BMI、心理健康评分等综合健康结果。该数据适用于研究饮食行为对健康的综合影响,支持开展相关性分析、健康风险预测建模,并可为公共卫生干预策略的制定提供数据驱动的洞察,是进行营养流行病学或健康行为研究的实用基础数据。
其他
图像
表格
图&网络
该数据集系统整合了品牌、型号、生产年份、发动机规格、行驶里程、综合车况及市场价格等决定汽车价值的关键结构化属性。它专为基于回归的机器学习任务设计,非常适合用于训练线性回归、随机森林等模型进行精准的价格预测,并支持开展探索性数据分析以揭示各特征与价格间的关联。该数据集可直接应用于教学演示、学术研究,以及为二手车评估等实际场景提供数据驱动的估价基准。
交通
图像
表格
图&网络
本数据集源自额尔古纳森林-草原交错带温带草甸草原的氮磷双因子添加实验。通过设置不同氮磷处理,测定了群落地上初级生产力、叶片氮磷比、叶片磷组分及光合速率等指标,旨在探究植物在贫瘠土壤中的养分适应策略。研究重点检验了光合磷利用效率(PPUE)的提升是否源于细胞内磷在生化组分间的优化分配,并分析了以质量为基础的光合固碳速率与各磷组分的关系。数据集为解析植物磷高效利用的生理机制提供了关键实证。
农业
表格
本数据集包含300条专为机器学习回归任务设计的合成房屋记录,数据以整洁的CSV格式提供。其关键特征涵盖了综合质量、居住面积、建造年份、房间数量及地块面积等决定房产价值的核心属性。目标变量“销售价格”基于与这些特征的真实统计关联生成,模拟了市场定价逻辑。该数据集已完全清洗,无需预处理,非常适合初学者系统练习从探索性数据分析、特征工程到构建与评估线性回归、决策树等预测模型的全流程。
建筑
表格
本数据集覆盖数学分析的核心知识体系,包括极限、连续性、级数收敛、函数空间等关键内容,强调严格证明与逻辑上的完备性。其价值在于为模型提供“严谨数学语言 + 形式化证明”的高密度、结构化训练样本,旨在从根本上解决模型在理解复杂定理、构建逻辑链条与组织证明结构时面临的瓶颈问题。该资源专为高端数学推理任务及科研级 AI 训练设计,可显著提升模型在形式化推理、定理自动证明及深层数学问题求解中的能力与可靠性。
教育
文本
本数据集聚焦线性代数与抽象代数核心基础,系统涵盖矩阵理论、向量空间、线性映射、特征值与特征向量,并延伸至群、环、域等抽象结构。其核心价值在于为AI模型提供高密度、结构化的代数思维训练样本,通过严谨的形式化定义、定理证明与实例演算,着力提升模型对向量化表达、线性空间结构、抽象运算规则及同态映射的深度理解能力,为机器学习、计算机图形学、量子计算等现代科学与AI领域奠定坚实的数学基础。
教育
文本
本数据集提供了白银期货从2016年1月至2026年1月长达十年的完整每日价格序列。白银作为兼具金融投资属性与重要工业用途的关键贵金属,其价格数据是观察市场波动、进行宏观经济与商品分析的宝贵资源。此外,数据集基于提供的分析模型,包含了对2026年第一季度(1月至3月)的每日价格预测,使之成为一个融合历史回溯与前瞻性洞察的综合研究工具,适用于时间序列分析、预测模型验证与金融市场研究。
制造
图像
表格
本数据集以2024年多个国家的生活质量指标为核心,整合社会经济与环境要素,综合反映各国生活水平与整体福祉。涵盖生活质量、购买力、安全、医疗保健、生活成本及污染六大指数,从多维度呈现全球生活状况。该数据支持跨地区比较,可用于探索性分析、统计对比与可视化研究,帮助揭示不同指标间的内在联系,为学术、政策与数据科学应用提供结构化参考。
社会治理
文本
图像
表格
本数据集系统追踪了全球10个最具影响力超大城市的太阳能与风能原始资源可用性。它提供了直接影响可再生能源发电效率的逐小时大气条件快照数据,并包含一个经过定制计算的“绿色评分”,用以表征任一时刻太阳能与风能资源的综合潜力。该数据集旨在为可再生能源的时空分布研究、城市级能源系统规划,以及高能耗活动的绿色调度优化提供高分辨率、可比较的数据基础,支持与清洁能源部署相关的决策与创新。
能源
图像
表格
本数据集聚焦于薪资预测这一经典回归问题,记录了不同员工的薪资水平及其对应的工作经验、职位类别、教育背景等多项特征。该数据集是进行回归分析与机器学习入门的优质资源。其可被应用于线性回归、决策树等基础模型,或XGBoost、LightGBM等高级算法。通过此项目,不仅能掌握预测建模的完整流程,还能深入理解各特征对薪资的实际影响,提升模型可解释性分析能力。
人力资源
表格
本数据集收录了孟加拉国在2024年1月至2025年1月期间的心血管疾病风险综合评估数据,包含1,529份完整的患者记录及22项临床、生化和生活方式属性。它整合了人口统计、人体测量指标、临床读数、生化标志物及生活方式因素,并提供了“低/中/高”三级风险分类及量化风险评分。该数据集适用于开发心血管疾病风险预测的机器学习模型、开展南亚人群心血管流行病学研究以及构建临床决策支持系统。
医疗
文本
图像
表格
本数据集系统收录了2025年全球6个主要城市的空气质量数据,包含超过5.2万条记录。数据旨在量化不同城市的污染水平差异,为研究污染物暴露对呼吸系统和心血管健康的短期及长期影响提供实证基础。该数据集适用于环境流行病学研究、污染时空模式分析,并为开发高精度的空气质量预测与预警模型提供关键的训练与验证数据,有助于推动基于证据的环境健康决策与公共干预。
其他
文本
图像
本数据集是一个包含10万条记录的高质量合成数据集,模拟了大学生群体在生活方式、学业表现与心理健康方面的横断面调查。它完整收录了年龄、专业、睡眠、学习、社交媒体使用、运动、压力水平及抑郁状况等11项关键指标,且无缺失值。其生成机制模拟了现实变量间的相关性,旨在为探究心理健康影响因素、构建学业或抑郁风险的预测模型、以及进行学生群体聚类分析,提供一个安全、可控且富含洞见的标准化研究平台。
教育
文本
图像
表格
本数据集基于QS排名方法论模拟生成了2025年全球前1500所大学的排名数据。它包含了学术声誉、雇主声誉、师生比例、单位教员论文引用数、国际教职员工比例与国际学生比例共六项核心指标的量化分数,以及一个综合总分。该数据集在模拟真实排名趋势与分数分布的同时,完全独立于官方数据,确保了使用的合规性与安全性,旨在为教育研究、数据分析与机器学习项目提供一个理想、多维度的全球高等教育机构性能评估与比较平台。
教育
图像
表格
本数据集是一个专为预测维生素与矿物质缺乏疾病而构建的综合临床数据集,包含4,000份模拟患者记录。它系统整合了人口统计学信息、生活方式、膳食摄入模式、临床症状及关键的实验室检测数值等多维度特征,旨在为机器学习模型提供从风险因素到疾病诊断的完整推理样本。数据集的核心目标是支持多类疾病分类、早期风险识别与特征重要性分析,尤其适用于开发能够辅助临床鉴别诊断的实用型预测模型,并为公共卫生领域识别高危人群提
医疗
图像
表格
本数据集源自一项已发表的医学研究,包含了用于预测心力衰竭患者死亡率的关键临床记录。数据整合了12项临床与人口统计学特征,涵盖年龄、贫血、糖尿病等基本风险因素,以及射血分数、血清肌酐等核心生理指标。其目标变量记录了患者在随访期结束时的生存状态,为构建端到端的二分类预测模型提供了监督信号。本数据集旨在帮助研究者开发机器学习模型,以识别高危患者、辅助临床决策,并探究影响预后的关键因素。
医疗
图像
表格
本数据集提供了一个专家级的全球AI与数据科学就业市场全景视图,涵盖了从2020年至2026年间、跨越多个国家的5万条职位记录。它旨在支持深入的探索性数据分析,具体用途包括薪资分析与预测、技能需求分析、远程与现场招聘趋势对比,以及国家层面和时序层面的洞察。该数据集经过清洗,具有关系型、时序分析就绪的特点,非常适合初学者、专业人士和研究人员用于构建分析仪表板或个人作品集项目。
人力资源
文本
表格
图&网络
本数据集包含了于2025年收集的匿名调查数据,旨在深入探究学生群体的学业压力与心理健康状况。该调查重点关注不同年龄和教育阶段学生的压力水平、睡眠习惯以及主要的学业压力来源。数据以CSV格式呈现,每一行代表一名学生的匿名回答,每一列对应一个与学业压力频率、睡眠时长及压力成因等相关的问题,所有个人身份信息均已移除,确保隐私安全。
教育
文本
图像
表格
本数据集是一个全面的全球机场目录,收录了7859个全球机场的核心信息。每条记录代表一个独立的机场,包含其广泛用于航空、旅行和物流系统的三字IATA代码、机场全称、所在城市、州/省、国家以及精确的地理坐标。数据经过标准化处理,为整合航班时刻、航线分析、交通物流及地理空间应用提供了统一的参考基准,非常适合用于地图可视化、旅行规划或物流网络分析等任务。
交通
文本
图像
表格
该数据集整合了患者层面的人口统计学特征、生活方式习惯(如详细吸烟史)、环境暴露因素及临床健康指标等多维度信息,并包含用于标识高风险个体的二分类目标变量。其结构化数据适用于构建肺癌风险预测模型,支持从探索性分析(如风险因子关联挖掘)到机器学习分类任务(如逻辑回归、随机森林)的全流程研究,可为疾病早期筛查、风险分层及预防性医疗策略制定提供数据驱动的决策依据。
医疗
文本
图像
表格
本数据集汇集了全球194个国家和地区在2012年至2024年间每年的海洋健康指数综合评分。该指数是一项全面评估海洋生态系统健康状况的权威指标,它通过整合食物供应、清洁水域、生物多样性、海岸保护等十个关键社会与生态目标的达成情况,计算出一个0到100分的综合评分,以衡量海洋可持续地为人类提供福祉的能力。数据集已移除冗余信息,结构清晰,便于研究人员直接进行跨国比较、趋势分析和海洋保护政策的成效评估。
其他
图像
表格
图&网络
本数据集系统探讨了快餐消费习惯与多维度健康指标间的潜在关联,它通过合成但贴近现实的数据,整合了个人的饮食习惯(特别是快餐摄入频率与类型)、日常身体活动水平、睡眠质量与时长,以及血压、BMI、心理健康评分等综合健康结果。该数据适用于研究饮食行为对健康的综合影响,支持开展相关性分析、健康风险预测建模,并可为公共卫生干预策略的制定提供数据驱动的洞察,是进行营养流行病学或健康行为研究的实用基础数据。
其他
图像
表格
图&网络
该数据集系统整合了品牌、型号、生产年份、发动机规格、行驶里程、综合车况及市场价格等决定汽车价值的关键结构化属性。它专为基于回归的机器学习任务设计,非常适合用于训练线性回归、随机森林等模型进行精准的价格预测,并支持开展探索性数据分析以揭示各特征与价格间的关联。该数据集可直接应用于教学演示、学术研究,以及为二手车评估等实际场景提供数据驱动的估价基准。
交通
图像
表格
图&网络
本数据集源自额尔古纳森林-草原交错带温带草甸草原的氮磷双因子添加实验。通过设置不同氮磷处理,测定了群落地上初级生产力、叶片氮磷比、叶片磷组分及光合速率等指标,旨在探究植物在贫瘠土壤中的养分适应策略。研究重点检验了光合磷利用效率(PPUE)的提升是否源于细胞内磷在生化组分间的优化分配,并分析了以质量为基础的光合固碳速率与各磷组分的关系。数据集为解析植物磷高效利用的生理机制提供了关键实证。
农业
表格
本数据集包含300条专为机器学习回归任务设计的合成房屋记录,数据以整洁的CSV格式提供。其关键特征涵盖了综合质量、居住面积、建造年份、房间数量及地块面积等决定房产价值的核心属性。目标变量“销售价格”基于与这些特征的真实统计关联生成,模拟了市场定价逻辑。该数据集已完全清洗,无需预处理,非常适合初学者系统练习从探索性数据分析、特征工程到构建与评估线性回归、决策树等预测模型的全流程。
建筑
表格
本数据集覆盖数学分析的核心知识体系,包括极限、连续性、级数收敛、函数空间等关键内容,强调严格证明与逻辑上的完备性。其价值在于为模型提供“严谨数学语言 + 形式化证明”的高密度、结构化训练样本,旨在从根本上解决模型在理解复杂定理、构建逻辑链条与组织证明结构时面临的瓶颈问题。该资源专为高端数学推理任务及科研级 AI 训练设计,可显著提升模型在形式化推理、定理自动证明及深层数学问题求解中的能力与可靠性。
教育
文本
本数据集聚焦线性代数与抽象代数核心基础,系统涵盖矩阵理论、向量空间、线性映射、特征值与特征向量,并延伸至群、环、域等抽象结构。其核心价值在于为AI模型提供高密度、结构化的代数思维训练样本,通过严谨的形式化定义、定理证明与实例演算,着力提升模型对向量化表达、线性空间结构、抽象运算规则及同态映射的深度理解能力,为机器学习、计算机图形学、量子计算等现代科学与AI领域奠定坚实的数学基础。
教育
文本