本数据集包含2600条记录的合成数据,高度模拟在线外卖平台的每日订单的真实场景,完整覆盖从下单到完成的流程。其核心变量包括顾客年龄、餐厅类型、配送时长、支付方式及订单状态等。数据在高度还原现实业务逻辑的同时确保完全匿名与隐私安全。其结构规整、特征明确,适用于探索性数据分析、配送时间预测、订单状态分类及客户行为洞察,是数据科学初学者和实践者接触业务分析、时序模式挖掘与机器学习建模的理想入门材料。
消费
图像
表格
本数据集是一个适用于自然语言处理任务的高质量、已标注的新闻文章集合。它包含了超过20万篇新闻文章,每篇文章都带有标题、简短的摘要、作者、发布日期,以及多类别主题标签。数据集已经过系统的清洗与预处理,移除了重复项与缺失记录,并标准化了文本与日期格式。其规模庞大、类别多样、文本结构清晰的特点,使其成为进行多类别文本分类、主题建模、新闻摘要生成等任务的理想基准数据,尤其适合用于教育、研究和算法开发。
其他
图像
表格
本数据集收录了全球销量超10万份的电子游戏详细销售记录。数据通过爬取权威游戏销量统计网站获取,并经过清洗。每条记录包含游戏名称、发行平台、发行年份、类型等属性,并拆分了全球四大市场的销售额及全球总销售额。其时间跨度数十年,覆盖主机、掌机及PC等平台,为分析游戏市场趋势、平台竞争格局、地域偏好差异和经典游戏商业成功因素提供了全面、结构化的一手数据,是游戏产业研究、商业分析及数据可视化项目的宝贵资源。
其他
图像
表格
本数据集收录了截至最新统计时注册的超27.1万辆电动汽车的详细记录。数据覆盖车型年份自1997-2024年,不仅包含车辆制造商、型号、车型年份、电动类型、EPA续航里程等属性,更整合了车辆注册地的地理位置、所属县市、邮编及人口普查区等丰富的时空与地理信息。其完整的数据质量和独特的地理空间维度,使其成为分析区域电动汽车采用模式、评估基础设施需求、研究政策影响以及进行市场趋势预测的权威且宝贵的资源。
消费
图像
表格
本数据集收录截至2026年全球1000余个最具影响力网站的跨行业、跨区域流量与参与度快照。它融合了传统流量排名与行为层级的参与度指标(如跳出率、平均会话时长),并引入搜索兴趣指数及综合衡量用户留存与交互深度的参与度得分。数据还标注了网站的主托管国家,使其能够支撑全球视野下的数字注意力竞争格局分析、区域用户行为对比以及搜索热度与流量相关性研究。它是数字营销、用户体验与互联网趋势研究的稀缺资源。
其他
图像
表格
本数据集是一个行为模拟数据,旨在对比短时小睡与咖啡因摄入对个体警觉性、情绪及自评生产力的即时影响。数据模拟学生、职场人士与自由职业者的干预反应,包含干预前后测评分、睡眠时长及副作用等指标。基于前后测与对照设计。其可支持针对哪种策略更有效的因果推断及策略效果比较。其变量丰富、结构清晰,适用于假设检验、回归预测、分类建模及行为科学实证研究,是数据科学学习者与生产力研究者开展证据驱动分析实践的优质素材。
其他
图像
表格
本数据集涵盖2000-2025年全球主要科技公司年度劳动力数据,跨越互联网泡沫至AI爆发等完整经济周期。以“公司-年度”为单元,整合员工总数、新招聘、公开裁员、净变化、雇佣与流失率等核心人力指标,并配以营收、股价及美国宏观指标,构建微观决策与宏观周期联动分析链。数据源自官方年报及公开裁员公告,估算值已明确标注。为研究科技行业就业韧性、人才流动周期与经济冲击传导提供长时序、跨主体标准数据资产。
人力资源
图像
表格
本数据集源自矿区植被恢复对比实验,系统评估裸地、草地、杨树人工林、混交林四种类型对土壤细菌群落及生态系统功能的影响。通过16S rRNA测序获取细菌多样性、物种组成与功能预测,同步测定土壤理化性质与胞外酶活性,并基于主成分分析构建综合土壤肥力指数。数据集包含4处理×重复样本,覆盖从群落组成到生态系统功能的多层级观测指标,为揭示植被恢复下土壤微生物响应机制、指导矿区生态修复提供高价值实证数据。
其他
图像
表格
本数据集是为超市购物行为分析与关联规则挖掘实践而创建的合成数据,旨在帮助学习者掌握发现商品间关联规律的方法。数据模拟了超市的3000笔购物交易,涵盖超过11900件商品记录。其采用标准的事务清单格式,每行记录一笔交易中的一件商品及其对应顾客。该数据集可使学习者能够无缝实践从数据预处理、频繁项集挖掘到关联规则生成与评估的全套流程,是掌握Apriori等经典算法,并深入理解购物行为模式的理想入门资源。
消费
图像
表格
本数据集是一个综合性的客户参与度与流失分析数据集,包含了全球某电子商务/订阅平台上5万名客户的行为、人口统计和交易数据。它涵盖了25个不同特征,提供了客户互动与参与模式的360度全景视图,专门设计用于客户流失预测、用户细分和客户生命周期价值分析等任务。该数据集捕捉了跨网站、移动应用、电子邮件和社交媒体等多渠道的客户交互,并包含一个二元目标变量(是否流失),非常适合用于监督学习的分类任务构建与分析。
消费
图像
表格
图&网络
本数据集是一个包含3万条记录的大规模合成数据集,旨在高度模拟真实的车辆生态驾驶行为与燃油效率模式。它基于车辆远程信息处理、车载诊断及CAN总线传感器等标准数据源,生成了行程级的驾驶指标。该数据集为机器学习建模、统计分析与算法基准测试提供了可靠且易于获取的替代方案,尤其适用于环保驾驶研究、燃油消耗预测及驾驶行为分析等领域。
交通
图像
表格
本数据集收录了Google Play商店的真实用户评论,包含评论文本、星级评分、有用性投票、开发者回复及用户地域等多维度信息。每条记录完整呈现了用户反馈、情感倾向与互动数据及官方响应的互动闭环。本数据集专为自然语言处理、情感分析、用户满意度研究及产品体验优化而设计,为量化应用质量、挖掘用户痛点、评估开发者互动效果提供了高质量的文本与结构化数据基础,是进行意见挖掘与客户洞察的宝贵资源。
其他
图像
表格
本数据集聚焦于医疗健康这一经济关键领域,旨在深入剖析驱动个人保险成本的核心因素。它收录了1338位美国居民的个人健康数据,清晰展示了年龄、身体质量指数(BMI)、吸烟习惯及家庭规模等变量如何最终影响其医疗账单金额。该数据集干净、结构清晰,是初学者练习回归分析(预测具体费用数字)和进行数据可视化的理想材料,非常适合用于预测建模与影响因子分析。
医疗
文本
表格
图&网络
本数据集是一个模拟生成的个人可持续行为研究数据集,包含1400条模拟用户单日活动记录。数据涵盖交通、能源、饮食、数字消费、废弃物及环保行动六大维度,通过量化整合计算出每目的碳足迹当量及低、中、高影响等级。本数据集旨在模拟现实世界中的个人环境行为模式,为构建碳足迹预测模型、分析关键减排行为、进行环境政策模拟以及开展公众环保意识研究提供结构化的数据支撑,是环境科学与数据科学交叉研究的实用工具。
其他
图像
表格
本数据集是一个合成生成的日度面板数据集,旨在分析远程办公中员工的工作行为模式与倦怠风险、工作效率的关联。数据整合了约1800条员工单日记录,涵盖工作时长、屏幕时间、会议、休息、睡眠等客观行为指标,以及任务效率、倦怠评分与风险等级等关键结果变量。通过模拟混合办公场景,本数据集为构建倦怠风险预警模型、优化工作安排及开展人力资源分析提供了结构化仿真数据,是组织行为与健康数据科学交叉研究的实用工具。
其他
图像
表格
本数据集提供了世界卫生组织发布的全球酒精消费统计,涵盖了2000-2022年间188个国家的年度人均酒精消费量。数据以“国家-年份”的结构完整呈现,并包含了置信区间等元数据。它记录了15岁及以上人群每年消费的纯酒精升数,经过系统清洗与标准化,是分析全球及区域酒精消费长期趋势、评估公共卫生政策成效、进行跨国比较以及开展时间序列建模的理想基础数据,适用于全球健康研究、政策制定与数据科学教育等多个领域。
其他
文本
图像
表格
本数据集是一个合成数据集,旨在研究人工智能在教育领域应用的影响。数据整合了学生的人口背景、学习习惯、AI工具使用模式以及课程成绩、考试成绩等学业表现,构建了学生个体层面的完整画像。其核心目标是探究AI工具采纳的群体差异、使用强度与学习成效的关联,并识别影响学业表现的关键因素。本数据集适用于探索性分析、相关性研究、可视化及构建分类或回归预测模型,是评估教育技术与开展数据驱动教学研究的实用工具。
教育
图像
表格
图&网络
本数据集源自联合国粮农组织的官方数据,追踪了2017-2024年全球175个国家健康饮食成本的动态变化。数据以购买力平价美元为单位,提供了每日及年度健康饮食成本、蔬菜与水果成本分量等指标,并包含国家代码、区域分类及成本等级等多维信息。借此,研究者可深入分析全球食物安全、营养经济学、贫困与饮食可负担性等议题,尤其适用于评估可持续发展目标的进展,以及量化研究新冠疫情和全球通胀对食品价格的冲击效应。
其他
图像
表格
本数据集是一个合成生成的全球气候模拟数据集,提供了涵盖温度变化、温室气体排放及海平面上升等多维指标。其模拟了全球各国/地区的平均气温、CO₂排放、海平面上升、洪旱风险、降雨变异及空气质量等多维指标,并集成了综合性气候风险评分。通过高度仿真的结构化数据,其旨在支持气候变化趋势分析、极端天气风险评估、环境政策模拟以及相关机器学习预测模型的开发与教学,为理解和应对气候危机提供一个安全可控的数据分析平台。
其他
图像
表格
本数据集是一个合成生成的全球性死亡记录集合,旨在安全地模拟现实世界的死亡统计模式。其覆盖多国、多年龄段、不同性别群体,变量包括地区、年份、年龄、性别、主要死因、死亡人数及标准化死亡率。通过构建涵盖癌症、伤害、传染病等主要死因的模拟记录,为探索死因趋势、仿真公共卫生场景、进行人口统计学可视化以及训练机器学习分类与聚类模型提供了结构化、无隐私风险的数据基础,是开展流行病学与数据科学交叉研究的理想工具。
其他
图像
表格
本数据集是一个专为时间序列预测与金融分析任务设计的结构化数据集,包含近五年黄金期货市场的每日交易数据。数据除提供开盘价、最高价、最低价、收盘价及成交量等基础信息外,还集成了移动平均线、波动率、RSI、MACD及布林带等十余种预计算技术指标。其旨在为构建统计预测模型、训练深度学习网络、分析市场波动模式及评估量化策略提供高质量、可直接建模的标准化数据,是金融数据分析与机器学习的理想实践资源。
金融
图像
表格
本数据集包含2600条记录的合成数据,高度模拟在线外卖平台的每日订单的真实场景,完整覆盖从下单到完成的流程。其核心变量包括顾客年龄、餐厅类型、配送时长、支付方式及订单状态等。数据在高度还原现实业务逻辑的同时确保完全匿名与隐私安全。其结构规整、特征明确,适用于探索性数据分析、配送时间预测、订单状态分类及客户行为洞察,是数据科学初学者和实践者接触业务分析、时序模式挖掘与机器学习建模的理想入门材料。
消费
图像
表格
本数据集是一个适用于自然语言处理任务的高质量、已标注的新闻文章集合。它包含了超过20万篇新闻文章,每篇文章都带有标题、简短的摘要、作者、发布日期,以及多类别主题标签。数据集已经过系统的清洗与预处理,移除了重复项与缺失记录,并标准化了文本与日期格式。其规模庞大、类别多样、文本结构清晰的特点,使其成为进行多类别文本分类、主题建模、新闻摘要生成等任务的理想基准数据,尤其适合用于教育、研究和算法开发。
其他
图像
表格
本数据集收录了全球销量超10万份的电子游戏详细销售记录。数据通过爬取权威游戏销量统计网站获取,并经过清洗。每条记录包含游戏名称、发行平台、发行年份、类型等属性,并拆分了全球四大市场的销售额及全球总销售额。其时间跨度数十年,覆盖主机、掌机及PC等平台,为分析游戏市场趋势、平台竞争格局、地域偏好差异和经典游戏商业成功因素提供了全面、结构化的一手数据,是游戏产业研究、商业分析及数据可视化项目的宝贵资源。
其他
图像
表格
本数据集收录了截至最新统计时注册的超27.1万辆电动汽车的详细记录。数据覆盖车型年份自1997-2024年,不仅包含车辆制造商、型号、车型年份、电动类型、EPA续航里程等属性,更整合了车辆注册地的地理位置、所属县市、邮编及人口普查区等丰富的时空与地理信息。其完整的数据质量和独特的地理空间维度,使其成为分析区域电动汽车采用模式、评估基础设施需求、研究政策影响以及进行市场趋势预测的权威且宝贵的资源。
消费
图像
表格
本数据集收录截至2026年全球1000余个最具影响力网站的跨行业、跨区域流量与参与度快照。它融合了传统流量排名与行为层级的参与度指标(如跳出率、平均会话时长),并引入搜索兴趣指数及综合衡量用户留存与交互深度的参与度得分。数据还标注了网站的主托管国家,使其能够支撑全球视野下的数字注意力竞争格局分析、区域用户行为对比以及搜索热度与流量相关性研究。它是数字营销、用户体验与互联网趋势研究的稀缺资源。
其他
图像
表格
本数据集是一个行为模拟数据,旨在对比短时小睡与咖啡因摄入对个体警觉性、情绪及自评生产力的即时影响。数据模拟学生、职场人士与自由职业者的干预反应,包含干预前后测评分、睡眠时长及副作用等指标。基于前后测与对照设计。其可支持针对哪种策略更有效的因果推断及策略效果比较。其变量丰富、结构清晰,适用于假设检验、回归预测、分类建模及行为科学实证研究,是数据科学学习者与生产力研究者开展证据驱动分析实践的优质素材。
其他
图像
表格
本数据集涵盖2000-2025年全球主要科技公司年度劳动力数据,跨越互联网泡沫至AI爆发等完整经济周期。以“公司-年度”为单元,整合员工总数、新招聘、公开裁员、净变化、雇佣与流失率等核心人力指标,并配以营收、股价及美国宏观指标,构建微观决策与宏观周期联动分析链。数据源自官方年报及公开裁员公告,估算值已明确标注。为研究科技行业就业韧性、人才流动周期与经济冲击传导提供长时序、跨主体标准数据资产。
人力资源
图像
表格
本数据集源自矿区植被恢复对比实验,系统评估裸地、草地、杨树人工林、混交林四种类型对土壤细菌群落及生态系统功能的影响。通过16S rRNA测序获取细菌多样性、物种组成与功能预测,同步测定土壤理化性质与胞外酶活性,并基于主成分分析构建综合土壤肥力指数。数据集包含4处理×重复样本,覆盖从群落组成到生态系统功能的多层级观测指标,为揭示植被恢复下土壤微生物响应机制、指导矿区生态修复提供高价值实证数据。
其他
图像
表格
本数据集是为超市购物行为分析与关联规则挖掘实践而创建的合成数据,旨在帮助学习者掌握发现商品间关联规律的方法。数据模拟了超市的3000笔购物交易,涵盖超过11900件商品记录。其采用标准的事务清单格式,每行记录一笔交易中的一件商品及其对应顾客。该数据集可使学习者能够无缝实践从数据预处理、频繁项集挖掘到关联规则生成与评估的全套流程,是掌握Apriori等经典算法,并深入理解购物行为模式的理想入门资源。
消费
图像
表格
本数据集是一个综合性的客户参与度与流失分析数据集,包含了全球某电子商务/订阅平台上5万名客户的行为、人口统计和交易数据。它涵盖了25个不同特征,提供了客户互动与参与模式的360度全景视图,专门设计用于客户流失预测、用户细分和客户生命周期价值分析等任务。该数据集捕捉了跨网站、移动应用、电子邮件和社交媒体等多渠道的客户交互,并包含一个二元目标变量(是否流失),非常适合用于监督学习的分类任务构建与分析。
消费
图像
表格
图&网络
本数据集是一个包含3万条记录的大规模合成数据集,旨在高度模拟真实的车辆生态驾驶行为与燃油效率模式。它基于车辆远程信息处理、车载诊断及CAN总线传感器等标准数据源,生成了行程级的驾驶指标。该数据集为机器学习建模、统计分析与算法基准测试提供了可靠且易于获取的替代方案,尤其适用于环保驾驶研究、燃油消耗预测及驾驶行为分析等领域。
交通
图像
表格
本数据集收录了Google Play商店的真实用户评论,包含评论文本、星级评分、有用性投票、开发者回复及用户地域等多维度信息。每条记录完整呈现了用户反馈、情感倾向与互动数据及官方响应的互动闭环。本数据集专为自然语言处理、情感分析、用户满意度研究及产品体验优化而设计,为量化应用质量、挖掘用户痛点、评估开发者互动效果提供了高质量的文本与结构化数据基础,是进行意见挖掘与客户洞察的宝贵资源。
其他
图像
表格
本数据集聚焦于医疗健康这一经济关键领域,旨在深入剖析驱动个人保险成本的核心因素。它收录了1338位美国居民的个人健康数据,清晰展示了年龄、身体质量指数(BMI)、吸烟习惯及家庭规模等变量如何最终影响其医疗账单金额。该数据集干净、结构清晰,是初学者练习回归分析(预测具体费用数字)和进行数据可视化的理想材料,非常适合用于预测建模与影响因子分析。
医疗
文本
表格
图&网络
本数据集是一个模拟生成的个人可持续行为研究数据集,包含1400条模拟用户单日活动记录。数据涵盖交通、能源、饮食、数字消费、废弃物及环保行动六大维度,通过量化整合计算出每目的碳足迹当量及低、中、高影响等级。本数据集旨在模拟现实世界中的个人环境行为模式,为构建碳足迹预测模型、分析关键减排行为、进行环境政策模拟以及开展公众环保意识研究提供结构化的数据支撑,是环境科学与数据科学交叉研究的实用工具。
其他
图像
表格
本数据集是一个合成生成的日度面板数据集,旨在分析远程办公中员工的工作行为模式与倦怠风险、工作效率的关联。数据整合了约1800条员工单日记录,涵盖工作时长、屏幕时间、会议、休息、睡眠等客观行为指标,以及任务效率、倦怠评分与风险等级等关键结果变量。通过模拟混合办公场景,本数据集为构建倦怠风险预警模型、优化工作安排及开展人力资源分析提供了结构化仿真数据,是组织行为与健康数据科学交叉研究的实用工具。
其他
图像
表格
本数据集提供了世界卫生组织发布的全球酒精消费统计,涵盖了2000-2022年间188个国家的年度人均酒精消费量。数据以“国家-年份”的结构完整呈现,并包含了置信区间等元数据。它记录了15岁及以上人群每年消费的纯酒精升数,经过系统清洗与标准化,是分析全球及区域酒精消费长期趋势、评估公共卫生政策成效、进行跨国比较以及开展时间序列建模的理想基础数据,适用于全球健康研究、政策制定与数据科学教育等多个领域。
其他
文本
图像
表格
本数据集是一个合成数据集,旨在研究人工智能在教育领域应用的影响。数据整合了学生的人口背景、学习习惯、AI工具使用模式以及课程成绩、考试成绩等学业表现,构建了学生个体层面的完整画像。其核心目标是探究AI工具采纳的群体差异、使用强度与学习成效的关联,并识别影响学业表现的关键因素。本数据集适用于探索性分析、相关性研究、可视化及构建分类或回归预测模型,是评估教育技术与开展数据驱动教学研究的实用工具。
教育
图像
表格
图&网络
本数据集源自联合国粮农组织的官方数据,追踪了2017-2024年全球175个国家健康饮食成本的动态变化。数据以购买力平价美元为单位,提供了每日及年度健康饮食成本、蔬菜与水果成本分量等指标,并包含国家代码、区域分类及成本等级等多维信息。借此,研究者可深入分析全球食物安全、营养经济学、贫困与饮食可负担性等议题,尤其适用于评估可持续发展目标的进展,以及量化研究新冠疫情和全球通胀对食品价格的冲击效应。
其他
图像
表格
本数据集是一个合成生成的全球气候模拟数据集,提供了涵盖温度变化、温室气体排放及海平面上升等多维指标。其模拟了全球各国/地区的平均气温、CO₂排放、海平面上升、洪旱风险、降雨变异及空气质量等多维指标,并集成了综合性气候风险评分。通过高度仿真的结构化数据,其旨在支持气候变化趋势分析、极端天气风险评估、环境政策模拟以及相关机器学习预测模型的开发与教学,为理解和应对气候危机提供一个安全可控的数据分析平台。
其他
图像
表格
本数据集是一个合成生成的全球性死亡记录集合,旨在安全地模拟现实世界的死亡统计模式。其覆盖多国、多年龄段、不同性别群体,变量包括地区、年份、年龄、性别、主要死因、死亡人数及标准化死亡率。通过构建涵盖癌症、伤害、传染病等主要死因的模拟记录,为探索死因趋势、仿真公共卫生场景、进行人口统计学可视化以及训练机器学习分类与聚类模型提供了结构化、无隐私风险的数据基础,是开展流行病学与数据科学交叉研究的理想工具。
其他
图像
表格
本数据集是一个专为时间序列预测与金融分析任务设计的结构化数据集,包含近五年黄金期货市场的每日交易数据。数据除提供开盘价、最高价、最低价、收盘价及成交量等基础信息外,还集成了移动平均线、波动率、RSI、MACD及布林带等十余种预计算技术指标。其旨在为构建统计预测模型、训练深度学习网络、分析市场波动模式及评估量化策略提供高质量、可直接建模的标准化数据,是金融数据分析与机器学习的理想实践资源。
金融
图像
表格