本数据集涵盖Cu-Ni-Co-Si、Cu-Fe-P、Cu-Cr-Zr等多个合金体系数据,按照成分配比、生产工艺、材料性能、微观结构的全链路关联主线,结构化收录了化学成分、工艺参数、显微组织特征及力学与物理性能等关键维度,有效解决了该领域实验数据分散、整合成本高的痛点,可为机器学习与材料计算提供高质量、即用型的数据集,直接支撑合金设计、性能预测与工艺优化等AI研发场景。
制造
文本
本数据集精选大学阶段普通物理经典习题,系统覆盖力学、热学、电磁学、振动与波、光学等内容,是高中物理向理论物理与工程物理过渡的关键桥梁。其核心价值在于提供“物理建模 → 数学表达 → 定量求解 → 物理意义解释”的完整推理样本,弥补模型在高于中学、低于专业理论物理层级的物理理解断层。典型应用于 AI 物理解题、科学推理模型训练、AI for Science 基础能力构建以及物理教育智能系统。
教育
文本
本数据集系统覆盖高中物理的力学、电磁学、热学与光学等核心模块,其题目设计强调物理建模、定量计算与物理意义分析。核心价值在于为AI提供大量从实际情境抽象为数学模型,再经数学推导求解的完整样本,专门针对模型在理解物理概念本质、判断公式适用条件及执行严谨多步计算等方面的短板进行训练。该数据集适用于开发专用物理解题模型、构建智能AI物理教辅系统,以及对通用大模型进行物理世界建模与科学推理能力的专项增强。
教育
文本
这不仅仅是一个数据集;它是一个鲜活的、不断发展的项目,在健康、营养和可持续发展领域有着切实的应用。无论您对营养、供应链还是食品对环境的影响感兴趣,您都有能力做出改变。
消费
文本
本数据集系统收录高中阶段数学核心题型,覆盖函数、数列、立体几何、解析几何、概率统计等高频与难点内容,完整体现高中数学的知识结构与解题逻辑。其核心价值在于为大模型提供结构化、层次清晰的基础数学推理样本,解决模型在基础数学理解、符号运算、逻辑推导与规范解题表达方面能力不足的问题。典型应用场景包括智能题库生成、AI 数学辅导、教育大模型预训练与对齐,以及通用推理模型的基础数学能力增强。
教育
文本
本数据集是一个完全合成的仿真数据集,旨在模拟影响软件开发人员工作压力水平的多种现实因素。通过整合工作时长、睡眠时间、代码缺陷、项目截止日期等10个关键特征,数据集构建了符合真实逻辑的压力模型,目标变量为0-100的连续压力评分。其价值在于模拟了特征间的非线性交互效应,准确反映了压力形成的复杂机制,适用于进行压力预测建模、特征重要性分析与交互研究,也是机器学习处理非线性与混合类型数据的优质教学案例。
其他
图像
表格
本数据集为研究新冠长期健康影响的合成数据集,聚焦于模拟不同严重程度感染者在康复后面对的长期健康挑战,核心指标包括疲劳、呼吸问题、心理健康与恢复时长。它整合了人口统计学信息、感染严重度、住院史、生活习惯及衍生的长期新冠风险等级,构建了从急性感染到后遗症的完整分析链条。该数据集在保护隐私的前提下模拟真实世界模式,适用于探索性数据分析、风险分类预测建模以及公共卫生与临床医学领域的教学研究。
其他
图像
表格
本数据集是一个使用Python完全合成生成的个人消费记录模拟数据集,包含1000余条记录,高度模拟现实世界个人财务行为。其字段覆盖消费日期、金额、消费类别及支付方式等。数据通过受控随机化方法生成,在确保高度现实性的同时实现了完全匿名化处理与隐私安全保证。该数据集结构清晰、主题明确,旨在为探索性数据分析、消费模式可视化、预算管理洞察及构建消费预测机器学习模型提供一个理想且无风险的研究与练习平台。
消费
图像
表格
本数据集包含10000条记录的合成数据,旨在分析数字生活习惯与生理因素对眼部健康的影响。它通过模拟真实行为模式,构建眼健康综合评分指标,整合了屏幕使用参数、户外活动、基础生理与心理状态等特征。数据聚焦于量化屏幕时间、亮度等数字生活变量,和年龄、户外光照等因素如何共同作用于视觉健康。其结构完整、特征清晰,适用于回归预测、相关性分析与特征重要性研究,为健康科技与行为分析领域提供高质量模拟数据资源。
其他
图像
表格
本数据集收录了某电商企业2022-2024年超3500笔的交易记录。数据涵盖电子产品、配件和办公用品三大核心品类并细分为北东南西四个主要销售区域。每条记录不仅包含销售额与数量,还有每笔交易产生的净利润,使分析超越收入层面,深入透视不同产品、区域及时间维度的真实盈利能力和成本结构。其旨在通过多维度分析,揭示驱动利润的关键因素与潜在运营问题,为企业的定价策略、库存管理和区域资源调配提供坚实的数据支持。
消费
图像
表格
本数据集系统记录了从2022年1月至2024年12月为期三年的电商平台交易明细数据。它涵盖了订单时间、产品类别与名称、销售区域、销售数量、销售额及利润等核心业务维度,形成了一个可用于深入分析销售动态、产品表现与区域业绩的完整数据基础。该数据集旨在支持多角度的时间序列趋势预测、产品组合效益评估、区域市场策略制定以及整体财务表现分析,为电商运营决策提供数据驱动的洞察。
消费
图像
表格
本数据集是一个包含10万条记录的合成零售数据集,全面模拟易腐商品从采购、存储到销售或报废的全链路管理。数据覆盖10个商品品类,时间跨度两年,并包含多家门店与供应商信息。它整合了产品详情、存储环境、需求模式、损耗风险及财务结果等42个特征变量,完整刻画影响易腐品利润与浪费的核心因素。它专为构建损耗预测、智能补货、需求预测及动态定价优化模型而设计,是零售运营分析与供应链数据科学的综合性实践平台。
消费
图像
表格
本数据集提供了一个覆盖2010至2025年、80多个国家及多元行业的合成职位数据库,旨在填补追踪人工智能对就业长期影响的全球数据空白。它包含5000条记录,每条均整合了AI采用信号、技能需求、薪资动态、自动化风险及行业成熟度等多维指标。该数据集基于真实市场趋势模拟生成,为研究人员分析AI职位增长时序、量化技能薪资溢价、评估岗位替代风险以及进行技能聚类,提供了一个全面、安全且结构化的研究与实践平台。
人力资源
图像
表格
本数据集是一个广泛应用于推荐系统研究和实践的基准数据集,收录了海量用户对电影的显式评分记录。其核心数据包括用户ID、电影ID、评分值及时间戳,构建了标准的“用户-物品”交互矩阵。该数据集清晰体现了用户偏好稀疏性、评分分布偏差及时序效应等核心挑战。其旨在为开发和评估协同过滤、矩阵分解、深度学习推荐等算法提供一个标准化、可复现的实验平台,是推荐系统入门学习与前沿算法研究的理想数据资源。
其他
图像
表格
本数据集用于量化分析粉底液产品的色号多样性及包容性。它采集自美国、尼日利亚、日本与印度市场的头部品牌,通过提取官方色板的十六进制颜色值,并转换为CIE Lab明度值,将色彩转化为可量化数据。数据包含8个预设分组,除地区畅销榜外,特别设置了由BIPOC创始人创立的品牌组别,以探究创始人背景对色彩包容性的影响。该数据集为美妆行业的多样性研究、产品设计与社会文化分析提供了结构化支持。
其他
图像
表格
本数据集提供了1901-2016年所有诺贝尔奖得主的完整、结构化的记录。它收录了在化学、文学、生理学或医学等六大领域的获奖者信息。每条记录包含获奖年份、类别和获奖者姓名等基础信息,以及获奖年龄、性别、国别、所属机构和获奖原因等多维数据。该数据集为分析科学与社会领域中的获奖趋势、地理分布、机构贡献、多样性变迁以及学科演变提供了独一无二的数据基础,是历史研究、科学社会学分析与数据科学教学的宝贵资源。
教育
图像
表格
本数据源自2.5亿参数神经网络血液检测分析平台,汇总了2025-2026年间覆盖10个国家、共264.4万份血液检测分析。每条记录代表一个国家在某个月的宏观健康快照,包含8类疾病/风险状态的流行率、5级风险分层分布以及平台使用量指标。数据完全匿名且仅发布国家级汇总统计。其为全球流行病学对比、疾病风险预测建模、医学大语言模型微调及公共卫生教育提供了稀缺的、高质量的真实世界基准资源。
医疗
表格
图&网络
本数据集是一个整合了全球权威监测机构记录的、覆盖长达两百年的5.0级以上大地震的综合性目录。数据结合了早期历史档案与现代仪器记录,收录了每次地震事件的发生时间、经纬度坐标、震级、深度、定位误差等参数。它旨在为分析全球地震活动的长期时空演变规律、识别地震危险区、研究震级-深度关系以及评估历史数据的完整性提供一套干净、结构化且跨时代可比的数据基础,是地球物理学、灾害风险评估及数据可视化领域的宝贵资源。
其他
图像
表格
本数据集是一个覆盖全球12个城市2014-2024年的逐日气象观测数据合集。其包含了每日的平均温度、相对湿度、降雨量及风速等核心气象要素,形成了长期、连续且标准化的高质量时间序列。其价值在于为研究者与分析师提供了一个可立即用于分析全球气候模式、城市热岛效应、极端天气事件频率以及长期气候变化趋势的基准数据集。本数据集适用于探索性数据分析、时间序列预测建模、跨区域气候对比研究以及相关的机器学习项目。
其他
图像
表格
本数据集收录了NASA“每日天文图说”项目超30年的11186条完整元数据。每条记录包含精选天文图片或视频的高质量链接、专业天文学家撰写的详细科学解释、标题及发布日期等信息。数据集融合了科学视觉内容与专业文本描述,不仅覆盖了深空天体、太阳系与太空任务等主题,更因其权威的来源、超长的时间跨度与标准化的结构,成为进行天文教育、科学传播研究、自然语言处理以及多模态计算机视觉模型训练的独特而珍贵的资源。
制造
图像
表格
图&网络
本数据集是一个融合了家庭日用电量与对应天气观测指标的时间序列数据集,时间跨度为四年。用电量数据太阳集团城8722自家庭用电量数据集,天气特征取自官方气象数据。数据集以日为观测单元,每条记录整合了当天的用电总量与多项关键气象变量,清晰地构建了天气条件与能源消耗之间的关联框架。该数据集结构规整、时间连续,为时间序列回归、能源需求预测、特征工程探索以及经典机器学习模型评估而设计,是研究气候敏感型能源需求的理想资源。
能源
图像
表格
本数据集涵盖Cu-Ni-Co-Si、Cu-Fe-P、Cu-Cr-Zr等多个合金体系数据,按照成分配比、生产工艺、材料性能、微观结构的全链路关联主线,结构化收录了化学成分、工艺参数、显微组织特征及力学与物理性能等关键维度,有效解决了该领域实验数据分散、整合成本高的痛点,可为机器学习与材料计算提供高质量、即用型的数据集,直接支撑合金设计、性能预测与工艺优化等AI研发场景。
制造
文本
本数据集精选大学阶段普通物理经典习题,系统覆盖力学、热学、电磁学、振动与波、光学等内容,是高中物理向理论物理与工程物理过渡的关键桥梁。其核心价值在于提供“物理建模 → 数学表达 → 定量求解 → 物理意义解释”的完整推理样本,弥补模型在高于中学、低于专业理论物理层级的物理理解断层。典型应用于 AI 物理解题、科学推理模型训练、AI for Science 基础能力构建以及物理教育智能系统。
教育
文本
本数据集系统覆盖高中物理的力学、电磁学、热学与光学等核心模块,其题目设计强调物理建模、定量计算与物理意义分析。核心价值在于为AI提供大量从实际情境抽象为数学模型,再经数学推导求解的完整样本,专门针对模型在理解物理概念本质、判断公式适用条件及执行严谨多步计算等方面的短板进行训练。该数据集适用于开发专用物理解题模型、构建智能AI物理教辅系统,以及对通用大模型进行物理世界建模与科学推理能力的专项增强。
教育
文本
这不仅仅是一个数据集;它是一个鲜活的、不断发展的项目,在健康、营养和可持续发展领域有着切实的应用。无论您对营养、供应链还是食品对环境的影响感兴趣,您都有能力做出改变。
消费
文本
本数据集系统收录高中阶段数学核心题型,覆盖函数、数列、立体几何、解析几何、概率统计等高频与难点内容,完整体现高中数学的知识结构与解题逻辑。其核心价值在于为大模型提供结构化、层次清晰的基础数学推理样本,解决模型在基础数学理解、符号运算、逻辑推导与规范解题表达方面能力不足的问题。典型应用场景包括智能题库生成、AI 数学辅导、教育大模型预训练与对齐,以及通用推理模型的基础数学能力增强。
教育
文本
本数据集是一个完全合成的仿真数据集,旨在模拟影响软件开发人员工作压力水平的多种现实因素。通过整合工作时长、睡眠时间、代码缺陷、项目截止日期等10个关键特征,数据集构建了符合真实逻辑的压力模型,目标变量为0-100的连续压力评分。其价值在于模拟了特征间的非线性交互效应,准确反映了压力形成的复杂机制,适用于进行压力预测建模、特征重要性分析与交互研究,也是机器学习处理非线性与混合类型数据的优质教学案例。
其他
图像
表格
本数据集为研究新冠长期健康影响的合成数据集,聚焦于模拟不同严重程度感染者在康复后面对的长期健康挑战,核心指标包括疲劳、呼吸问题、心理健康与恢复时长。它整合了人口统计学信息、感染严重度、住院史、生活习惯及衍生的长期新冠风险等级,构建了从急性感染到后遗症的完整分析链条。该数据集在保护隐私的前提下模拟真实世界模式,适用于探索性数据分析、风险分类预测建模以及公共卫生与临床医学领域的教学研究。
其他
图像
表格
本数据集是一个使用Python完全合成生成的个人消费记录模拟数据集,包含1000余条记录,高度模拟现实世界个人财务行为。其字段覆盖消费日期、金额、消费类别及支付方式等。数据通过受控随机化方法生成,在确保高度现实性的同时实现了完全匿名化处理与隐私安全保证。该数据集结构清晰、主题明确,旨在为探索性数据分析、消费模式可视化、预算管理洞察及构建消费预测机器学习模型提供一个理想且无风险的研究与练习平台。
消费
图像
表格
本数据集包含10000条记录的合成数据,旨在分析数字生活习惯与生理因素对眼部健康的影响。它通过模拟真实行为模式,构建眼健康综合评分指标,整合了屏幕使用参数、户外活动、基础生理与心理状态等特征。数据聚焦于量化屏幕时间、亮度等数字生活变量,和年龄、户外光照等因素如何共同作用于视觉健康。其结构完整、特征清晰,适用于回归预测、相关性分析与特征重要性研究,为健康科技与行为分析领域提供高质量模拟数据资源。
其他
图像
表格
本数据集收录了某电商企业2022-2024年超3500笔的交易记录。数据涵盖电子产品、配件和办公用品三大核心品类并细分为北东南西四个主要销售区域。每条记录不仅包含销售额与数量,还有每笔交易产生的净利润,使分析超越收入层面,深入透视不同产品、区域及时间维度的真实盈利能力和成本结构。其旨在通过多维度分析,揭示驱动利润的关键因素与潜在运营问题,为企业的定价策略、库存管理和区域资源调配提供坚实的数据支持。
消费
图像
表格
本数据集系统记录了从2022年1月至2024年12月为期三年的电商平台交易明细数据。它涵盖了订单时间、产品类别与名称、销售区域、销售数量、销售额及利润等核心业务维度,形成了一个可用于深入分析销售动态、产品表现与区域业绩的完整数据基础。该数据集旨在支持多角度的时间序列趋势预测、产品组合效益评估、区域市场策略制定以及整体财务表现分析,为电商运营决策提供数据驱动的洞察。
消费
图像
表格
本数据集是一个包含10万条记录的合成零售数据集,全面模拟易腐商品从采购、存储到销售或报废的全链路管理。数据覆盖10个商品品类,时间跨度两年,并包含多家门店与供应商信息。它整合了产品详情、存储环境、需求模式、损耗风险及财务结果等42个特征变量,完整刻画影响易腐品利润与浪费的核心因素。它专为构建损耗预测、智能补货、需求预测及动态定价优化模型而设计,是零售运营分析与供应链数据科学的综合性实践平台。
消费
图像
表格
本数据集提供了一个覆盖2010至2025年、80多个国家及多元行业的合成职位数据库,旨在填补追踪人工智能对就业长期影响的全球数据空白。它包含5000条记录,每条均整合了AI采用信号、技能需求、薪资动态、自动化风险及行业成熟度等多维指标。该数据集基于真实市场趋势模拟生成,为研究人员分析AI职位增长时序、量化技能薪资溢价、评估岗位替代风险以及进行技能聚类,提供了一个全面、安全且结构化的研究与实践平台。
人力资源
图像
表格
本数据集是一个广泛应用于推荐系统研究和实践的基准数据集,收录了海量用户对电影的显式评分记录。其核心数据包括用户ID、电影ID、评分值及时间戳,构建了标准的“用户-物品”交互矩阵。该数据集清晰体现了用户偏好稀疏性、评分分布偏差及时序效应等核心挑战。其旨在为开发和评估协同过滤、矩阵分解、深度学习推荐等算法提供一个标准化、可复现的实验平台,是推荐系统入门学习与前沿算法研究的理想数据资源。
其他
图像
表格
本数据集用于量化分析粉底液产品的色号多样性及包容性。它采集自美国、尼日利亚、日本与印度市场的头部品牌,通过提取官方色板的十六进制颜色值,并转换为CIE Lab明度值,将色彩转化为可量化数据。数据包含8个预设分组,除地区畅销榜外,特别设置了由BIPOC创始人创立的品牌组别,以探究创始人背景对色彩包容性的影响。该数据集为美妆行业的多样性研究、产品设计与社会文化分析提供了结构化支持。
其他
图像
表格
本数据集提供了1901-2016年所有诺贝尔奖得主的完整、结构化的记录。它收录了在化学、文学、生理学或医学等六大领域的获奖者信息。每条记录包含获奖年份、类别和获奖者姓名等基础信息,以及获奖年龄、性别、国别、所属机构和获奖原因等多维数据。该数据集为分析科学与社会领域中的获奖趋势、地理分布、机构贡献、多样性变迁以及学科演变提供了独一无二的数据基础,是历史研究、科学社会学分析与数据科学教学的宝贵资源。
教育
图像
表格
本数据源自2.5亿参数神经网络血液检测分析平台,汇总了2025-2026年间覆盖10个国家、共264.4万份血液检测分析。每条记录代表一个国家在某个月的宏观健康快照,包含8类疾病/风险状态的流行率、5级风险分层分布以及平台使用量指标。数据完全匿名且仅发布国家级汇总统计。其为全球流行病学对比、疾病风险预测建模、医学大语言模型微调及公共卫生教育提供了稀缺的、高质量的真实世界基准资源。
医疗
表格
图&网络
本数据集是一个整合了全球权威监测机构记录的、覆盖长达两百年的5.0级以上大地震的综合性目录。数据结合了早期历史档案与现代仪器记录,收录了每次地震事件的发生时间、经纬度坐标、震级、深度、定位误差等参数。它旨在为分析全球地震活动的长期时空演变规律、识别地震危险区、研究震级-深度关系以及评估历史数据的完整性提供一套干净、结构化且跨时代可比的数据基础,是地球物理学、灾害风险评估及数据可视化领域的宝贵资源。
其他
图像
表格
本数据集是一个覆盖全球12个城市2014-2024年的逐日气象观测数据合集。其包含了每日的平均温度、相对湿度、降雨量及风速等核心气象要素,形成了长期、连续且标准化的高质量时间序列。其价值在于为研究者与分析师提供了一个可立即用于分析全球气候模式、城市热岛效应、极端天气事件频率以及长期气候变化趋势的基准数据集。本数据集适用于探索性数据分析、时间序列预测建模、跨区域气候对比研究以及相关的机器学习项目。
其他
图像
表格
本数据集收录了NASA“每日天文图说”项目超30年的11186条完整元数据。每条记录包含精选天文图片或视频的高质量链接、专业天文学家撰写的详细科学解释、标题及发布日期等信息。数据集融合了科学视觉内容与专业文本描述,不仅覆盖了深空天体、太阳系与太空任务等主题,更因其权威的来源、超长的时间跨度与标准化的结构,成为进行天文教育、科学传播研究、自然语言处理以及多模态计算机视觉模型训练的独特而珍贵的资源。
制造
图像
表格
图&网络
本数据集是一个融合了家庭日用电量与对应天气观测指标的时间序列数据集,时间跨度为四年。用电量数据太阳集团城8722自家庭用电量数据集,天气特征取自官方气象数据。数据集以日为观测单元,每条记录整合了当天的用电总量与多项关键气象变量,清晰地构建了天气条件与能源消耗之间的关联框架。该数据集结构规整、时间连续,为时间序列回归、能源需求预测、特征工程探索以及经典机器学习模型评估而设计,是研究气候敏感型能源需求的理想资源。
能源
图像
表格