太阳集团城8722(中国·Macau)有限公司-Official website

精选
高数数理方程建模求解数据集

本数据集系统覆盖常微分方程与偏微分方程的经典问题与求解方法，包括分离变量法、特征值问题、傅里叶展开、格林函数等核心内容。其核心价值在于为AI模型提供从“连续系统建模”到“方程求解”的完整推理样本，重点增强模型对动力学系统的数学描述能力、解析方法选取与边界条件处理的规范性。本数据集适用于AI for Science、物理建模、工程仿真及科学推理等前沿领域的模型训练与评估。

教育

文本

79

精选
考研生物生命科学推理数据集

本数据集覆盖研究生入学考试生物学核心知识，涵盖分子生物学、细胞生物学、生物化学与遗传调控等方向。其核心价值在于为 AI 提供高密度生命科学知识与因果链推理样本，解决模型在复杂生物过程、调控网络与实验逻辑理解方面的不足，广泛应用于生命科学教育 AI 与生物智能模型训练。

教育

文本

81

精选
高中生物概念与推理数据集

本数据集覆盖高中生物核心模块，包括细胞生物学、生态学与生命活动调节等内容，设计上强调对核心概念的深入理解、对动态过程的逻辑分析以及知识体系的系统关联。其价值是为AI模型提供大量结构化生物事实与蕴含因果关系的推理样本，旨在弥补AI在理解复杂生物过程、精确区分易混淆概念以及跨章节综合推理方面的常见短板。该数据集适用于开发K12生物智能辅导模型，也能为构建更通用的生命科学认知与推理模型提供关键训练基础。

教育

文本

67

精选
高中物理竞赛高阶数据集

本数据集覆盖高中物理竞赛题目，内容深度远超普通教学，覆盖电磁学、热力学、光学及现代物理等核心领域。设计着重训练高阶物理建模、多步骤逻辑推导以及微积分等复杂数学工具的综合运用。其核心在于提供大量高难度、非标准化推理样本，旨在突破AI在长链推理、抽象建模及解决非模板化问题方面的能力上限。该数据集适用于训练高阶推理模型、科研辅助AI以及物理竞赛智能辅导系统，为AI在深层次科学推理领域的发展提供关键支持。

教育

文本

52

精选
高数微积分符号推导数据集

本数据集覆盖了函数极限、导数、积分等微积分核心内容及其应用，是数学与工程建模的基础。核心价值在于为 AI 提供大量的连续数学对象与符号推导的标准训练样本，专门用于弥补模型在连续极限理解、多步计算和严格推导方面的能力短板。通过强化AI对形式化数学语言与运算规则的理解，该数据集能有效提升数学推理的可靠性，广泛应用于数学推理模型、科学计算辅助系统及 AI for Science 基础能力训练。

教育

文本

90

精选
高数代数学规则推理数据集

该数据集涵盖多项式、方程、不等式及初等代数结构问题等核心内容，强调符号操作与逻辑变形。其核心价值在于为 AI 模型提供离散符号系统下的规则推理的大量样本，例如展示如何通过因式分解、配方或不等式缩放等方法，将复杂表达式转化为可解形式。这是使其成为提升模型数学抽象能力与形式化推理能力的重要基础，因此被广泛用于训练专用数学解题模型，并作为构建通用推理模型时不可或缺的底层数学逻辑训练组件。

教育

文本

62

新能源充换电设施运营与服务数据集

本数据集源自市级新能源充换电公共服务平台，系统整合了多家接入运营商的充电设备数据、用户充换电交易记录、以及与之关联的政府资金支持与补贴发放信息。作为全市充换电行业的统一“数据粮仓”，它不仅能实时反映充电桩的空闲/占用状态，服务于车主的找桩需求，更能为行业监管、设施规划、政策评估及运营优化提供深度的数据洞察与决策支持。

交通

图像

表格

91

数字资产运行监测与效能评估数据集

本数据集源自城市级数字资产监测平台，通过对全市政务云机房服务器流量的实时无感采集，汇聚了政务信息系统在访问量、资源使用率及网络行为等方面的核心运行数据。它不仅能动态感知系统活跃度，更能通过“僵尸系统识别”、“无主IP归集”等智能模型，为信息化资产的效能审计、财政资金节约与数据价值挖掘提供精准、客观的数据洞察与决策依据

金融

图像

表格

117

新能源充换电数据集

本数据集系统整合了城市级新能源汽车充换电服务的多源数据，涵盖充电订单详情、政府补贴发放、充电场站档案及实时能源监控信息。通过关联分析与大数据技术，它不仅服务于充电站运营优化与投资选址，更能支撑个性化充电推荐、车辆续航分析、故障预测、电网负荷调度及市场风险评估，为整个新能源汽车生态中的运营商、政府部门、车企及能源公司提供全链条的数据洞察与决策支持。

制造

图像

表格

98

中文比喻数据集

这是一个专门用于中文隐喻识别与理解研究的数据集。它通过人工标注，为自然语言处理任务提供了结构化的隐喻样本。

教育

文本

114

宝可梦集换式卡牌数据集

该数据集包含超过 20,000 张宝可梦集换式卡牌（TCG）卡牌图像。它适用于计算机视觉、图像分类、OCR、相似性搜索和卡牌识别任务

消费

图像

113

气候变化：地球表面温度数据

自1750年以来的全球温度，由伯克利地球（隶属于劳伦斯伯克利国家实验室）最新汇编的数据。整合了 16 个现有档案中的 16 亿条温度记录

其他

文本

表格

115

果蔬图像识别数据集介绍

该数据集包含各种水果和蔬菜的图像，为图像识别任务提供了多样化的集合。包含的食物包括：水果：香蕉、苹果、梨、葡萄、橙子、猕猴桃、西瓜、石榴、菠萝、芒果蔬菜：黄瓜、胡萝卜、甜椒、洋葱、土豆、柠檬、番茄、萝卜、甜菜、卷心菜、生菜、菠菜、大豆、花椰菜、甜椒、辣椒、芜菁、玉米、甜玉米、红薯、辣椒粉、墨西哥辣椒、生姜、大蒜、豌豆、茄子

农业

图像

116

安全标签新闻数据集

该数据集包含约 7,800 篇新闻文章，根据内容安全性标记为安全/不安全/敏感，特别适用于 6-12 岁儿童。它旨在帮助训练和评估模型，以识别适合年轻受众的内容。

教育

文本

表格

100

火灾，洪水，烟雾，滑坡，8k+图像数据集

一个用于深度学习灾害检测的精选多类别视觉数据集。该数据集是一个精心策划的真实灾难图像集合，旨在训练和基准测试深度学习模型，进行损害分类和灾害识别任务。

其他

图像

53

车牌数据集OCR

该数据集包含 260 万张来自 86 个国家的车辆车牌图像，为 OCR、交通分析和自动驾驶系统提供全面的资源。它专注于车牌识别和相关检测系统，提供关于车牌号码、国家、边界框标签和其他数据的详细信息，以及用于识别任务的相应掩码

交通

图像

表格

121

医院临床数据集

10,000次高保真72小时监测的真实住院数据，该数据集没有缺失值，所有行都是完全模拟的，不代表真实患者。

医疗

表格

111

小样本意图识别指令数据集

这个数据集核心目标是收集各类意图识别数据集，并将其重新组织成提示词（prompt）格式，专门用于支持大语言模型在小样本学习场景下的意图识别研究。

其他

文本

126

高中化学数据集

这是一个专门为 “高中化学垂直大模型微调” 而构建的中文问答与文本生成数据集。主要来源是三种主流教科书和常见教辅资料，包括苏教版、人教版、鲁教版等，还有化学方程式和畅销教辅如“一本涂书”、“教材帮”。

教育

文本

131

中英双语数据集

中英双语数据集为汉语学习（HSK）和机器翻译设计的中英双语平行语料库。包含超过20,000条英文句子及其对应的中文翻译。每条数据都额外标注了汉语拼音和句子核心词汇所属的HSK等级。

教育

文本

122

闭路电视事件数据集 -跌倒与躺卧检测

这是一个用于计算机视觉（CV）任务的开放源合成数据集，特别设计用于跌倒检测、姿态估计和事件监控，数据来源于顶置闭路电视视角。

社会治理

文本

图像

112

太阳集团城8722(中国·Macau)有限公司-Official website

精选 高数数理方程建模求解数据集

精选 考研生物生命科学推理数据集

精选 高中生物概念与推理数据集

精选 高中物理竞赛高阶数据集

精选 高数微积分符号推导数据集

精选 高数代数学规则推理数据集

新能源充换电设施运营与服务数据集

数字资产运行监测与效能评估数据集

新能源充换电数据集

中文比喻数据集

宝可梦集换式卡牌数据集

气候变化：地球表面温度数据

果蔬图像识别数据集介绍

安全标签新闻数据集

火灾，洪水，烟雾，滑坡，8k+图像数据集

车牌数据集OCR

医院临床数据集

小样本意图识别指令数据集

高中化学数据集

中英双语数据集

闭路电视事件数据集 -跌倒与躺卧检测

精选 高数数理方程建模求解数据集

精选 考研生物生命科学推理数据集

精选 高中生物概念与推理数据集

精选 高中物理竞赛高阶数据集

精选 高数微积分符号推导数据集

精选 高数代数学规则推理数据集

新能源充换电设施运营与服务数据集

数字资产运行监测与效能评估数据集

新能源充换电数据集

中文比喻数据集

宝可梦集换式卡牌数据集

气候变化：地球表面温度数据

果蔬图像识别数据集介绍

安全标签新闻数据集

火灾，洪水，烟雾，滑坡，8k+图像数据集

车牌数据集OCR

医院临床数据集

小样本意图识别指令数据集

高中化学数据集

中英双语数据集

闭路电视事件数据集 -跌倒与躺卧检测

精选
高数数理方程建模求解数据集

精选
考研生物生命科学推理数据集

精选
高中生物概念与推理数据集

精选
高中物理竞赛高阶数据集

精选
高数微积分符号推导数据集

精选
高数代数学规则推理数据集

精选
高数数理方程建模求解数据集

精选
考研生物生命科学推理数据集

精选
高中生物概念与推理数据集

精选
高中物理竞赛高阶数据集

精选
高数微积分符号推导数据集

精选
高数代数学规则推理数据集