本数据集旨在明确红斑鳞屑性皮肤病的具体类型,为该类疾病的鉴别诊断提供数据支持。红斑鳞屑性皮肤病鉴别诊断是皮肤科临床难题,此类疾病均以红斑、鳞屑为核心临床特征,差异极小。包括银屑病等 6 类病症。数据集包含 12 项临床特征与 22 项组织病理学特征数据,为红斑鳞屑性皮肤病的鉴别提供支持。
医疗
表格
该数据集聚焦神经营销领域,用于探究消费者对品牌广告的情绪反应。数据集基于 58 名 18-70 岁受试者构建,通过可穿戴设备采集 PPG、EDA 等生理信号,同步记录观看广告时的面部表情,结合量表与问卷收集情绪评估及人口统计学信息。实验所用 35 支广告涵盖三大类别,为相关研究提供精准数据支撑。
消费
文本
表格
该数据集是一个高质量、高度结构化的医疗数据集,旨在通过机器学习模型预测心力衰竭患者的死亡率。该数据集具有很强的科学性和可靠性,是进行医疗数据分析和机器学习建模的绝佳入门和研究资源。
医疗
文本
数据集是一个高质量、高度结构化的时间序列数据集,记录了法国从 2020 年 1 月至 2025 年 11 月期间每小时的可再生能源(风能和太阳能)发电量。它不仅包含了原始的发电数据,还经过了精心的特征工程,添加了丰富的时间维度特征,使其非常适合用于能源预测、模式分析和机器学习等多种应用场景。
能源
文本
国际象棋对局数据集包含 20,058 局职业 / 业余玩家对局过程中走法、胜负方、评分、开局详情等数据,覆盖对局全生命周期信息,适用于棋类 AI、模式识别与数据挖掘任务。
教育
文本
这是一份用于心脏病早期预测的医疗数据集,包含 14 个临床与生活方式特征,适用于评估个体心脏病风险的临床与生活方式信息。
医疗
文本
该高光谱成像数据集包含 D1、D2 两个子库,共 2000 幅图像(室内外各 500),覆盖 400–1000 nm 与 400–1700 nm 波段,覆盖了丰富的室内外场景。数据采用 h5 格式存储,并提供了对应的合成 RGB 参考图像,适用于各类高光谱图像处理与分析的研究。
其他
图像
该数据集核心聚焦 “学术表现影响因素”,以学术 - 行为 - 生活方式 - 环境等多维度变量构建完整分析框架,适用于教育教学管理优化,训练考试分数预测模型训练等场景。
教育
文本
销售模拟数据集是一个为模拟客户购买行为而人工生成的数据集。该数据集包含客户人口统计特征、购买详情、忠诚度计划参与情况以及交易结果的详细信息,非常适用于客户行为分析、忠诚度计划评估和购买模式预测,可用于客户分群、销售预测、营销策略优化等业务场景。
消费
表格
本数据集提供国家尺度的历史数据,涵盖二氧化碳排放量、温室气体、人口、国内生产总值(GDP)及温度相关指标。时间跨度覆盖1750 年至近年,适用于长期趋势分析、政策研究及气候模型构建。
能源
文本
智能题库数据集,全量含 1100 万道习题数据,其中 570 万道为深度结构化精品数据,可支撑 K12 同步练习、升学备考、专题强化等场景,适配教育平台 API 对接与 AI 个性化学习服务,为教与学效率提升、学情分析决策及教育产品数据化升级提供核心数据支撑,推动优质习题数据标准化普惠
教育
文本
图像
数据集覆盖了环境科学中的五个核心领域(每类都有大量样本): 气候变化与大气科学 生态系统与生物多样性保护 水资源与水环境 土壤与与土地使用管理 可再生能源与环境管理
其他
文本
用简介 (introduction) + metadata(title / author / publisher) 训练模型生成小说简介、封面 blurb、短推荐语等。
教育
文本
一个中文文本分类/翻译任务 数据集,主要包含约 98 万条中文句子对,结构简单,适合做现代文本翻译成文言文、文本风格转换或语言学习相关任务
教育
文本
本数据集面向火灾安全与应急监测场景,聚焦火焰、烟雾及人员三类关键目标的联合检测问题。通过对复杂真实场景中火情与人员分布的精细标注,可有效提升智能视觉系统在火灾早期预警、人员受困识别与风险评估中的准确性与实用性。数据集适用于智慧消防、工业安全监控、无人机巡检及应急救援辅助决策等典型应用场景,为构建高可靠性安全感知模型提供高质量数据支撑。
其他
图像
该数据集源于一个旨在降低高等教育辍学率和学业失败率的研究项目,数据来源葡萄牙一所高等教育机构,整合自多个离散数据库。。其核心目标是利用学生入学时即可获取的数据,构建预测模型,在学术生涯的早期阶段识别出“高风险”学生。这样,学校就可以有针对性地实施辅导、经济援助或心理支持等策略,从而提高整体毕业率。
教育
文本
表格
BitcoinHeist数据集是一个高质量、具有挑战性且极具实用价值的区块链安全数据集。 它的核心价值在于将复杂的比特币交易行为转化为可量化的图拓扑特征,为利用机器学习技术打击加密货币相关的金融犯罪提供了强大的数据基础。任何基于此数据集的研究都必须重点关注其时间序列特性和类别不平衡问题,以确保模型评估结果的可靠性和泛化能力。
其他
文本
时序
表格
高清AI图片真人写真集,古代生活坐卧行走,包含汉服各种设计元素和应用灵感,是丰富设计经验和汉服制作的生动样本。
其他
图像
专业准确的人物关系数据信息,所有信息均由本人校验,由此把各行业信任汇集在一个平台上,最终实现任何人都是“数字熟人”
其他
文本
这是一个专门为训练和评估能够进行多轮对话的AI聊天机器人而设计的高质量对话数据集。它包含了用户与AI之间模拟真实世界聊天模式的对话,覆盖了从问候、问答到情感交流、技术咨询等55种以上的对话意图。
其他
文本
表格
这是一个精心策划的高质量人脸图像数据集,专为现代人工智能应用设计。该数据集提供了多样化的人脸图像集合,涵盖不同年龄、性别、种族和表情特征,为计算机视觉和深度学习研究提供了优质的训练素材。
其他
图像
本数据集旨在明确红斑鳞屑性皮肤病的具体类型,为该类疾病的鉴别诊断提供数据支持。红斑鳞屑性皮肤病鉴别诊断是皮肤科临床难题,此类疾病均以红斑、鳞屑为核心临床特征,差异极小。包括银屑病等 6 类病症。数据集包含 12 项临床特征与 22 项组织病理学特征数据,为红斑鳞屑性皮肤病的鉴别提供支持。
医疗
表格
该数据集聚焦神经营销领域,用于探究消费者对品牌广告的情绪反应。数据集基于 58 名 18-70 岁受试者构建,通过可穿戴设备采集 PPG、EDA 等生理信号,同步记录观看广告时的面部表情,结合量表与问卷收集情绪评估及人口统计学信息。实验所用 35 支广告涵盖三大类别,为相关研究提供精准数据支撑。
消费
文本
表格
该数据集是一个高质量、高度结构化的医疗数据集,旨在通过机器学习模型预测心力衰竭患者的死亡率。该数据集具有很强的科学性和可靠性,是进行医疗数据分析和机器学习建模的绝佳入门和研究资源。
医疗
文本
数据集是一个高质量、高度结构化的时间序列数据集,记录了法国从 2020 年 1 月至 2025 年 11 月期间每小时的可再生能源(风能和太阳能)发电量。它不仅包含了原始的发电数据,还经过了精心的特征工程,添加了丰富的时间维度特征,使其非常适合用于能源预测、模式分析和机器学习等多种应用场景。
能源
文本
国际象棋对局数据集包含 20,058 局职业 / 业余玩家对局过程中走法、胜负方、评分、开局详情等数据,覆盖对局全生命周期信息,适用于棋类 AI、模式识别与数据挖掘任务。
教育
文本
这是一份用于心脏病早期预测的医疗数据集,包含 14 个临床与生活方式特征,适用于评估个体心脏病风险的临床与生活方式信息。
医疗
文本
该高光谱成像数据集包含 D1、D2 两个子库,共 2000 幅图像(室内外各 500),覆盖 400–1000 nm 与 400–1700 nm 波段,覆盖了丰富的室内外场景。数据采用 h5 格式存储,并提供了对应的合成 RGB 参考图像,适用于各类高光谱图像处理与分析的研究。
其他
图像
该数据集核心聚焦 “学术表现影响因素”,以学术 - 行为 - 生活方式 - 环境等多维度变量构建完整分析框架,适用于教育教学管理优化,训练考试分数预测模型训练等场景。
教育
文本
销售模拟数据集是一个为模拟客户购买行为而人工生成的数据集。该数据集包含客户人口统计特征、购买详情、忠诚度计划参与情况以及交易结果的详细信息,非常适用于客户行为分析、忠诚度计划评估和购买模式预测,可用于客户分群、销售预测、营销策略优化等业务场景。
消费
表格
本数据集提供国家尺度的历史数据,涵盖二氧化碳排放量、温室气体、人口、国内生产总值(GDP)及温度相关指标。时间跨度覆盖1750 年至近年,适用于长期趋势分析、政策研究及气候模型构建。
能源
文本
智能题库数据集,全量含 1100 万道习题数据,其中 570 万道为深度结构化精品数据,可支撑 K12 同步练习、升学备考、专题强化等场景,适配教育平台 API 对接与 AI 个性化学习服务,为教与学效率提升、学情分析决策及教育产品数据化升级提供核心数据支撑,推动优质习题数据标准化普惠
教育
文本
图像
数据集覆盖了环境科学中的五个核心领域(每类都有大量样本): 气候变化与大气科学 生态系统与生物多样性保护 水资源与水环境 土壤与与土地使用管理 可再生能源与环境管理
其他
文本
用简介 (introduction) + metadata(title / author / publisher) 训练模型生成小说简介、封面 blurb、短推荐语等。
教育
文本
一个中文文本分类/翻译任务 数据集,主要包含约 98 万条中文句子对,结构简单,适合做现代文本翻译成文言文、文本风格转换或语言学习相关任务
教育
文本
本数据集面向火灾安全与应急监测场景,聚焦火焰、烟雾及人员三类关键目标的联合检测问题。通过对复杂真实场景中火情与人员分布的精细标注,可有效提升智能视觉系统在火灾早期预警、人员受困识别与风险评估中的准确性与实用性。数据集适用于智慧消防、工业安全监控、无人机巡检及应急救援辅助决策等典型应用场景,为构建高可靠性安全感知模型提供高质量数据支撑。
其他
图像
该数据集源于一个旨在降低高等教育辍学率和学业失败率的研究项目,数据来源葡萄牙一所高等教育机构,整合自多个离散数据库。。其核心目标是利用学生入学时即可获取的数据,构建预测模型,在学术生涯的早期阶段识别出“高风险”学生。这样,学校就可以有针对性地实施辅导、经济援助或心理支持等策略,从而提高整体毕业率。
教育
文本
表格
BitcoinHeist数据集是一个高质量、具有挑战性且极具实用价值的区块链安全数据集。 它的核心价值在于将复杂的比特币交易行为转化为可量化的图拓扑特征,为利用机器学习技术打击加密货币相关的金融犯罪提供了强大的数据基础。任何基于此数据集的研究都必须重点关注其时间序列特性和类别不平衡问题,以确保模型评估结果的可靠性和泛化能力。
其他
文本
时序
表格
高清AI图片真人写真集,古代生活坐卧行走,包含汉服各种设计元素和应用灵感,是丰富设计经验和汉服制作的生动样本。
其他
图像
专业准确的人物关系数据信息,所有信息均由本人校验,由此把各行业信任汇集在一个平台上,最终实现任何人都是“数字熟人”
其他
文本
这是一个专门为训练和评估能够进行多轮对话的AI聊天机器人而设计的高质量对话数据集。它包含了用户与AI之间模拟真实世界聊天模式的对话,覆盖了从问候、问答到情感交流、技术咨询等55种以上的对话意图。
其他
文本
表格
这是一个精心策划的高质量人脸图像数据集,专为现代人工智能应用设计。该数据集提供了多样化的人脸图像集合,涵盖不同年龄、性别、种族和表情特征,为计算机视觉和深度学习研究提供了优质的训练素材。
其他
图像