变量类别 变量名称 数据类型 含义与说明 时间标识 Year 数值型(整数) 死亡事件发生的年份。是分析死亡率长期趋势、年度变化以及评估特定事件(如疫情、政策)影响的核心时间维度。 地理信息 Country 分类型 死亡事件发生的国家或地区。用于分析死亡模式与公共卫生状况的地域性差异,并进行跨国比较研究。 人口统计学信息 Gender 分类型 死者的生理性别(通常为男/女)。这是分析死亡风险与疾病负担性别差异的关键变量,许多疾病的发病率和死亡率存在显著的性别差异。 Age_Group 有序分类型 死者所属的年龄组(如“0-14”、“15-44”、“45-64”、“65+”)。年龄是影响死亡风险的最强相关因素之一,此变量用于揭示死亡原因的年龄分布模式,是构建人口金字塔和计算年龄别死亡率的基础。 医学与结局信息 Cause_of_Death 分类型 记录的主要根本死因(如“心血管疾病”、“肺癌”、“交通事故”)。这是数据集的核心分析对象或预测目标,用于研究疾病谱构成、识别主要公共卫生问题。 Number_of_Deaths 数值型(整数) 在给定维度组合下(如某国某年某年龄组的特定死因)的死亡人数。是进行绝对数量统计和计算比率的基础。 Mortality_Rate_per_1000 数值型(连续) 按给定维度计算的死亡率(通常为每千人口)。这是一个经过标准化的关键公共卫生指标,它消除了不同群体人口基数差异的影响,使得在不同国家、年龄组或性别之间比较死亡风险成为可能。