变量名 数据类型 说明 Age 数值型 个体的年龄(单位:岁)。是评估长期健康风险的关键人口统计学因素。 Gender 字符型/分类型 个体的性别(如 Male, Female, Other)。用于分析不同性别群体在恢复过程和长期症状上的潜在差异。 COVID_Severity 分类型/有序型 初始感染COVID-19的严重程度等级(例如:Asymptomatic, Mild, Moderate, Severe)。这是分析长期影响的核心分层变量和关键预测因子。 Hospitalized 布尔型/分类型 表示该个体在急性感染期是否曾住院治疗(通常是 Yes/No)。是衡量疾病初始冲击和医疗干预程度的重要指标。 Days_to_Recovery 数值型 从感染开始到自我报告的主要急性症状基本消失所经历的天数。用于衡量初始疾病的持续时间和恢复速度。 Fatigue_Level 数值型/有序型 康复后持续疲劳感的严重程度评分(例如,1-10分制或类似等级)。是“长期新冠”最普遍和核心的症状之一。 Breathing_Issue 布尔型/分类型 表示康复后是否仍存在呼吸相关问题或气短(Yes/No)。主要反映呼吸系统可能遭受的长期影响。 Brain_Fog 布尔型/分类型 表示康复后是否经历认知功能障碍,如注意力不集中、记忆力下降或思维模糊(Yes/No)。反映神经认知方面的长期症状。 Loss_of_Taste_Smell 布尔型/分类型 表示康复后是否仍存在味觉或嗅觉的丧失或异常(Yes/No)。是COVID-19相关的一个特异性较强的长期症状指标。 Physical_Activity_Level 数值型/有序型 个体当前或康复后的日常身体活动水平评估(例如,1-5级,从久坐到非常活跃)。作为重要的生活方式协变量,可能影响恢复轨迹。 Mental_Health_Impact 数值型/有序型 评估COVID-19感染及康复过程对个体心理健康造成的影响程度(例如,1-10分制,分数越高表示负面影响越大)。涵盖焦虑、抑郁等心理后遗症。 Long_COVID_Risk 分类型/有序型 目标变量。根据上述症状及特征综合判定的“长期新冠”风险等级(例如:Low, Medium, High)。此变量为衍生变量,用于分类预测模型的构建与验证。