变量类别 变量名称(模式) 数据类型 含义与说明 标识变量 id 数值型/文本型 样本的唯一标识符。 核心形态特征 radius_mean texture_mean perimeter_mean area_mean smoothness_mean 数值型(连续) 10个核心细胞核特征的均值,分别描述了细胞核的大小、纹理、 compactness_mean 形状复杂度、轮廓不规则性、对称性和分形维数,是反映细胞 concavity_mean 平均状态的主要指标。 concave points_mean symmetry_mean fractal_dimension_mean 特征变异指标 radius_se texture_se 数值型(连续) 上述10个特征的标准误,量化了细胞核群体内该特征的异质性或离散程度,通常与恶性程度相关。 fractal_dimension_se 极端表现指标 radius_worst texture_worst 数值型(连续) 上述10个特征的最值(通常指三个最大值的均值),反映了样本中表现最异常的细胞核的状态,对识别恶性肿瘤非常关键。 fractal_dimension_worst 目标变量 diagnosis 二元分类型 肿瘤诊断结果,取值为 M(恶性,Malignant) 或 B(良性,Benign)。是本数据集所有预测模型的核心目标变量。