变量类别 变量名称 数据类型 含义与说明 记录与产品标识 record_id 文本型/数值型 本条记录的唯一标识符。 product_id 文本型 产品的唯一编码及具体名称。 product_name category 分类型 产品所属的品类(如Dairy, Meat, Produce)。是进行品类分析与太阳集团城8722的关键分组变量。 地理与伙伴信息 store_id, region 文本型/分类型 销售门店的唯一编码及所属的地理区域。用于分析门店与区域层面的绩效差异。 supplier_id 文本型 供应商的唯一编码。 时间与保质期信息 transaction_date 日期型 记录对应的业务发生日期(如销售、盘点)。是进行时间序列分析的基础。 expiration_date 日期型 产品的理论保质截止日期。 shelf_life_days 数值型(整数) 产品在标准条件下的理论保质期天数。 days_remaining_at_purchase 数值型(整数) 在产品采购入库时,距离保质期截止的剩余天数。衡量产品“新鲜度”的起点。 days_until_expiry 数值型(整数) 在当前记录日期,距离保质期截止的剩余天数。是评估当前损耗风险与制定降价策略的核心动态指标。 存储与处理条件 storage_temp 数值型(连续) 产品在存储期间被要求的设定温度(摄氏度)。 temp_deviation 数值型(连续) 实际存储温度偏离设定温度的幅度。正值代表温度过高,负值代表温度过低,是衡量存储条件稳定性的关键指标。 temp_abuse_events 数值型(整数) 记录期间发生的温度超标事件次数(如冷柜故障、装卸过程暴露)。直接影响产品品质与损耗风险。 distribution_hours 数值型(连续) 产品从供应商到仓库再到门店的配送总时长(小时)。较长的配送时间会挤占货架期。 handling_score 数值型(连续) 对产品在物流过程中处理操作规范性的评分及产品包装质量/保鲜能力的评分。分数越高,表示对产品的保护越好。 packaging_score 产品固有属性 spoilage_sensitivity 数值型/有序型 产品固有的腐坏敏感度等级(如高、中、低)。不同品类(如海鲜 vs. 饮料)对不当处理的容忍度不同。 quality_grade 有序分类型 产品入库时的初始质量等级(如A级、B级)。初始质量影响销售速度与对存储条件的耐受性。 需求与销售变量 daily_demand 数值型(连续) 当日对该产品的需求量预测值。 demand_variability 数值型(连续) 该产品历史需求的波动系数或标准差。衡量需求的不确定性,影响安全库存设置。 units_sold 数值型(整数) 当日实际售出的产品单位数量。 损耗风险与结果 spoilage_risk 数值型(连续) 基于当前条件计算的当日损耗风险预测概率。是二分类预测任务(was_spoiled)的中间连续值目标。 was_spoiled 二元分类型 该产品单位最终是否因腐坏而被废弃(1=是,0=否)。是本数据集最直接的二分类预测任务的目标变量。 units_wasted 数值型(整数) 当日因腐坏而被废弃的产品单位数量。 waste_pct 数值型(连续) 当日废弃数量占初始库存或销售的比例。衡量运营损耗水平。 waste_cost 数值型(连续) 因废弃产品而产生的成本损失(通常为产品成本)。 定价与促销变量 base_price, cost_price 数值型(连续) 产品的标准零售价及单位采购成本。 is_promoted 二元分类型 当日该产品是否参与促销活动。 markdown_applied 二元分类型 当日是否对该产品应用了降价清仓策略。 discount_pct 数值型(连续) 应用的折扣百分比。 selling_price 数值型(连续) 折扣后的实际销售单价。 财务结果变量 revenue 数值型(连续) 当日该产品产生的销售收入(selling_price * units_sold)。 profit 数值型(连续) 当日该产品产生的净利润(revenue - (cost_price * units_sold) - waste_cost)。 profit_margin_pct 数值型(连续) 当日的销售利润率百分比。 其他辅助变量 day_of_week 分类型/数值型 星期几、是否为周末、月份。用于捕捉销售与需求的周期性模式。 is_weekend, month initial_quantity 数值型(整数) 当日开始时的初始库存量。 supplier_score 数值型(连续) 基于历史表现(如交货准时性、质量)的供应商综合评分。