变量类别 变量名称 数据类型 含义与说明 评论标识信息 review_id 文本型/数值型 每条评论的唯一标识符。是数据的主键,用于精确索引和去重。 user_name 文本型 发表评论的用户名称(通常为公开用户名或昵称)。可用于分析重复用户的反馈行为,但需注意隐私与匿名化处理。 评论核心内容 review_title 文本型 用户为评论撰写的简短标题。通常概括了评论的核心情绪或主要问题,是进行快速情感分类或主题提取的关键文本字段。 review_description 文本型 用户撰写的详细评论正文。包含了对应用功能、体验、问题的具体描述,是自然语言处理与深度意见挖掘的主要分析对象。 用户评价与互动 rating 数值型(有序) 用户给出的星级评分,通常为1-5星(1为最差,5为最佳)。是量化用户满意度最直接、最核心的指标。 thumbs_up 数值型(整数) 其他用户认为该条评论“有帮助”的点赞数。反映了该评论在社区中的公认价值或代表性,可用于筛选高影响力反馈。 review_date 日期时间型 评论提交的具体日期和时间。用于分析评论的时间趋势、版本发布后的反馈潮以及季节性模式。 开发者互动信息developer_response 文本型 开发者对这条评论的公开回复内容。此字段的存在与否及内容本身,是衡量开发者社区参与度和客户服务质量的关键。 developer_response_date 日期时间型 开发者回复的日期和时间。结合review_date可计算回复时效,是评估客服效率的重要指标。 评论上下文信息 appVersion 文本型 用户撰写评论时所使用的应用版本号。用于精准定位特定版本引入的Bug或用户反馈,关联问题与开发周期。 language_code 分类型 评论内容的语言代码(如en为英语)。用于按语言进行细分分析或训练多语言NLP模型。 country_code 分类型 用户提交评论时所在的国家/地区代码。用于分析不同市场的用户满意度、文化差异及本地化问题。