yui_for_Cris/makee_vala/数据处理/L1数据导出操作手册.md
2026-03-12 08:00:10 +08:00

2.8 KiB
Raw Permalink Blame History

Skill: Makee L1 数据导出

适用场景

导出指定时间范围内L1级别四个核心模块的用户行为数据用于业务分析、效果评估等场景。 包含模块:

  • 互动组件L1核心互动数据
  • 课程巩固(课后练习数据)
  • 单元挑战(单元测试数据)
  • 单元总结(单元知识点回顾数据)

前置要求

⚠️ 每次执行前必须操作

cd /root/.openclaw/workspace/llm_offline_production
git pull origin master

确保使用最新版本的导出脚本,避免字段不全、规则错误等问题。

操作步骤

1. 进入工作目录

cd /root/.openclaw/workspace/llm_offline_production/config_user_data_extract_and_analyze

2. 配置时间范围

编辑对应脚本开头的START_DATEEND_DATE参数,格式为YYYYMMDD,例如:

START_DATE = "20260201"
END_DATE = "20260311"

3. 执行导出脚本

模块 脚本名称 输出文件位置 说明
互动组件 export_component_record.py output/2026/component_record_YYYYMMDD_YYYYMMDD_L1.xlsx
output/2026/component_record_YYYYMMDD_YYYYMMDD_L1_stats.xlsx
统计文件自动新增sheet总数量≥5_筛选结果过滤样本量≥5的组件
课程巩固 export_lesson_review.py output/2026/lesson_review_data_YYYYMMDD_YYYYMMDD.xlsx
output/2026/lesson_review_data_YYYYMMDD_YYYYMMDD_stat.xlsx
统计文件自动新增sheetL1_总记录≥5_筛选结果过滤kp_id以1开头+总记录≥5的题目
单元挑战 export_unit_challenge_data.py output/unit_challenge_data_YYYYMMDD_YYYYMMDD.xlsx
output/unit_challenge_data_YYYYMMDD_YYYYMMDD_stats.xlsx
按level+unit_id+category分组统计Perfect/Good/Oops占比
单元总结 export_unit_summary.py output/unit_summary_data_YYYYMMDD_YYYYMMDD.xlsx
output/unit_summary_data_YYYYMMDD_YYYYMMDD_stats.xlsx
3个统计sheet按知识模块聚合、按用户单元聚合、按单元聚合

4. 后续处理

  1. 导出完成后将所有文件发送给需求方
  2. 同步更新到对应的飞书分析文档中,链接使用在线文件链接
  3. 若需要写入到wiki目录可在云盘搜索文件名后移动到对应wiki目录

筛选规则说明

模块 筛选条件
互动组件L1有效数据 总数量≥5
课程巩固L1有效数据 kp_id以"1"开头 + 总记录数量>5
单元挑战L1数据 level字段为"L1"
单元总结L1数据 level字段为"L1"

注意事项

  1. 数据库连接配置从.env文件读取,无需修改
  2. 时间范围默认使用东八区Asia/Shanghai
  3. 导出文件大小超过10MB时建议压缩后发送
  4. 所有脚本默认导出L1+L2全量数据统计时会自动区分level