2.8 KiB
2.8 KiB
Skill: Makee L1 数据导出
适用场景
导出指定时间范围内L1级别四个核心模块的用户行为数据,用于业务分析、效果评估等场景。 包含模块:
- ✅ 互动组件(L1核心互动数据)
- ✅ 课程巩固(课后练习数据)
- ✅ 单元挑战(单元测试数据)
- ✅ 单元总结(单元知识点回顾数据)
前置要求
⚠️ 每次执行前必须操作:
cd /root/.openclaw/workspace/llm_offline_production
git pull origin master
确保使用最新版本的导出脚本,避免字段不全、规则错误等问题。
操作步骤
1. 进入工作目录
cd /root/.openclaw/workspace/llm_offline_production/config_user_data_extract_and_analyze
2. 配置时间范围
编辑对应脚本开头的START_DATE和END_DATE参数,格式为YYYYMMDD,例如:
START_DATE = "20260201"
END_DATE = "20260311"
3. 执行导出脚本
| 模块 | 脚本名称 | 输出文件位置 | 说明 |
|---|---|---|---|
| 互动组件 | export_component_record.py |
output/2026/component_record_YYYYMMDD_YYYYMMDD_L1.xlsx output/2026/component_record_YYYYMMDD_YYYYMMDD_L1_stats.xlsx |
统计文件自动新增sheet:总数量≥5_筛选结果(过滤样本量≥5的组件) |
| 课程巩固 | export_lesson_review.py |
output/2026/lesson_review_data_YYYYMMDD_YYYYMMDD.xlsx output/2026/lesson_review_data_YYYYMMDD_YYYYMMDD_stat.xlsx |
统计文件自动新增sheet:L1_总记录≥5_筛选结果(过滤kp_id以1开头+总记录≥5的题目) |
| 单元挑战 | export_unit_challenge_data.py |
output/unit_challenge_data_YYYYMMDD_YYYYMMDD.xlsx output/unit_challenge_data_YYYYMMDD_YYYYMMDD_stats.xlsx |
按level+unit_id+category分组统计Perfect/Good/Oops占比 |
| 单元总结 | export_unit_summary.py |
output/unit_summary_data_YYYYMMDD_YYYYMMDD.xlsx output/unit_summary_data_YYYYMMDD_YYYYMMDD_stats.xlsx |
3个统计sheet:按知识模块聚合、按用户单元聚合、按单元聚合 |
4. 后续处理
- 导出完成后将所有文件发送给需求方
- 同步更新到对应的飞书分析文档中,链接使用在线文件链接
- 若需要写入到wiki目录,可在云盘搜索文件名后移动到对应wiki目录
筛选规则说明
| 模块 | 筛选条件 |
|---|---|
| 互动组件L1有效数据 | 总数量≥5 |
| 课程巩固L1有效数据 | kp_id以"1"开头 + 总记录数量>5 |
| 单元挑战L1数据 | level字段为"L1" |
| 单元总结L1数据 | level字段为"L1" |
注意事项
- 数据库连接配置从
.env文件读取,无需修改 - 时间范围默认使用东八区(Asia/Shanghai)
- 导出文件大小超过10MB时建议压缩后发送
- 所有脚本默认导出L1+L2全量数据,统计时会自动区分level