# Skill: Makee L1 数据导出
## 适用场景
导出指定时间范围内L1级别四个核心模块的用户行为数据,用于业务分析、效果评估等场景。
包含模块:
- ✅ 互动组件(L1核心互动数据)
- ✅ 课程巩固(课后练习数据)
- ✅ 单元挑战(单元测试数据)
- ✅ 单元总结(单元知识点回顾数据)
## 前置要求
⚠️ **每次执行前必须操作**:
```bash
cd /root/.openclaw/workspace/llm_offline_production
git pull origin master
```
确保使用最新版本的导出脚本,避免字段不全、规则错误等问题。
## 操作步骤
### 1. 进入工作目录
```bash
cd /root/.openclaw/workspace/llm_offline_production/config_user_data_extract_and_analyze
```
### 2. 配置时间范围
编辑对应脚本开头的`START_DATE`和`END_DATE`参数,格式为`YYYYMMDD`,例如:
```python
START_DATE = "20260201"
END_DATE = "20260311"
```
### 3. 执行导出脚本
| 模块 | 脚本名称 | 输出文件位置 | 说明 |
|------|----------|--------------|------|
| 互动组件 | `export_component_record.py` | `output/2026/component_record_YYYYMMDD_YYYYMMDD_L1.xlsx`
`output/2026/component_record_YYYYMMDD_YYYYMMDD_L1_stats.xlsx` | 统计文件自动新增sheet:`总数量≥5_筛选结果`(过滤样本量≥5的组件) |
| 课程巩固 | `export_lesson_review.py` | `output/2026/lesson_review_data_YYYYMMDD_YYYYMMDD.xlsx`
`output/2026/lesson_review_data_YYYYMMDD_YYYYMMDD_stat.xlsx` | 统计文件自动新增sheet:`L1_总记录≥5_筛选结果`(过滤kp_id以1开头+总记录≥5的题目) |
| 单元挑战 | `export_unit_challenge_data.py` | `output/unit_challenge_data_YYYYMMDD_YYYYMMDD.xlsx`
`output/unit_challenge_data_YYYYMMDD_YYYYMMDD_stats.xlsx` | 按level+unit_id+category分组统计Perfect/Good/Oops占比 |
| 单元总结 | `export_unit_summary.py` | `output/unit_summary_data_YYYYMMDD_YYYYMMDD.xlsx`
`output/unit_summary_data_YYYYMMDD_YYYYMMDD_stats.xlsx` | 3个统计sheet:按知识模块聚合、按用户单元聚合、按单元聚合 |
### 4. 后续处理
1. 导出完成后将所有文件发送给需求方
2. 同步更新到对应的飞书分析文档中,链接使用在线文件链接
3. 若需要写入到wiki目录,可在云盘搜索文件名后移动到对应wiki目录
## 筛选规则说明
| 模块 | 筛选条件 |
|------|----------|
| 互动组件L1有效数据 | 总数量≥5 |
| 课程巩固L1有效数据 | kp_id以"1"开头 + 总记录数量>5 |
| 单元挑战L1数据 | level字段为"L1" |
| 单元总结L1数据 | level字段为"L1" |
## 注意事项
1. 数据库连接配置从`.env`文件读取,无需修改
2. 时间范围默认使用东八区(Asia/Shanghai)
3. 导出文件大小超过10MB时建议压缩后发送
4. 所有脚本默认导出L1+L2全量数据,统计时会自动区分level