5.5 KiB
5.5 KiB
| name | description |
|---|---|
| audit_l1_config | Level 1 配置表(句子知识点)自动化审校技能。覆盖基础信息完整性、分类字段互换检测、题型JSON结构、单词库-答案一致性、第三人称单数语法等7项自动检查 + 4项人工审核清单。触发关键词:L1配置表审校、句子知识点审校、巩固题审校、audit l1 config |
L1 配置表审校 — 句子知识点
目标数据源
- 多维表格: 「互动知识点 - 句子」→「Level 1 配置表」
- App Token:
Nq3Zb258aae7SRs2QfXcqsQYnxJ - Table ID:
tblTxGpf6GQ5c7DZ - 字段结构: ID(7位数字化) / 基础信息(basicInfo/classificationInfo/config/usageInfo) / 8种题型JSON / 中文字段描述 / 审校结果
ID 编码规则
| 位 | 含义 | 示例 |
|---|---|---|
| 1-2 | Level + Season | 10=L1S0, 11=L1S1, 12=L1S2 |
| 3-4 | Unit | 00=U1, 01=U2, ... 14=U14 |
| 5-7 | 序列号 | 001-010 |
例: 1214001 = L1 Season2, Unit14, 序列001
文本输出规范(强制执行)
所有输出的文本内容(台词、题目、选项、解析、音频文本、阅读文章等)必须遵守以下规则:
- 禁止 Markdown 标记:禁止使用 ** * __ _ 等加粗/斜体标识,也禁止使用 # > - 等块级 Markdown 语法。所有文本纯文本输出。
- 英式拼写优先:单词涉及英美式拼写差异时(如 colour/color、centre/center、travelling/traveling),统一选择英式拼写。
- 标点符号规范:严格区分全角/半角符号。中文内容使用全角标点(,。!?),英文内容使用半角标点(. , ! ?),不得混用。
审校流程
Step 1: 运行自动审校脚本 → python3 scripts/audit_l1_config.py [app_token] [table_id] [record_id]
Step 2: 对自动检查发现的问题,确认真实性(排除误报)
Step 3: 按人工审核清单逐项检查
Step 4: 汇总结果写入 bitable「审校结果」列
自动化检查项(7项)
1. basicInfo/config/usageInfo 字段完整性
- 检查 JSON 是否包含必填字段:type, id, meaning, desc, structure, valaLevel
- 检查 id 与 record ID 是否一致
2. classificationInfo 值互换检测 ⚠️ 高频问题
- 检查
cambridgeLevel是否与列字段「剑桥考试级别」一致(应为 YLE/PET/KET 等) - 检查
cefrLevel是否与列字段「欧标等级」一致(应为 A1/A2/B1 等) - 常见问题: 两个字段值互换,如 cambridgeLevel="A1" 而 cefrLevel="YLE"
3. 题型 JSON 结构完整性
- 8种题型 JSON 是否存在,内容是否为空数组
- 每道题必含: category, skill, type, pointId, question, options, answer
- pointId 与 record ID 一致性
- answer 索引不超出 options 范围
- 发音类题型(句子朗读/跟读)豁免 options/answer 检查
4. sentenceStructureSort 单词库-答案一致性
- 按 answer 索引从单词库拼出句子
- 与 explanation 中「正确答案是 "..."」对比(去标点后)
- 常见问题: 单词库给 "need" 但正确形式应为 "needs"(三单)
5. sentenceStructureSort 第三人称单数语法
- 主语为 He/She/It/人名 时,检查动词是否有三单变形
- 特殊检查: 单词库有 "need" 但无 "needs",且主语为三单 → 报错
6. 题型覆盖率
- 确认所有8种题型字段非空且 JSON 可解析
- 缺失题型标记为 ⚠️
7. 中文字段 × JSON 字段一致性
- 中文描述列(句意选择题/句型结构题等)与对应 JSON 字段双向校验
- 一边有数据另一边为空 → 标记 ⚠️
人工审核清单(4项)
A. 填空题选项自然度
- 如 sentenceStructureClozeWordMcq 中 "put your toys" 省略 "away" 是否可接受
- 需结合 L1 级别和教学目标判断省略形式的合理性
B. 解释文本质量
- 解释是否准确、完整、易于理解
- 语法术语是否符合目标年龄段
C. 选项干扰项合理性
- 干扰项是否与正确答案有足够的区分度(不能太明显)
- 干扰项是否过于混淆(不能太接近)
D. 图片描述与题型匹配
- sentenceMeaningPic2SentMcq 的图片描述是否符合场景
- 图片是否清晰传达目标知识点
使用示例
单条记录审校
python3 scripts/audit_l1_config.py Nq3Zb258aae7SRs2QfXcqsQYnxJ tblTxGpf6GQ5c7DZ 1214001
全表扫描
python3 scripts/audit_l1_config.py
输出示例
🔍 Level 1 配置表审校 | Nq3Zb258aae7SRs2QfXcqsQYnxJ/tblTxGpf6GQ5c7DZ
目标: 1214001
=== 1214001 === 共 3 个问题
❌ classificationInfo 值互换: cambridgeLevel=A1(应为YLE), cefrLevel=YLE(应为A1)
❌ sentenceStructureSort 单词拼出 "Otis need to pack his schoolbag" ≠ 解释声明 "Otis needs to pack his schoolbag."
❌ sentenceStructureSort Otis三单主语,单词库有need无needs
审校结果写入规范
写入 bitable「审校结果」列时遵循:
- ❌ 标记真实错误(带具体定位和修正方案)
- ⚠️ 标记需确认项(带评估建议)
- ✅ 全量通过时写
✅ - 自动检查命中的问题需人工二次确认后再写入(排除误报)
常见误报场景(脚本使用者须知)
| 误报类型 | 原因 | 处理 |
|---|---|---|
| 发音类题型报缺少 options/answer | sentencePronRead/sentencePronRepeatSentence 无选项 | 脚本已豁免 |
| 单词拼出句子 ≠ 解释声明(仅标点差异) | 末尾句号差异 | 脚本已去标点后比较 |
| 句子朗读 pointId ≠ record ID | 可能是跨知识点复用 | 人工判断是否为合理复用 |