ai_member_xiaoyan/skills/audit_l1_config/SKILL.md

5.5 KiB
Raw Blame History

name description
audit_l1_config Level 1 配置表句子知识点自动化审校技能。覆盖基础信息完整性、分类字段互换检测、题型JSON结构、单词库-答案一致性、第三人称单数语法等7项自动检查 + 4项人工审核清单。触发关键词L1配置表审校、句子知识点审校、巩固题审校、audit l1 config

L1 配置表审校 — 句子知识点

目标数据源

  • 多维表格: 「互动知识点 - 句子」→「Level 1 配置表」
  • App Token: Nq3Zb258aae7SRs2QfXcqsQYnxJ
  • Table ID: tblTxGpf6GQ5c7DZ
  • 字段结构: ID(7位数字化) / 基础信息(basicInfo/classificationInfo/config/usageInfo) / 8种题型JSON / 中文字段描述 / 审校结果

ID 编码规则

含义 示例
1-2 Level + Season 10=L1S0, 11=L1S1, 12=L1S2
3-4 Unit 00=U1, 01=U2, ... 14=U14
5-7 序列号 001-010

例: 1214001 = L1 Season2, Unit14, 序列001

文本输出规范(强制执行)

所有输出的文本内容(台词、题目、选项、解析、音频文本、阅读文章等)必须遵守以下规则:

  1. 禁止 Markdown 标记:禁止使用 ** * __ _ 等加粗/斜体标识,也禁止使用 # > - 等块级 Markdown 语法。所有文本纯文本输出。
  2. 英式拼写优先:单词涉及英美式拼写差异时(如 colour/color、centre/center、travelling/traveling统一选择英式拼写。
  3. 标点符号规范:严格区分全角/半角符号。中文内容使用全角标点(,。!?),英文内容使用半角标点(. , ! ?),不得混用。

审校流程

Step 1: 运行自动审校脚本 → python3 scripts/audit_l1_config.py [app_token] [table_id] [record_id]
Step 2: 对自动检查发现的问题,确认真实性(排除误报)
Step 3: 按人工审核清单逐项检查
Step 4: 汇总结果写入 bitable「审校结果」列

自动化检查项7项

1. basicInfo/config/usageInfo 字段完整性

  • 检查 JSON 是否包含必填字段type, id, meaning, desc, structure, valaLevel
  • 检查 id 与 record ID 是否一致

2. classificationInfo 值互换检测 ⚠️ 高频问题

  • 检查 cambridgeLevel 是否与列字段「剑桥考试级别」一致(应为 YLE/PET/KET 等)
  • 检查 cefrLevel 是否与列字段「欧标等级」一致(应为 A1/A2/B1 等)
  • 常见问题: 两个字段值互换,如 cambridgeLevel="A1" 而 cefrLevel="YLE"

3. 题型 JSON 结构完整性

  • 8种题型 JSON 是否存在,内容是否为空数组
  • 每道题必含: category, skill, type, pointId, question, options, answer
  • pointId 与 record ID 一致性
  • answer 索引不超出 options 范围
  • 发音类题型(句子朗读/跟读)豁免 options/answer 检查

4. sentenceStructureSort 单词库-答案一致性

  • 按 answer 索引从单词库拼出句子
  • 与 explanation 中「正确答案是 "..."」对比(去标点后)
  • 常见问题: 单词库给 "need" 但正确形式应为 "needs"(三单)

5. sentenceStructureSort 第三人称单数语法

  • 主语为 He/She/It/人名 时,检查动词是否有三单变形
  • 特殊检查: 单词库有 "need" 但无 "needs",且主语为三单 → 报错

6. 题型覆盖率

  • 确认所有8种题型字段非空且 JSON 可解析
  • 缺失题型标记为 ⚠️

7. 中文字段 × JSON 字段一致性

  • 中文描述列(句意选择题/句型结构题等)与对应 JSON 字段双向校验
  • 一边有数据另一边为空 → 标记 ⚠️

人工审核清单4项

A. 填空题选项自然度

  • 如 sentenceStructureClozeWordMcq 中 "put your toys" 省略 "away" 是否可接受
  • 需结合 L1 级别和教学目标判断省略形式的合理性

B. 解释文本质量

  • 解释是否准确、完整、易于理解
  • 语法术语是否符合目标年龄段

C. 选项干扰项合理性

  • 干扰项是否与正确答案有足够的区分度(不能太明显)
  • 干扰项是否过于混淆(不能太接近)

D. 图片描述与题型匹配

  • sentenceMeaningPic2SentMcq 的图片描述是否符合场景
  • 图片是否清晰传达目标知识点

使用示例

单条记录审校

python3 scripts/audit_l1_config.py Nq3Zb258aae7SRs2QfXcqsQYnxJ tblTxGpf6GQ5c7DZ 1214001

全表扫描

python3 scripts/audit_l1_config.py

输出示例

🔍 Level 1 配置表审校 | Nq3Zb258aae7SRs2QfXcqsQYnxJ/tblTxGpf6GQ5c7DZ
   目标: 1214001

=== 1214001 === 共 3 个问题
  ❌ classificationInfo 值互换: cambridgeLevel=A1(应为YLE), cefrLevel=YLE(应为A1)
  ❌ sentenceStructureSort 单词拼出 "Otis need to pack his schoolbag" ≠ 解释声明 "Otis needs to pack his schoolbag."
  ❌ sentenceStructureSort Otis三单主语单词库有need无needs

审校结果写入规范

写入 bitable「审校结果」列时遵循

  1. 标记真实错误(带具体定位和修正方案)
  2. ⚠️ 标记需确认项(带评估建议)
  3. 全量通过时写
  4. 自动检查命中的问题需人工二次确认后再写入(排除误报)

常见误报场景(脚本使用者须知)

误报类型 原因 处理
发音类题型报缺少 options/answer sentencePronRead/sentencePronRepeatSentence 无选项 脚本已豁免
单词拼出句子 ≠ 解释声明(仅标点差异) 末尾句号差异 脚本已去标点后比较
句子朗读 pointId ≠ record ID 可能是跨知识点复用 人工判断是否为合理复用