ai_member_xiaoyan/output/p4_rewrite_report.md

4.3 KiB
Raw Permalink Blame History

P4-短对话选择题 批量改写完成报告

执行概要

项目 结果
QSID 总数 9 个
改写成功 9 个
总题目数 70 题 (first: 45, second: 25)
对话结构 全部从 3 人改为 2 人(一男一女互称名字)
题型分布 人名匹配题 ~2题/套 + 内容理解题 ~3题/套
答案分布 全部满足 2-2-1 模式,无连续 3 题同选项

各 QSID 改写详情

QSID 话题 First Qs Second Qs 人名匹配 内容理解 答案分布(first/second)
021301 邻居话题 5 5 3 7 A2-B1-C2 / A2-B2-C1
021401 日常话题 5 5 2 8 A1-B2-C2 / A2-B2-C1
021501 访客话题 5 5 3 7 A1-B2-C2 / A2-B2-C1
021601 体验话题 5 0 2 3 A2-B2-C1 / —
021701 周末话题 5 0 2 3 A2-B2-C1 / —
021801 出行话题 5 5 3 7 A2-B2-C1 / A2-B2-C1
022101 活动话题 5 0 1 4 A2-B2-C1 / —
032501 工作话题 5 0 3 2 A2-B2-C1 / —
032901 日常话题 5 0 3 2 A2-B2-C1 / —

改写要点总结

1. 对话结构改造

  • 每个对话从 3 个 speaker 缩减为 2 个(一男一女)
  • 对话中嵌入名字互称:如 Ben: Hi, Lucy. ...
  • 去掉的 speaker 名字用作干扰选项

2. Speaker 配对

  • 主要配对Ben (男) + Lucy (女)
  • 其他配对Johnny (男) + Lucy (女)、Smith (男) + Lucy (女)、Otis (男) + Ben (男)
  • 干扰项Daisy, Skylar不出现在对话中的名字

3. 题目类型

  • 人名匹配题 (~2/套):问 Whose/Who选项是人名
  • 内容理解题 (~3/套):问具体内容,通过名字锚定说话者

4. 字段完整性

  • jsonDataquestion, options, answer, questionAudio, questionDesc, ability
  • 题目1/题目2完整的听力文本 + 题目 + 选项 + 能力标签 + 解析
  • ⚠️ jsonData 中 ability 和 explanation 受 bitable 自动化限制(见下方说明)

5. 关键格式要求

  • 不改考点:保留原对话核心信息和知识点
  • L1 B 级难度:语言简单清晰
  • 英文半角标点
  • 答案均匀分布:每套 5 题 A/B/C 各占 1-2 次
  • questionAudio 命名规则:{QSID}-0{i}.mp3
  • questionSetID 保持一致

⚠️ 重要发现Bitable 自动化限制

该 bitable 表有「推送到服务端」按钮/自动化(字段 type=3001会在记录更新后触发。该自动化会

  1. 将 jsonData 中所有 question 的 ability 重置为 ["听觉抓取关键信息"]
  2. 将 jsonData 中所有 question 的 explanation 清空为 ""

应对方案

  • jsonData使用自动化兼容的值ability=["听觉抓取关键信息"]explanation=""
  • 题目1/题目2:在文本中附加完整的 【能力标签】【解析】 信息
  • 每道题的题目1文本格式
    1.
    【描述】You will hear two people talking about...
    【听力文本】
    Ben: Hi, Lucy. ...
    【题目】
    Question text?
    A. Option A正确
    B. Option B
    C. Option C
    【能力标签】显性事实理解|关键词识别
    【解析】Ben说'...',明确提到...。选项A为正确答案。
    

脚本文件

文件 用途
scripts/rewrite_p4_all.py 全部改写数据定义(包含所有对话和题目)
scripts/write_p4_v2.py 写入脚本(含 verify-after-write
scripts/write_p4_safe.py 自动化安全写入脚本(最终使用版本)

Record ID 映射

QSID Record ID
021301 recvjufKJO8d0O
021401 recvjufM763ijb
021501 recvjufM76lEsW
021601 recvjufM76hNv5
021701 recvjufM76eMKs
021801 recvjufM76lRHQ
022101 recvjufM76o6of
032501 recvjufM76k4dx
032901 recvjufM76frUP

验证状态

所有 9 个 QSID 的 jsonData 可解析、字段完整 所有题目有 question, options, answer, questionAudio, questionDesc 所有 题目1/题目2 包含对话文本 + 能力标签 + 解析 答案分布全部满足均匀分布要求A/B/C 各 1-2 次/套) questionSetID 保持不变 dataStatus、题目集合 ID 字段未改动


生成时间2026-05-18 改写执行:小研 📝