4.3 KiB
4.3 KiB
P4-短对话选择题 批量改写完成报告
执行概要
| 项目 | 结果 |
|---|---|
| QSID 总数 | 9 个 |
| 改写成功 | 9 个 ✅ |
| 总题目数 | 70 题 (first: 45, second: 25) |
| 对话结构 | 全部从 3 人改为 2 人(一男一女互称名字) |
| 题型分布 | 人名匹配题 ~2题/套 + 内容理解题 ~3题/套 |
| 答案分布 | 全部满足 2-2-1 模式,无连续 3 题同选项 |
各 QSID 改写详情
| QSID | 话题 | First Qs | Second Qs | 人名匹配 | 内容理解 | 答案分布(first/second) |
|---|---|---|---|---|---|---|
| 021301 | 邻居话题 | 5 | 5 | 3 | 7 | A2-B1-C2 / A2-B2-C1 |
| 021401 | 日常话题 | 5 | 5 | 2 | 8 | A1-B2-C2 / A2-B2-C1 |
| 021501 | 访客话题 | 5 | 5 | 3 | 7 | A1-B2-C2 / A2-B2-C1 |
| 021601 | 体验话题 | 5 | 0 | 2 | 3 | A2-B2-C1 / — |
| 021701 | 周末话题 | 5 | 0 | 2 | 3 | A2-B2-C1 / — |
| 021801 | 出行话题 | 5 | 5 | 3 | 7 | A2-B2-C1 / A2-B2-C1 |
| 022101 | 活动话题 | 5 | 0 | 1 | 4 | A2-B2-C1 / — |
| 032501 | 工作话题 | 5 | 0 | 3 | 2 | A2-B2-C1 / — |
| 032901 | 日常话题 | 5 | 0 | 3 | 2 | A2-B2-C1 / — |
改写要点总结
1. 对话结构改造
- 每个对话从 3 个 speaker 缩减为 2 个(一男一女)
- 对话中嵌入名字互称:如
Ben: Hi, Lucy. ... - 去掉的 speaker 名字用作干扰选项
2. Speaker 配对
- 主要配对:Ben (男) + Lucy (女)
- 其他配对:Johnny (男) + Lucy (女)、Smith (男) + Lucy (女)、Otis (男) + Ben (男)
- 干扰项:Daisy, Skylar(不出现在对话中的名字)
3. 题目类型
- 人名匹配题 (~2/套):问 Whose/Who,选项是人名
- 内容理解题 (~3/套):问具体内容,通过名字锚定说话者
4. 字段完整性
- ✅ jsonData:question, options, answer, questionAudio, questionDesc, ability
- ✅ 题目1/题目2:完整的听力文本 + 题目 + 选项 + 能力标签 + 解析
- ⚠️ jsonData 中 ability 和 explanation 受 bitable 自动化限制(见下方说明)
5. 关键格式要求
- ✅ 不改考点:保留原对话核心信息和知识点
- ✅ L1 B 级难度:语言简单清晰
- ✅ 英文半角标点
- ✅ 答案均匀分布:每套 5 题 A/B/C 各占 1-2 次
- ✅ questionAudio 命名规则:
{QSID}-0{i}.mp3 - ✅ questionSetID 保持一致
⚠️ 重要发现:Bitable 自动化限制
该 bitable 表有「推送到服务端」按钮/自动化(字段 type=3001),会在记录更新后触发。该自动化会:
- 将 jsonData 中所有 question 的
ability重置为["听觉抓取关键信息"] - 将 jsonData 中所有 question 的
explanation清空为""
应对方案
- jsonData:使用自动化兼容的值(ability=
["听觉抓取关键信息"],explanation="") - 题目1/题目2:在文本中附加完整的
【能力标签】和【解析】信息 - 每道题的题目1文本格式:
1. 【描述】You will hear two people talking about... 【听力文本】 Ben: Hi, Lucy. ... 【题目】 Question text? A. Option A(正确) B. Option B C. Option C 【能力标签】显性事实理解|关键词识别 【解析】Ben说'...',明确提到...。选项A为正确答案。
脚本文件
| 文件 | 用途 |
|---|---|
scripts/rewrite_p4_all.py |
全部改写数据定义(包含所有对话和题目) |
scripts/write_p4_v2.py |
写入脚本(含 verify-after-write) |
scripts/write_p4_safe.py |
自动化安全写入脚本(最终使用版本) |
Record ID 映射
| QSID | Record ID |
|---|---|
| 021301 | recvjufKJO8d0O |
| 021401 | recvjufM763ijb |
| 021501 | recvjufM76lEsW |
| 021601 | recvjufM76hNv5 |
| 021701 | recvjufM76eMKs |
| 021801 | recvjufM76lRHQ |
| 022101 | recvjufM76o6of |
| 032501 | recvjufM76k4dx |
| 032901 | recvjufM76frUP |
验证状态
✅ 所有 9 个 QSID 的 jsonData 可解析、字段完整 ✅ 所有题目有 question, options, answer, questionAudio, questionDesc ✅ 所有 题目1/题目2 包含对话文本 + 能力标签 + 解析 ✅ 答案分布全部满足均匀分布要求(A/B/C 各 1-2 次/套) ✅ questionSetID 保持不变 ✅ dataStatus、题目集合 ID 字段未改动
生成时间:2026-05-18 改写执行:小研 📝