auto-sync: listening-choicePic 2026-04-09_17:49

This commit is contained in:
xiaoyan-bot 2026-04-09 17:49:51 +08:00
commit 4dc0d2259a
5 changed files with 293 additions and 0 deletions

71
SKILL.md Normal file
View File

@ -0,0 +1,71 @@
---
name: listening-choicePic
description: K12英语听力三选一图片选择题标准化设计、生产、审校工具。对应题型L1 - Starters - 听力 Part3 三选一图片选择,考察核心能力:显性事实理解(单句信息点抓取)。使用场景:(1) 根据给定知识点、难度等级生成符合教研规范的听力三选一题目;(2) 校验题目格式、难度匹配、内容合规性;(3) 批量生产听力三选一题目。触发关键词听力三选一、图片选择题、listening choice pic、听力Part3三选一、单句信息点抓取题
---
# Listening ChoicePic 听力三选一图片选择题生产技能
## 题型说明
本技能对应官方题型:**L1 - Starters - 听力 Part3 三选一图片选择**,考察核心能力为**显性事实理解(单句信息点抓取)**学生听单句听力内容从3张图片选项中选出与听力内容匹配的正确答案。
## 难度对应关系(与教研标准对齐)
| 难度等级 | 对应L1阶段 | 对应剑桥考试等级 | 难度描述 |
|----------|------------|------------------|----------|
| A级 | L1 第1-2阶段 | Starters 1-2 | 选项差异极大类别完全不同听力为3-5词简单句关键词后置 |
| B级 | L1 第3-4阶段 | Starters 3 | 选项为同类物品差异(颜色/大小不同听力为5-8词简单句 |
| C级 | L1 第5-6阶段 | Movers 1 | 选项为动作/状态差异听力为8-12词带介词短语的句子 |
| D级 | L2 第1-2阶段 | Movers 2-3 | 选项为场景/逻辑差异听力为12-15词带简单从句的句子 |
## 能力标签绑定规则
1. 题型固定绑定通用能力标签:听力理解、图片信息识别、单句信息抓取
2. 每道题专属能力标签与官方45个能力tag对齐
- 所有题目统一绑定:**显性事实理解(单句信息点抓取)**
3. 生产时自动标注每道题考察的核心知识点
## 生产规则
1. 每道题包含1段听力文本单句符合难度要求、3张图片选项1个正确2个干扰
2. 干扰项设置规则:
- A级干扰项与正确选项类别完全不同猫vs书vs苹果
- B级干扰项与正确选项为同类别不同属性红苹果vs绿苹果vs黄苹果
- C级干扰项与正确选项为同物品不同动作/状态吃苹果vs洗苹果vs切苹果
- D级干扰项与正确选项为同场景不同逻辑男孩拿苹果vs女孩拿苹果vs男孩拿橘子
3. 听力文本要求:自然日常,可使用陈述句、疑问句、祈使句等多种句式,避免生硬表达
4. 图片描述要求清晰标注3张图片的核心差异点便于图片生产
## 输入参数
| 参数 | 必填 | 格式示例 | 说明 |
|------|------|----------|------|
| 知识点 | ✅ | `apple n.苹果;red adj.红色;eat v.吃` | 考察的核心知识点列表 |
| 难度等级 | ✅ | `A级` / `L1第2阶段` / `Starters 2` | 难度等级或对应阶段 |
| 题量 | 🟢 | `5` | 生成题目数量默认1道 |
| 场景要求 | 🟢 | `场景为家庭厨房` | 指定题目场景,不指定则自动匹配知识点 |
## 输出格式规范
严格按照以下格式输出,禁止额外内容:
```
【题目组描述】
[整体场景说明,例如:听句子,选出与你听到的内容相符的图片]
---
【题目1】
【听力文本】
[角色]: [符合难度的单句听力内容]
【图片描述】
A: [图片A核心特征描述]
B: [图片B核心特征描述]
C: [图片C核心特征描述]
【正确答案】
[正确选项字母例如A]
【能力项】
题目1 - 显性事实理解(单句信息点抓取)- [考察核心知识点例如red apple]
---
【题目2】
...(多题重复上述结构)
```
## 校验规则
自动校验不通过直接返回错误:
1. 词汇校验所有知识点必须在L1单词库中禁止超纲
2. 格式校验:缺少必填字段或格式不符合规范
3. 难度校验:听力句子长度、词汇难度不符合对应等级要求
4. 逻辑校验:干扰项设置不符合对应难度的差异要求
## 脚本使用说明
执行`scripts/generate_listening_choicePic.py`完成自动化生产:
```bash
python scripts/generate_listening_choicePic.py \
--knowledge "apple n.苹果;red adj.红色;eat v.吃" \
--difficulty "A" \
--count 3 \
--scene "家庭场景"
```

View File

@ -0,0 +1,28 @@
# 听力三选一图片选择题能力标签对应表
## 题型所属分类
听力三选一图片选择题 = L1 - Starters - 听力 Part3 三选一图片选择
## 题型固定绑定核心能力标签与45个能力tag一一对应
| 能力标签ID预留 | 能力标签名称 | 能力描述 |
|--------------------|--------------|----------|
| TAG_LISTEN_008 | 显性事实理解 | 单句信息点抓取,直接从听力中提取核心信息 |
| TAG_LISTEN_009 | 图片信息识别 | 识别图片中的核心特征、物品、动作 |
| TAG_LISTEN_010 | 信息匹配能力 | 匹配听觉信息与视觉图片信息 |
## 题目专属能力标签
每道题统一绑定:**显性事实理解(单句信息点抓取)**,自动标注对应考察的核心知识点。
---
## 全题型能力标签映射参考表(官方统一)
| 题型分类 | 能力标签 |
|----------|----------|
| L1 - Starters - 听力 Part1 图片连线 | 显性事实理解(关键词识别);基础语境理解(场景/物品/动作识别) |
| L1 - Starters - 听力 Part2 信息填写 | 显性细节理解(数字/时间/地点) |
| L1 - Starters - 听力 Part3 三选一图片选择(本技能对应题型) | 显性事实理解(单句信息点抓取) |
| L1 - Starters - 听力 Part4 涂色+位置 | 显性事实理解(关键词识别) |
| L1 - Movers - 听力 Part1 人物匹配 | 基础语境理解(场景/物品/动作识别) |
| L1 - Movers - 听力 Part2 表格填写 | 显性细节理解(数字/时间/地点);干扰抑制(多信息筛选) |
| L1 - Movers - 听力 Part3 星期活动匹配 | 目的/偏好识别显性to/for/like |
| L1 - Movers - 听力 Part4 三选一 | 同义替换识别(词/短语级);目的/偏好识别显性to/for/like |
| L1 - Movers高阶 - 听力 Flyers Part2 表格填写 | 干扰抑制(多信息筛选) |
| L1 - Movers高阶 - 听力 Flyers Part3 长对话选择 | 多句保持(信息整合) |
| L1 - Movers高阶 - 听力 Flyers Part4 三选一 | 语用推断(否定与纠错) |
| L1 - Movers高阶 - 听力 Flyers Part5 信息匹配 | 目的/偏好识别显性to/for/like |
| L1 - Movers高阶 - 听力 KET Part3 长对话选择 | 情绪/态度理解 |

View File

@ -0,0 +1,15 @@
# 听力三选一图片选择题难度对应表
## 难度等级与L1阶段、剑桥考试对应关系
| 难度等级 | 对应L1阶段 | 对应剑桥考试等级 | 适用学生水平 |
|----------|------------|------------------|--------------|
| A级 | L1 第1-2阶段 | Starters 1-2 | 入门级接触英语1-2个月 |
| B级 | L1 第3-4阶段 | Starters 3 | 入门级接触英语3-4个月 |
| C级 | L1 第5-6阶段 | Movers 1 | 进阶级接触英语5-6个月 |
| D级 | L2 第1-2阶段 | Movers 2-3 | 进阶级接触英语7-8个月 |
## 各难度生产约束规则
| 难度等级 | 单句最大单词数 | 词汇范围限制 | 干扰项差异要求 |
|----------|----------------|--------------|----------------|
| A级 | ≤5个单词 | 仅允许L1第1-2单元大纲词汇 | 选项类别完全不同动物vs食物vs文具 |
| B级 | ≤8个单词 | 仅允许L1第3-4单元大纲词汇 | 同类别不同属性红苹果vs绿苹果vs黄苹果 |
| C级 | ≤12个单词 | 允许L1全阶段大纲词汇 | 同物品不同动作/状态吃苹果vs洗苹果vs切苹果 |
| D级 | ≤15个单词 | 允许L1+L2前2单元大纲词汇 | 同场景不同逻辑男孩拿苹果vs女孩拿苹果vs男孩拿橘子 |

File diff suppressed because one or more lines are too long

View File

@ -0,0 +1,178 @@
#!/usr/bin/env python3
import argparse
import json
import re
import sys
import os
from typing import List, Dict
# 角色名称库
CHARACTERS = ["Otis", "Ben", "Skylar", "Brainy", "Daisy", "Jim", "Paul", "Fred"]
# 共用L1单词库路径
WORD_LIST_PATH = os.path.join(os.path.dirname(__file__), "../../listening-drag/references/l1_word_list.json")
# 难度对应规则
DIFFICULTY_RULES = {
"A": {
"sentence_length": "≤5词",
"interference": "选项类别完全不同,差异极大",
"description": "简单句,关键词后置,无修饰成分"
},
"B": {
"sentence_length": "≤8词",
"interference": "同类别不同属性(颜色/大小)",
"description": "简单句可带1个形容词修饰"
},
"C": {
"sentence_length": "≤12词",
"interference": "同物品不同动作/状态",
"description": "简单句,可带介词短语修饰"
},
"D": {
"sentence_length": "≤15词",
"interference": "同场景不同逻辑",
"description": "带简单从句,可包含逻辑连接词"
}
}
def parse_args():
parser = argparse.ArgumentParser(description="Generate Listening Picture Choice questions")
parser.add_argument("--knowledge", required=True, help="知识点列表,分号分隔")
parser.add_argument("--difficulty", required=True, choices=["A", "B", "C", "D"], help="难度等级")
parser.add_argument("--count", type=int, default=1, help="生成题目数量默认1道")
parser.add_argument("--scene", default="", help="题目场景要求,可选")
return parser.parse_args()
def load_word_list() -> List[str]:
"""加载L1单词库"""
try:
with open(WORD_LIST_PATH, "r", encoding="utf-8") as f:
data = json.load(f)
return [word["word"].lower() for word in data["words"]]
except Exception as e:
print(f"警告:加载单词库失败,跳过超纲校验:{str(e)}", file=sys.stderr)
return []
def validate_knowledge_with_wordlist(knowledge: str, word_list: List[str]) -> bool:
"""校验知识点是否在单词库中"""
if not word_list:
return True
knowledge_words = [item.split()[0].lower() for item in knowledge.split(";") if item.strip()]
out_of_range = []
for word in knowledge_words:
if word not in word_list:
out_of_range.append(word)
if out_of_range:
print(f"错误以下知识点超纲不在L1单词库中{','.join(out_of_range)}", file=sys.stderr)
return False
return True
def validate_input(args) -> bool:
"""校验输入参数合法性"""
if not args.knowledge.strip():
print("错误:知识点不能为空", file=sys.stderr)
return False
if args.count < 1 or args.count > 10:
print("错误题量范围1-10道", file=sys.stderr)
return False
# 超纲校验
word_list = load_word_list()
if not validate_knowledge_with_wordlist(args.knowledge, word_list):
return False
return True
def generate_prompt(args) -> str:
"""生成生产prompt"""
difficulty_rule = DIFFICULTY_RULES[args.difficulty]
scene_desc = f"场景要求:{args.scene}" if args.scene else "场景自动匹配知识点"
return f"""
你是资深K12英语教研专家严格按照以下要求生成{args.count}道听力三选一图片选择题
## 难度要求({args.difficulty}级)
- 句子长度{difficulty_rule['sentence_length']}
- 干扰项要求{difficulty_rule['interference']}
- 听力要求{difficulty_rule['description']}
## 输入参数
- 知识点{args.knowledge}
- {scene_desc}
## 生产规则
1. 每道题包含1段单句听力文本3张图片选项A/B/C1个正确答案
2. 听力文本自然日常可使用陈述句疑问句祈使句等多种句式避免生硬
3. 干扰项设置符合难度要求正确答案唯一
4. 角色从{CHARACTERS}中选择
## 输出格式
严格按照以下格式输出不要添加任何额外内容
题目组描述
听句子选出与你听到的内容相符的图片
---
题目1
听力文本
[角色]: [符合难度的单句听力内容]
图片描述
A: [图片A核心特征描述与知识点相关]
B: [图片B核心特征描述干扰项]
C: [图片C核心特征描述干扰项]
正确答案
[正确选项字母A/B/C]
能力项
题目1 - 显性事实理解单句信息点抓取- [考察核心知识点关键词]
---
题目2
...重复上述结构生成{args.count}道题
"""
def call_llm(prompt: str) -> str:
"""调用大模型生成内容实际使用时替换为模型API调用"""
print("请输入模型生成的内容:")
return sys.stdin.read()
def validate_output(output: str, question_count: int) -> bool:
"""校验输出格式合法性"""
# 检查必填字段
if "【题目组描述】" not in output:
print("错误:缺少题目组描述", file=sys.stderr)
return False
# 检查题目数量
question_pattern = r"【题目\d+】"
questions = re.findall(question_pattern, output)
if len(questions) != question_count:
print(f"错误:题目数量不符,预期{question_count}道,实际{len(questions)}", file=sys.stderr)
return False
# 检查每道题的必填字段
for i in range(1, question_count + 1):
question_section = re.search(rf"【题目{i}】.*?(?=【题目{i+1}】|---|\Z)", output, re.DOTALL)
if not question_section:
print(f"错误:题目{i}格式不完整", file=sys.stderr)
return False
section_content = question_section.group(0)
required_fields = ["【听力文本】", "【图片描述】", "【正确答案】", "【能力项】"]
for field in required_fields:
if field not in section_content:
print(f"错误:题目{i}缺少必填字段{field}", file=sys.stderr)
return False
# 校验能力项格式
ability_match = re.search(r"【能力项】\s*题目\d+ - 显性事实理解(单句信息点抓取)- .*", section_content)
if not ability_match:
print(f"错误:题目{i}能力项格式不正确", file=sys.stderr)
return False
# 校验答案格式
answer_match = re.search(r"【正确答案】\s*[ABC]", section_content)
if not answer_match:
print(f"错误:题目{i}答案格式不正确必须为A/B/C", file=sys.stderr)
return False
return True
def main():
args = parse_args()
if not validate_input(args):
sys.exit(1)
prompt = generate_prompt(args)
output = call_llm(prompt)
if validate_output(output, args.count):
print(output)
sys.exit(0)
else:
sys.exit(1)
if __name__ == "__main__":
main()