From c39b87b83ff09e74d9f24dd88a6832dbfcd121ff Mon Sep 17 00:00:00 2001 From: xiaoyan-bot Date: Thu, 9 Apr 2026 17:19:16 +0800 Subject: [PATCH] auto-sync: listening-choicePic 2026-04-09_17:19 --- SKILL.md | 71 ++++++++++ references/ability_tags.md | 28 ++++ references/difficulty_mapping.md | 15 ++ scripts/generate_listening_choicePic.py | 178 ++++++++++++++++++++++++ 4 files changed, 292 insertions(+) create mode 100644 SKILL.md create mode 100644 references/ability_tags.md create mode 100644 references/difficulty_mapping.md create mode 100755 scripts/generate_listening_choicePic.py diff --git a/SKILL.md b/SKILL.md new file mode 100644 index 0000000..385ddba --- /dev/null +++ b/SKILL.md @@ -0,0 +1,71 @@ +--- +name: listening-choicePic +description: K12英语听力三选一图片选择题标准化设计、生产、审校工具。对应题型:L1 - Starters - 听力 Part3 三选一图片选择,考察核心能力:显性事实理解(单句信息点抓取)。使用场景:(1) 根据给定知识点、难度等级生成符合教研规范的听力三选一题目;(2) 校验题目格式、难度匹配、内容合规性;(3) 批量生产听力三选一题目。触发关键词:听力三选一、图片选择题、listening choice pic、听力Part3三选一、单句信息点抓取题 +--- +# Listening ChoicePic 听力三选一图片选择题生产技能 +## 题型说明 +本技能对应官方题型:**L1 - Starters - 听力 Part3 三选一图片选择**,考察核心能力为**显性事实理解(单句信息点抓取)**:学生听单句听力内容,从3张图片选项中选出与听力内容匹配的正确答案。 +## 难度对应关系(与教研标准对齐) +| 难度等级 | 对应L1阶段 | 对应剑桥考试等级 | 难度描述 | +|----------|------------|------------------|----------| +| A级 | L1 第1-2阶段 | Starters 1-2 | 选项差异极大(类别完全不同),听力为3-5词简单句,关键词后置 | +| B级 | L1 第3-4阶段 | Starters 3 | 选项为同类物品差异(颜色/大小不同),听力为5-8词简单句 | +| C级 | L1 第5-6阶段 | Movers 1 | 选项为动作/状态差异,听力为8-12词带介词短语的句子 | +| D级 | L2 第1-2阶段 | Movers 2-3 | 选项为场景/逻辑差异,听力为12-15词带简单从句的句子 | +## 能力标签绑定规则 +1. 题型固定绑定通用能力标签:听力理解、图片信息识别、单句信息抓取 +2. 每道题专属能力标签(与官方45个能力tag对齐): + - 所有题目统一绑定:**显性事实理解(单句信息点抓取)** +3. 生产时自动标注每道题考察的核心知识点 +## 生产规则 +1. 每道题包含:1段听力文本(单句,符合难度要求)、3张图片选项(1个正确,2个干扰) +2. 干扰项设置规则: + - A级:干扰项与正确选项类别完全不同(如:猫vs书vs苹果) + - B级:干扰项与正确选项为同类别不同属性(如:红苹果vs绿苹果vs黄苹果) + - C级:干扰项与正确选项为同物品不同动作/状态(如:吃苹果vs洗苹果vs切苹果) + - D级:干扰项与正确选项为同场景不同逻辑(如:男孩拿苹果vs女孩拿苹果vs男孩拿橘子) +3. 听力文本要求:自然日常,可使用陈述句、疑问句、祈使句等多种句式,避免生硬表达 +4. 图片描述要求:清晰标注3张图片的核心差异点,便于图片生产 +## 输入参数 +| 参数 | 必填 | 格式示例 | 说明 | +|------|------|----------|------| +| 知识点 | ✅ | `apple n.苹果;red adj.红色;eat v.吃` | 考察的核心知识点列表 | +| 难度等级 | ✅ | `A级` / `L1第2阶段` / `Starters 2` | 难度等级或对应阶段 | +| 题量 | 🟢 | `5` | 生成题目数量,默认1道 | +| 场景要求 | 🟢 | `场景为家庭厨房` | 指定题目场景,不指定则自动匹配知识点 | +## 输出格式规范 +严格按照以下格式输出,禁止额外内容: +``` +【题目组描述】 +[整体场景说明,例如:听句子,选出与你听到的内容相符的图片] +--- +【题目1】 +【听力文本】 +[角色]: [符合难度的单句听力内容] +【图片描述】 +A: [图片A核心特征描述] +B: [图片B核心特征描述] +C: [图片C核心特征描述] +【正确答案】 +[正确选项字母,例如:A] +【能力项】 +题目1 - 显性事实理解(单句信息点抓取)- [考察核心知识点,例如:red apple] +--- +【题目2】 +...(多题重复上述结构) +``` +## 校验规则 +自动校验不通过直接返回错误: +1. 词汇校验:所有知识点必须在L1单词库中,禁止超纲 +2. 格式校验:缺少必填字段或格式不符合规范 +3. 难度校验:听力句子长度、词汇难度不符合对应等级要求 +4. 逻辑校验:干扰项设置不符合对应难度的差异要求 +## 脚本使用说明 +执行`scripts/generate_listening_choicePic.py`完成自动化生产: +```bash +python scripts/generate_listening_choicePic.py \ + --knowledge "apple n.苹果;red adj.红色;eat v.吃" \ + --difficulty "A" \ + --count 3 \ + --scene "家庭场景" +``` diff --git a/references/ability_tags.md b/references/ability_tags.md new file mode 100644 index 0000000..48fedab --- /dev/null +++ b/references/ability_tags.md @@ -0,0 +1,28 @@ +# 听力三选一图片选择题能力标签对应表 +## 题型所属分类 +听力三选一图片选择题 = L1 - Starters - 听力 Part3 三选一图片选择 +## 题型固定绑定核心能力标签(与45个能力tag一一对应) +| 能力标签ID(预留) | 能力标签名称 | 能力描述 | +|--------------------|--------------|----------| +| TAG_LISTEN_008 | 显性事实理解 | 单句信息点抓取,直接从听力中提取核心信息 | +| TAG_LISTEN_009 | 图片信息识别 | 识别图片中的核心特征、物品、动作 | +| TAG_LISTEN_010 | 信息匹配能力 | 匹配听觉信息与视觉图片信息 | +## 题目专属能力标签 +每道题统一绑定:**显性事实理解(单句信息点抓取)**,自动标注对应考察的核心知识点。 +--- +## 全题型能力标签映射参考表(官方统一) +| 题型分类 | 能力标签 | +|----------|----------| +| L1 - Starters - 听力 Part1 图片连线 | 显性事实理解(关键词识别);基础语境理解(场景/物品/动作识别) | +| L1 - Starters - 听力 Part2 信息填写 | 显性细节理解(数字/时间/地点) | +| L1 - Starters - 听力 Part3 三选一图片选择(本技能对应题型) | 显性事实理解(单句信息点抓取) | +| L1 - Starters - 听力 Part4 涂色+位置 | 显性事实理解(关键词识别) | +| L1 - Movers - 听力 Part1 人物匹配 | 基础语境理解(场景/物品/动作识别) | +| L1 - Movers - 听力 Part2 表格填写 | 显性细节理解(数字/时间/地点);干扰抑制(多信息筛选) | +| L1 - Movers - 听力 Part3 星期活动匹配 | 目的/偏好识别(显性to/for/like) | +| L1 - Movers - 听力 Part4 三选一 | 同义替换识别(词/短语级);目的/偏好识别(显性to/for/like) | +| L1 - Movers(高阶) - 听力 Flyers Part2 表格填写 | 干扰抑制(多信息筛选) | +| L1 - Movers(高阶) - 听力 Flyers Part3 长对话选择 | 多句保持(信息整合) | +| L1 - Movers(高阶) - 听力 Flyers Part4 三选一 | 语用推断(否定与纠错) | +| L1 - Movers(高阶) - 听力 Flyers Part5 信息匹配 | 目的/偏好识别(显性to/for/like) | +| L1 - Movers(高阶) - 听力 KET Part3 长对话选择 | 情绪/态度理解 | diff --git a/references/difficulty_mapping.md b/references/difficulty_mapping.md new file mode 100644 index 0000000..e9d1edb --- /dev/null +++ b/references/difficulty_mapping.md @@ -0,0 +1,15 @@ +# 听力三选一图片选择题难度对应表 +## 难度等级与L1阶段、剑桥考试对应关系 +| 难度等级 | 对应L1阶段 | 对应剑桥考试等级 | 适用学生水平 | +|----------|------------|------------------|--------------| +| A级 | L1 第1-2阶段 | Starters 1-2 | 入门级,接触英语1-2个月 | +| B级 | L1 第3-4阶段 | Starters 3 | 入门级,接触英语3-4个月 | +| C级 | L1 第5-6阶段 | Movers 1 | 进阶级,接触英语5-6个月 | +| D级 | L2 第1-2阶段 | Movers 2-3 | 进阶级,接触英语7-8个月 | +## 各难度生产约束规则 +| 难度等级 | 单句最大单词数 | 词汇范围限制 | 干扰项差异要求 | +|----------|----------------|--------------|----------------| +| A级 | ≤5个单词 | 仅允许L1第1-2单元大纲词汇 | 选项类别完全不同(如:动物vs食物vs文具) | +| B级 | ≤8个单词 | 仅允许L1第3-4单元大纲词汇 | 同类别不同属性(如:红苹果vs绿苹果vs黄苹果) | +| C级 | ≤12个单词 | 允许L1全阶段大纲词汇 | 同物品不同动作/状态(如:吃苹果vs洗苹果vs切苹果) | +| D级 | ≤15个单词 | 允许L1+L2前2单元大纲词汇 | 同场景不同逻辑(如:男孩拿苹果vs女孩拿苹果vs男孩拿橘子) | diff --git a/scripts/generate_listening_choicePic.py b/scripts/generate_listening_choicePic.py new file mode 100755 index 0000000..625b809 --- /dev/null +++ b/scripts/generate_listening_choicePic.py @@ -0,0 +1,178 @@ +#!/usr/bin/env python3 +import argparse +import json +import re +import sys +import os +from typing import List, Dict + +# 角色名称库 +CHARACTERS = ["Otis", "Ben", "Skylar", "Brainy", "Daisy", "Jim", "Paul", "Fred"] + +# 共用L1单词库路径 +WORD_LIST_PATH = os.path.join(os.path.dirname(__file__), "../../listening-drag/references/l1_word_list.json") + +# 难度对应规则 +DIFFICULTY_RULES = { + "A": { + "sentence_length": "≤5词", + "interference": "选项类别完全不同,差异极大", + "description": "简单句,关键词后置,无修饰成分" + }, + "B": { + "sentence_length": "≤8词", + "interference": "同类别不同属性(颜色/大小)", + "description": "简单句,可带1个形容词修饰" + }, + "C": { + "sentence_length": "≤12词", + "interference": "同物品不同动作/状态", + "description": "简单句,可带介词短语修饰" + }, + "D": { + "sentence_length": "≤15词", + "interference": "同场景不同逻辑", + "description": "带简单从句,可包含逻辑连接词" + } +} + +def parse_args(): + parser = argparse.ArgumentParser(description="Generate Listening Picture Choice questions") + parser.add_argument("--knowledge", required=True, help="知识点列表,分号分隔") + parser.add_argument("--difficulty", required=True, choices=["A", "B", "C", "D"], help="难度等级") + parser.add_argument("--count", type=int, default=1, help="生成题目数量,默认1道") + parser.add_argument("--scene", default="", help="题目场景要求,可选") + return parser.parse_args() + +def load_word_list() -> List[str]: + """加载L1单词库""" + try: + with open(WORD_LIST_PATH, "r", encoding="utf-8") as f: + data = json.load(f) + return [word["word"].lower() for word in data["words"]] + except Exception as e: + print(f"警告:加载单词库失败,跳过超纲校验:{str(e)}", file=sys.stderr) + return [] + +def validate_knowledge_with_wordlist(knowledge: str, word_list: List[str]) -> bool: + """校验知识点是否在单词库中""" + if not word_list: + return True + knowledge_words = [item.split()[0].lower() for item in knowledge.split(";") if item.strip()] + out_of_range = [] + for word in knowledge_words: + if word not in word_list: + out_of_range.append(word) + if out_of_range: + print(f"错误:以下知识点超纲,不在L1单词库中:{','.join(out_of_range)}", file=sys.stderr) + return False + return True + +def validate_input(args) -> bool: + """校验输入参数合法性""" + if not args.knowledge.strip(): + print("错误:知识点不能为空", file=sys.stderr) + return False + if args.count < 1 or args.count > 10: + print("错误:题量范围1-10道", file=sys.stderr) + return False + # 超纲校验 + word_list = load_word_list() + if not validate_knowledge_with_wordlist(args.knowledge, word_list): + return False + return True + +def generate_prompt(args) -> str: + """生成生产prompt""" + difficulty_rule = DIFFICULTY_RULES[args.difficulty] + scene_desc = f"场景要求:{args.scene}" if args.scene else "场景自动匹配知识点" + return f""" +你是资深K12英语教研专家,严格按照以下要求生成{args.count}道听力三选一图片选择题: +## 难度要求({args.difficulty}级) +- 句子长度:{difficulty_rule['sentence_length']} +- 干扰项要求:{difficulty_rule['interference']} +- 听力要求:{difficulty_rule['description']} +## 输入参数 +- 知识点:{args.knowledge} +- {scene_desc} +## 生产规则 +1. 每道题包含1段单句听力文本,3张图片选项(A/B/C),1个正确答案 +2. 听力文本自然日常,可使用陈述句、疑问句、祈使句等多种句式,避免生硬 +3. 干扰项设置符合难度要求,正确答案唯一 +4. 角色从{CHARACTERS}中选择 +## 输出格式 +严格按照以下格式输出,不要添加任何额外内容: +【题目组描述】 +听句子,选出与你听到的内容相符的图片。 +--- +【题目1】 +【听力文本】 +[角色]: [符合难度的单句听力内容] +【图片描述】 +A: [图片A核心特征描述,与知识点相关] +B: [图片B核心特征描述,干扰项] +C: [图片C核心特征描述,干扰项] +【正确答案】 +[正确选项字母A/B/C] +【能力项】 +题目1 - 显性事实理解(单句信息点抓取)- [考察核心知识点关键词] +--- +【题目2】 +...(重复上述结构生成{args.count}道题) +""" + +def call_llm(prompt: str) -> str: + """调用大模型生成内容(实际使用时替换为模型API调用)""" + print("请输入模型生成的内容:") + return sys.stdin.read() + +def validate_output(output: str, question_count: int) -> bool: + """校验输出格式合法性""" + # 检查必填字段 + if "【题目组描述】" not in output: + print("错误:缺少题目组描述", file=sys.stderr) + return False + # 检查题目数量 + question_pattern = r"【题目\d+】" + questions = re.findall(question_pattern, output) + if len(questions) != question_count: + print(f"错误:题目数量不符,预期{question_count}道,实际{len(questions)}道", file=sys.stderr) + return False + # 检查每道题的必填字段 + for i in range(1, question_count + 1): + question_section = re.search(rf"【题目{i}】.*?(?=【题目{i+1}】|---|\Z)", output, re.DOTALL) + if not question_section: + print(f"错误:题目{i}格式不完整", file=sys.stderr) + return False + section_content = question_section.group(0) + required_fields = ["【听力文本】", "【图片描述】", "【正确答案】", "【能力项】"] + for field in required_fields: + if field not in section_content: + print(f"错误:题目{i}缺少必填字段{field}", file=sys.stderr) + return False + # 校验能力项格式 + ability_match = re.search(r"【能力项】\s*题目\d+ - 显性事实理解(单句信息点抓取)- .*", section_content) + if not ability_match: + print(f"错误:题目{i}能力项格式不正确", file=sys.stderr) + return False + # 校验答案格式 + answer_match = re.search(r"【正确答案】\s*[ABC]", section_content) + if not answer_match: + print(f"错误:题目{i}答案格式不正确,必须为A/B/C", file=sys.stderr) + return False + return True + +def main(): + args = parse_args() + if not validate_input(args): + sys.exit(1) + prompt = generate_prompt(args) + output = call_llm(prompt) + if validate_output(output, args.count): + print(output) + sys.exit(0) + else: + sys.exit(1) + +if __name__ == "__main__": + main()