auto-sync: listening-drag 2026-04-09_16:49

2026-04-09 16:49:16 +08:00 · 2026-04-09 16:49:16 +08:00 · 494b52b6e4
commit 494b52b6e4
5 changed files with 390 additions and 0 deletions
--- a/SKILL.md
+++ b/SKILL.md
@ -0,0 +1,92 @@
+---
+name: listening-drag
+description: K12英语听力拖拽题（Listening Drag & Drop）标准化设计、生产、审校工具。别名：听力Part1图片连线、听力Part1人物匹配，三者为同一题型。使用场景：(1) 根据给定知识点、难度等级、人名列表生成符合教研规范的听力拖拽题；(2) 校验听力拖拽题的格式、难度匹配、内容合规性；(3) 批量生产听力拖拽题内容。触发关键词：听力拖拽题、listening drag、拖拽题生产、听力Part1图片连线、听力Part1人物匹配、人物匹配题生产、图片连线题设计
+---
+# Listening Drag 听力拖拽题生产技能
+## 核心功能
+标准化生成符合L1 6个阶段、Starters&Movers难度要求的听力拖拽题，自动绑定对应能力标签，支持批量生产与合规校验。
+## 难度对应关系（已适配新的阶段划分）
+| 原难度等级 | 对应L1阶段 | 对应剑桥考试等级 | 难度描述 |
+|------------|------------|------------------|----------|
+| A级 | L1 第1-2阶段 | Starters 1-2 | 强视觉特征，简单句，低干扰 |
+| B级 | L1 第3-4阶段 | Starters 3 | 细节特征，复合句，中干扰 |
+| C级 | L1 第5-6阶段 | Movers 1 | 状态动作，描述性语言，高干扰 |
+| D级 | L2 第1-2阶段 | Movers 2-3 | 情境推断，隐含逻辑，极高干扰 |
+## 题型别名说明
+听力拖拽题 = 听力Part1图片连线 = 听力Part1人物匹配，三者为同一题型，规则完全通用。
+## 能力标签绑定规则
+1. 题型固定绑定通用能力标签：基础语境理解（场景/物品/动作识别）、多模态信息匹配、注意力分配
+2. 每道小题对应专属能力标签（与教研部统一定义的45个能力tag一一对应）：
+   - Q1：显性事实理解（关键词识别）
+   - Q2：显性事实理解（关键词识别）
+   - Q3：多信息整合
+   - Q4：干扰抑制 / 语用推断（否定与纠错）
+3. 生产时自动根据题目类型填充对应能力标签，无需手动配置
+## 生产流程
+1. 接收输入参数：{knowledge_module}（知识点列表）、{difficulty}（难度等级A/B/C/D）、{name_list}（人名列表）、{name_list_shuffle}（打乱后的人名列表）
+2. 读取`references/l1_word_list.json`单词库，优先使用库中词汇，超纲词汇自动拦截提示
+3. 按难度对应关系校验阶段匹配性，超纲内容自动提示
+4. 生成符合难度要求的听力文本、图片描述、任务描述、答案、能力项
+5. 自动执行4层校验：词汇超纲校验、格式合规性校验、难度匹配校验、内容逻辑校验
+6. 输出标准格式的题目内容
+## 脚本使用说明
+执行`scripts/generate_listening_drag.py`即可完成自动化生产：
+```bash
+python scripts/generate_listening_drag.py \
+  --knowledge "blue adj. 蓝色的;red adj. 红色的;green adj. 绿色的" \
+  --difficulty "A" \
+  --names "Peter,Sue,Julia,Dan,May" \
+  --shuffled_names "Julia,Sue,May,Peter,Dan"
+```
+## 输出格式规范
+严格按照以下格式输出，禁止添加额外解释内容：
+```
+【听力文本】
+（对话要求自然日常，避免统一使用祈使句，可使用陈述句、疑问句等多种形式，示例参考：）
+One - 
+Girl: Look! The girl with the red shirt is happy.
+Boy: Yes. That’s Julia.
+Two - 
+Girl: Who is the girl in the yellow skirt?
+Boy: That’s Sue.
+Three -
+Girl: The girl with the blue watch is pretty.
+Boy: That’s May.
+Four -
+Girl: Is the boy in the white shirt Dan?
+Boy: No, sorry. That’s Peter.
+
+（通用规则：Q4必须包含纠错/否定逻辑，如No, sorry/I mean等表述）
+
+【图片描述】
+风格: 卡通，简单线条
+场景：[场景名称]
+ [人物描述] - [动作/特征] ；
+ [人物描述] - [动作/特征] ；
+ [人物描述] - [动作/特征] ；
+ [人物描述] - [动作/特征] ；
+ [人物描述] - [动作/特征] 。
+【人物顺序】
+[按图片P1-P5顺序排列的人名列表，例如：['Kim', 'Bill', 'Sue', 'Nick', 'Mary']]
+【选项排序】
+[打乱后的选项人名列表，与输入的shuffled_names一致，例如：['Bill', 'Mary', 'Nick', 'Kim', 'Sue']]
+【任务描述】
+You will hear [角色1]  and [角色2] talking about xxx. Drag the names to the correct people.
+
+【选项数量】
+5
+
+【答案】
+[4个答案索引，逗号分隔，例如03,01,00,04]
+
+【能力项】
+题目1 - 显性事实理解（关键词识别）- [该题考察的核心知识点关键词，例如：blue T-shirt]
+题目2 - 显性事实理解（关键词识别）- [该题考察的核心知识点关键词，例如：red dress]
+题目3 - 多信息整合 - [该题考察的组合知识点，例如：pink hairband + white skirt]
+题目4 - 干扰抑制 / 语用推断（否定与纠错）- [该题考察的核心知识点，例如：green cap]
+```
+## 校验规则
+自动校验不通过时直接返回错误原因：
+1. 难度匹配错误：知识点超出对应阶段大纲范围
+2. 格式错误：缺少必填字段或格式不符合规范
+3. 逻辑错误：听力文本与图片描述不对应、答案错误
--- a/references/ability_tags.md
+++ b/references/ability_tags.md
@ -0,0 +1,33 @@
+# 听力拖拽题能力标签对应表
+## 题型所属分类
+听力拖拽题 = 听力Part1图片连线 = 听力Part1人物匹配 = L1 - Movers - 听力 Part1 人物匹配，三者为完全等价的同一题型，规则通用。
+## 题型固定绑定核心能力标签（与45个能力tag一一对应）
+| 能力标签ID（预留） | 能力标签名称 | 能力描述 |
+|--------------------|--------------|----------|
+| TAG_LISTEN_001 | 基础语境理解 | 场景/物品/动作识别，结合听觉和视觉信息完成人物匹配 |
+| TAG_LISTEN_002 | 多模态信息匹配 | 同步处理音频输入与图片视觉信息 |
+| TAG_LISTEN_003 | 注意力分配 | 同时处理多组人物特征信息，排除无关干扰 |
+## 小题专属能力标签（与教研统一定义对齐）
+| 题号 | 能力标签ID（预留） | 能力标签名称 | 能力描述 |
+|------|--------------------|--------------|----------|
+| Q1 | TAG_LISTEN_004 | 显性事实理解 | 关键词识别，直接抓取听力中的核心名词/形容词 |
+| Q2 | TAG_LISTEN_004 | 显性事实理解 | 关键词识别，直接抓取听力中的核心名词/形容词 |
+| Q3 | TAG_LISTEN_005 | 多信息整合 | 结合2条及以上特征信息从干扰组中筛选正确答案 |
+| Q4 | TAG_LISTEN_006 / TAG_LISTEN_007 | 干扰抑制 / 语用推断 | 多信息筛选排除干扰项/理解对话中的否定、纠错逻辑 |
+---
+## 全题型能力标签映射参考表（官方统一）
+| 题型分类 | 能力标签 |
+|----------|----------|
+| L1 - Starters - 听力 Part1 图片连线 | 显性事实理解（关键词识别）；基础语境理解（场景/物品/动作识别） |
+| L1 - Starters - 听力 Part2 信息填写 | 显性细节理解（数字/时间/地点） |
+| L1 - Starters - 听力 Part3 三选一图片选择 | 显性事实理解（单句信息点抓取） |
+| L1 - Starters - 听力 Part4 涂色+位置 | 显性事实理解（关键词识别） |
+| L1 - Movers - 听力 Part1 人物匹配（本技能对应题型） | 基础语境理解（场景/物品/动作识别） |
+| L1 - Movers - 听力 Part2 表格填写 | 显性细节理解（数字/时间/地点）；干扰抑制（多信息筛选） |
+| L1 - Movers - 听力 Part3 星期活动匹配 | 目的/偏好识别（显性to/for/like） |
+| L1 - Movers - 听力 Part4 三选一 | 同义替换识别（词/短语级）；目的/偏好识别（显性to/for/like） |
+| L1 - Movers（高阶） - 听力 Flyers Part2 表格填写 | 干扰抑制（多信息筛选） |
+| L1 - Movers（高阶） - 听力 Flyers Part3 长对话选择 | 多句保持（信息整合） |
+| L1 - Movers（高阶） - 听力 Flyers Part4 三选一 | 语用推断（否定与纠错） |
+| L1 - Movers（高阶） - 听力 Flyers Part5 信息匹配 | 目的/偏好识别（显性to/for/like） |
+| L1 - Movers（高阶） - 听力 KET Part3 长对话选择 | 情绪/态度理解 |
--- a/references/difficulty_mapping.md
+++ b/references/difficulty_mapping.md
@ -0,0 +1,15 @@
+# 听力拖拽题难度对应表
+## ABCD等级与L1阶段、剑桥考试对应关系
+| 难度等级 | 对应L1阶段 | 对应剑桥考试等级 | 适用学生水平 |
+|----------|------------|------------------|--------------|
+| A级 | L1 第1-2阶段 | Starters 1-2 | 入门级，接触英语1-2个月 |
+| B级 | L1 第3-4阶段 | Starters 3 | 入门级，接触英语3-4个月 |
+| C级 | L1 第5-6阶段 | Movers 1 | 进阶级，接触英语5-6个月 |
+| D级 | L2 第1-2阶段 | Movers 2-3 | 进阶级，接触英语7-8个月 |
+## 各难度生产约束规则
+| 难度等级 | 单句最大单词数 | 词汇范围限制 | 干扰项差异要求 |
+|----------|----------------|--------------|----------------|
+| A级 | ≤5个单词 | 仅允许L1第1-2单元大纲词汇 | 差异非常明显（颜色/大类别区分） |
+| B级 | ≤8个单词 | 仅允许L1第3-4单元大纲词汇 | 差异为细节（花纹/方位区分） |
+| C级 | ≤12个单词 | 允许L1全阶段大纲词汇 | 差异为动作/状态（表情/动作区分） |
+| D级 | ≤15个单词 | 允许L1+L2前2单元大纲词汇 | 差异为逻辑推断（因果/情境区分） |
--- a/references/l1_word_list.json
+++ b/references/l1_word_list.json
@ -0,0 +1,10 @@
+{
+  "description": "L1阶段官方大纲单词库，生产题目时优先使用本库中的词汇，禁止使用超纲词汇",
+  "version": "1.0",
+  "update_time": "2026-04-09",
+  "words": [
+    // 后续将填入完整的L1阶段大纲单词列表，格式示例：
+    // {"word": "blue", "pos": "adj", "meaning": "蓝色的", "unit": "L1 U1"},
+    // {"word": "red", "pos": "adj", "meaning": "红色的", "unit": "L1 U1"}
+  ]
+}
--- a/scripts/generate_listening_drag.py
+++ b/scripts/generate_listening_drag.py
@ -0,0 +1,240 @@
+#!/usr/bin/env python3
+import argparse
+import json
+import re
+import sys
+import os
+from typing import List, Dict
+
+# 角色名称库
+CHARACTERS = ["Otis", "Ben", "Skylar", "Brainy", "Daisy", "Jim", "Paul", "Fred"]
+
+# 单词库路径
+WORD_LIST_PATH = os.path.join(os.path.dirname(__file__), "../references/l1_word_list.json")
+
+# 难度对应规则
+DIFFICULTY_RULES = {
+    "A": {
+        "visual": "强视觉特征，依赖大色块、明显大物品区分",
+        "audio": "简单句，语速慢，SVO结构，关键词后置",
+        "interference": "低，干扰组差异非常明显，仅需识别基础名词或颜色形容词"
+    },
+    "B": {
+        "visual": "细节特征，依赖花纹、衣着款式、具体方位",
+        "audio": "复合句，包含介词短语、连词and/but",
+        "interference": "中，干扰组差异在于细节，需分辨修饰性短语"
+    },
+    "C": {
+        "visual": "状态与动作，依赖面部表情、身体姿态、动作细节",
+        "audio": "描述性语言，使用丰富的形容词、副词，语速正常",
+        "interference": "高，干扰组动作极其相似，需分辨程度副词或具体形容词"
+    },
+    "D": {
+        "visual": "情境推断，依赖抽象线索或因果状态",
+        "audio": "隐含逻辑，包含推测、因果关系，语速较快",
+        "interference": "极高，干扰组无法直接通过视觉匹配，需结合上下文逻辑推理排除"
+    }
+}
+
+# 能力标签对应（与官方统一定义对齐）
+ABILITY_TAGS = [
+    "显性事实理解（关键词识别）",
+    "显性事实理解（关键词识别）",
+    "多信息整合",
+    "干扰抑制 / 语用推断（否定与纠错）"
+]
+
+def parse_args():
+    parser = argparse.ArgumentParser(description="Generate Listening Drag & Drop questions")
+    parser.add_argument("--knowledge", required=True, help="知识点列表，分号分隔")
+    parser.add_argument("--difficulty", required=True, choices=["A", "B", "C", "D"], help="难度等级")
+    parser.add_argument("--names", required=True, help="人名列表，逗号分隔")
+    parser.add_argument("--shuffled_names", required=True, help="打乱后的人名列表，逗号分隔")
+    return parser.parse_args()
+
+def load_word_list() -> List[str]:
+    """加载L1单词库"""
+    try:
+        with open(WORD_LIST_PATH, "r", encoding="utf-8") as f:
+            data = json.load(f)
+            return [word["word"].lower() for word in data["words"]]
+    except Exception as e:
+        print(f"警告：加载单词库失败，跳过超纲校验：{str(e)}", file=sys.stderr)
+        return []
+
+def validate_knowledge_with_wordlist(knowledge: str, word_list: List[str]) -> bool:
+    """校验知识点是否在单词库中"""
+    if not word_list:
+        return True
+    knowledge_words = [item.split()[0].lower() for item in knowledge.split(";") if item.strip()]
+    out_of_range = []
+    for word in knowledge_words:
+        if word not in word_list:
+            out_of_range.append(word)
+    if out_of_range:
+        print(f"错误：以下知识点超纲，不在L1单词库中：{','.join(out_of_range)}", file=sys.stderr)
+        return False
+    return True
+
+def validate_input(args) -> bool:
+    """校验输入参数合法性"""
+    names = args.names.split(",")
+    shuffled_names = args.shuffled_names.split(",")
+    if len(names) != 5 or len(shuffled_names) !=5:
+        print("错误：人名列表必须包含5个名字", file=sys.stderr)
+        return False
+    if set(names) != set(shuffled_names):
+        print("错误：打乱后的人名列表与原列表不一致", file=sys.stderr)
+        return False
+    if not args.knowledge.strip():
+        print("错误：知识点不能为空", file=sys.stderr)
+        return False
+    # 超纲校验
+    word_list = load_word_list()
+    if not validate_knowledge_with_wordlist(args.knowledge, word_list):
+        return False
+    return True
+
+def generate_prompt(args) -> str:
+    """生成生产prompt"""
+    difficulty_rule = DIFFICULTY_RULES[args.difficulty]
+    return f"""
+你是资深K12英语教研专家，严格按照以下要求生成听力拖拽题：
+## 难度要求
+{difficulty_rule}
+## 输入参数
+知识点：{args.knowledge}
+人名列表：{args.names}
+打乱后人名列表：{args.shuffled_names}
+## 题目要求
+1. 共4道小题，对应P1-P4，P5为干扰项
+2. P3-P5为干扰组，共享一个核心特征，仅通过细节区分
+3. Q4必须包含纠错逻辑（如No, sorry/I mean）或否定逻辑
+4. 角色从{CHARACTERS}中选择2个不同的角色
+5. 对话要求自然日常，避免统一使用祈使句，可使用陈述句、疑问句等多种形式，参考示例：
+One - 
+Girl: Look! The girl with the red shirt is happy.
+Boy: Yes. That’s Julia.
+Two - 
+Girl: Who is the girl in the yellow skirt?
+Boy: That’s Sue.
+Three -
+Girl: The girl with the blue watch is pretty.
+Boy: That’s May.
+Four -
+Girl: Is the boy in the white shirt Dan?
+Boy: No, sorry. That’s Peter.
+## 输出格式
+严格按照以下格式输出，不要添加任何额外内容：
+【听力文本】
+One - 
+[角色1]: [对话指向P1]
+[角色2]: Yes. That’s [Name1].
+Two - 
+[角色1]: [对话指向P2]
+[角色2]: That’s [Name2].
+Three -
+[角色1]: [对话指向P3，从干扰组筛选]
+[角色2]: That’s [Name3].
+Four -
+[角色1]: [对话指向P4，包含纠错逻辑]
+[角色2]: Oh! That’s [Name4].
+【图片描述】
+风格: 卡通，简单线条
+场景：[符合知识点的场景]
+ [人物1描述] - [动作/特征] ；
+ [人物2描述] - [动作/特征] ；
+ [人物3描述] - [动作/特征] ；
+ [人物4描述] - [动作/特征] ；
+ [人物5描述] - [动作/特征] 。
+【人物顺序】
+[{args.names.split(',')}]
+【选项排序】
+[{args.shuffled_names.split(',')}]
+【任务描述】
+You will hear [角色1] and [角色2] talking about [场景相关内容]. Drag the names to the correct people.
+【选项数量】
+5
+【答案】
+[Name1在打乱列表中的索引,Name2索引,Name3索引,Name4索引]，例如03,01,00,04
+【能力项】
+题目1 - 显性事实理解（关键词识别）- [Q1考察的核心知识点关键词，例如：blue T-shirt]
+题目2 - 显性事实理解（关键词识别）- [Q2考察的核心知识点关键词，例如：red dress]
+题目3 - 多信息整合 - [Q3考察的组合知识点关键词，例如：pink hairband + white skirt]
+题目4 - 干扰抑制 / 语用推断（否定与纠错）- [Q4考察的核心知识点关键词，例如：green cap]
+"""
+
+def call_llm(prompt: str) -> str:
+    """调用大模型生成内容（此处留空，实际使用时替换为对应模型调用逻辑）"""
+    # 实际生产环境替换为模型API调用
+    print("请输入模型生成的内容：")
+    return sys.stdin.read()
+
+def validate_output(output: str, original_names: List[str], shuffled_names: List[str]) -> bool:
+    """校验输出格式合法性"""
+    # 检查必填字段是否存在
+    required_sections = ["【听力文本】", "【图片描述】", "【人物顺序】", "【选项排序】", "【任务描述】", "【选项数量】", "【答案】", "【能力项】"]
+    for section in required_sections:
+        if section not in output:
+            print(f"错误：缺少必填字段{section}", file=sys.stderr)
+            return False
+    # 校验人物顺序格式
+    person_order_match = re.search(r"【人物顺序】\s*\[(.*)\]", output)
+    if not person_order_match:
+        print("错误：人物顺序格式不正确", file=sys.stderr)
+        return False
+    person_order = [name.strip().strip("'\"") for name in person_order_match.group(1).split(",")]
+    if person_order != original_names:
+        print(f"错误：人物顺序与输入人名列表不一致，预期：{original_names}，实际：{person_order}", file=sys.stderr)
+        return False
+    # 校验选项排序格式
+    option_order_match = re.search(r"【选项排序】\s*\[(.*)\]", output)
+    if not option_order_match:
+        print("错误：选项排序格式不正确", file=sys.stderr)
+        return False
+    option_order = [name.strip().strip("'\"") for name in option_order_match.group(1).split(",")]
+    if option_order != shuffled_names:
+        print(f"错误：选项排序与输入打乱后的人名列表不一致，预期：{shuffled_names}，实际：{option_order}", file=sys.stderr)
+        return False
+    # 校验答案格式
+    answer_match = re.search(r"【答案】\s*([\d,]+)", output)
+    if not answer_match:
+        print("错误：答案格式不正确", file=sys.stderr)
+        return False
+    answers = answer_match.group(1).split(",")
+    if len(answers) !=4:
+        print("错误：答案必须包含4个索引", file=sys.stderr)
+        return False
+    for ans in answers:
+        if not ans.isdigit() or int(ans) <0 or int(ans)>=5:
+            print(f"错误：答案索引{ans}不合法", file=sys.stderr)
+            return False
+    # 校验答案对应的人名是否在列表中
+    for ans in answers:
+        idx = int(ans)
+        if idx >= len(shuffled_names):
+            print(f"错误：答案索引{idx}超出范围", file=sys.stderr)
+            return False
+    # 校验能力项格式
+    ability_pattern = r"【能力项】\s*题目1 - .* - .*\s*题目2 - .* - .*\s*题目3 - .* - .*\s*题目4 - .* - .*"
+    if not re.search(ability_pattern, output, re.DOTALL):
+        print("错误：能力项格式不正确，必须按以下格式分行列出：题目N - 能力标签 - 考察知识点", file=sys.stderr)
+        return False
+    return True
+
+def main():
+    args = parse_args()
+    if not validate_input(args):
+        sys.exit(1)
+    prompt = generate_prompt(args)
+    output = call_llm(prompt)
+    original_names = args.names.split(",")
+    shuffled_names = args.shuffled_names.split(",")
+    if validate_output(output, original_names, shuffled_names):
+        print(output)
+        sys.exit(0)
+    else:
+        sys.exit(1)
+
+if __name__ == "__main__":
+    main()