auto-sync: listening-drag 2026-04-09_16:49

This commit is contained in:
xiaoyan-bot 2026-04-09 16:49:16 +08:00
commit 494b52b6e4
5 changed files with 390 additions and 0 deletions

92
SKILL.md Normal file
View File

@ -0,0 +1,92 @@
---
name: listening-drag
description: K12英语听力拖拽题Listening Drag & Drop标准化设计、生产、审校工具。别名听力Part1图片连线、听力Part1人物匹配三者为同一题型。使用场景(1) 根据给定知识点、难度等级、人名列表生成符合教研规范的听力拖拽题;(2) 校验听力拖拽题的格式、难度匹配、内容合规性;(3) 批量生产听力拖拽题内容。触发关键词听力拖拽题、listening drag、拖拽题生产、听力Part1图片连线、听力Part1人物匹配、人物匹配题生产、图片连线题设计
---
# Listening Drag 听力拖拽题生产技能
## 核心功能
标准化生成符合L1 6个阶段、Starters&Movers难度要求的听力拖拽题自动绑定对应能力标签支持批量生产与合规校验。
## 难度对应关系(已适配新的阶段划分)
| 原难度等级 | 对应L1阶段 | 对应剑桥考试等级 | 难度描述 |
|------------|------------|------------------|----------|
| A级 | L1 第1-2阶段 | Starters 1-2 | 强视觉特征,简单句,低干扰 |
| B级 | L1 第3-4阶段 | Starters 3 | 细节特征,复合句,中干扰 |
| C级 | L1 第5-6阶段 | Movers 1 | 状态动作,描述性语言,高干扰 |
| D级 | L2 第1-2阶段 | Movers 2-3 | 情境推断,隐含逻辑,极高干扰 |
## 题型别名说明
听力拖拽题 = 听力Part1图片连线 = 听力Part1人物匹配三者为同一题型规则完全通用。
## 能力标签绑定规则
1. 题型固定绑定通用能力标签:基础语境理解(场景/物品/动作识别)、多模态信息匹配、注意力分配
2. 每道小题对应专属能力标签与教研部统一定义的45个能力tag一一对应
- Q1显性事实理解关键词识别
- Q2显性事实理解关键词识别
- Q3多信息整合
- Q4干扰抑制 / 语用推断(否定与纠错)
3. 生产时自动根据题目类型填充对应能力标签,无需手动配置
## 生产流程
1. 接收输入参数:{knowledge_module}(知识点列表)、{difficulty}难度等级A/B/C/D、{name_list}(人名列表)、{name_list_shuffle}(打乱后的人名列表)
2. 读取`references/l1_word_list.json`单词库,优先使用库中词汇,超纲词汇自动拦截提示
3. 按难度对应关系校验阶段匹配性,超纲内容自动提示
4. 生成符合难度要求的听力文本、图片描述、任务描述、答案、能力项
5. 自动执行4层校验词汇超纲校验、格式合规性校验、难度匹配校验、内容逻辑校验
6. 输出标准格式的题目内容
## 脚本使用说明
执行`scripts/generate_listening_drag.py`即可完成自动化生产:
```bash
python scripts/generate_listening_drag.py \
--knowledge "blue adj. 蓝色的;red adj. 红色的;green adj. 绿色的" \
--difficulty "A" \
--names "Peter,Sue,Julia,Dan,May" \
--shuffled_names "Julia,Sue,May,Peter,Dan"
```
## 输出格式规范
严格按照以下格式输出,禁止添加额外解释内容:
```
【听力文本】
(对话要求自然日常,避免统一使用祈使句,可使用陈述句、疑问句等多种形式,示例参考:)
One -
Girl: Look! The girl with the red shirt is happy.
Boy: Yes. Thats Julia.
Two -
Girl: Who is the girl in the yellow skirt?
Boy: Thats Sue.
Three -
Girl: The girl with the blue watch is pretty.
Boy: Thats May.
Four -
Girl: Is the boy in the white shirt Dan?
Boy: No, sorry. Thats Peter.
通用规则Q4必须包含纠错/否定逻辑如No, sorry/I mean等表述
【图片描述】
风格: 卡通,简单线条
场景:[场景名称]
[人物描述] - [动作/特征]
[人物描述] - [动作/特征]
[人物描述] - [动作/特征]
[人物描述] - [动作/特征]
[人物描述] - [动作/特征] 。
【人物顺序】
[按图片P1-P5顺序排列的人名列表例如['Kim', 'Bill', 'Sue', 'Nick', 'Mary']]
【选项排序】
[打乱后的选项人名列表与输入的shuffled_names一致例如['Bill', 'Mary', 'Nick', 'Kim', 'Sue']]
【任务描述】
You will hear [角色1] and [角色2] talking about xxx. Drag the names to the correct people.
【选项数量】
5
【答案】
[4个答案索引逗号分隔例如03,01,00,04]
【能力项】
题目1 - 显性事实理解(关键词识别)- [该题考察的核心知识点关键词例如blue T-shirt]
题目2 - 显性事实理解(关键词识别)- [该题考察的核心知识点关键词例如red dress]
题目3 - 多信息整合 - [该题考察的组合知识点例如pink hairband + white skirt]
题目4 - 干扰抑制 / 语用推断(否定与纠错)- [该题考察的核心知识点例如green cap]
```
## 校验规则
自动校验不通过时直接返回错误原因:
1. 难度匹配错误:知识点超出对应阶段大纲范围
2. 格式错误:缺少必填字段或格式不符合规范
3. 逻辑错误:听力文本与图片描述不对应、答案错误

View File

@ -0,0 +1,33 @@
# 听力拖拽题能力标签对应表
## 题型所属分类
听力拖拽题 = 听力Part1图片连线 = 听力Part1人物匹配 = L1 - Movers - 听力 Part1 人物匹配,三者为完全等价的同一题型,规则通用。
## 题型固定绑定核心能力标签与45个能力tag一一对应
| 能力标签ID预留 | 能力标签名称 | 能力描述 |
|--------------------|--------------|----------|
| TAG_LISTEN_001 | 基础语境理解 | 场景/物品/动作识别,结合听觉和视觉信息完成人物匹配 |
| TAG_LISTEN_002 | 多模态信息匹配 | 同步处理音频输入与图片视觉信息 |
| TAG_LISTEN_003 | 注意力分配 | 同时处理多组人物特征信息,排除无关干扰 |
## 小题专属能力标签(与教研统一定义对齐)
| 题号 | 能力标签ID预留 | 能力标签名称 | 能力描述 |
|------|--------------------|--------------|----------|
| Q1 | TAG_LISTEN_004 | 显性事实理解 | 关键词识别,直接抓取听力中的核心名词/形容词 |
| Q2 | TAG_LISTEN_004 | 显性事实理解 | 关键词识别,直接抓取听力中的核心名词/形容词 |
| Q3 | TAG_LISTEN_005 | 多信息整合 | 结合2条及以上特征信息从干扰组中筛选正确答案 |
| Q4 | TAG_LISTEN_006 / TAG_LISTEN_007 | 干扰抑制 / 语用推断 | 多信息筛选排除干扰项/理解对话中的否定、纠错逻辑 |
---
## 全题型能力标签映射参考表(官方统一)
| 题型分类 | 能力标签 |
|----------|----------|
| L1 - Starters - 听力 Part1 图片连线 | 显性事实理解(关键词识别);基础语境理解(场景/物品/动作识别) |
| L1 - Starters - 听力 Part2 信息填写 | 显性细节理解(数字/时间/地点) |
| L1 - Starters - 听力 Part3 三选一图片选择 | 显性事实理解(单句信息点抓取) |
| L1 - Starters - 听力 Part4 涂色+位置 | 显性事实理解(关键词识别) |
| L1 - Movers - 听力 Part1 人物匹配(本技能对应题型) | 基础语境理解(场景/物品/动作识别) |
| L1 - Movers - 听力 Part2 表格填写 | 显性细节理解(数字/时间/地点);干扰抑制(多信息筛选) |
| L1 - Movers - 听力 Part3 星期活动匹配 | 目的/偏好识别显性to/for/like |
| L1 - Movers - 听力 Part4 三选一 | 同义替换识别(词/短语级);目的/偏好识别显性to/for/like |
| L1 - Movers高阶 - 听力 Flyers Part2 表格填写 | 干扰抑制(多信息筛选) |
| L1 - Movers高阶 - 听力 Flyers Part3 长对话选择 | 多句保持(信息整合) |
| L1 - Movers高阶 - 听力 Flyers Part4 三选一 | 语用推断(否定与纠错) |
| L1 - Movers高阶 - 听力 Flyers Part5 信息匹配 | 目的/偏好识别显性to/for/like |
| L1 - Movers高阶 - 听力 KET Part3 长对话选择 | 情绪/态度理解 |

View File

@ -0,0 +1,15 @@
# 听力拖拽题难度对应表
## ABCD等级与L1阶段、剑桥考试对应关系
| 难度等级 | 对应L1阶段 | 对应剑桥考试等级 | 适用学生水平 |
|----------|------------|------------------|--------------|
| A级 | L1 第1-2阶段 | Starters 1-2 | 入门级接触英语1-2个月 |
| B级 | L1 第3-4阶段 | Starters 3 | 入门级接触英语3-4个月 |
| C级 | L1 第5-6阶段 | Movers 1 | 进阶级接触英语5-6个月 |
| D级 | L2 第1-2阶段 | Movers 2-3 | 进阶级接触英语7-8个月 |
## 各难度生产约束规则
| 难度等级 | 单句最大单词数 | 词汇范围限制 | 干扰项差异要求 |
|----------|----------------|--------------|----------------|
| A级 | ≤5个单词 | 仅允许L1第1-2单元大纲词汇 | 差异非常明显(颜色/大类别区分) |
| B级 | ≤8个单词 | 仅允许L1第3-4单元大纲词汇 | 差异为细节(花纹/方位区分) |
| C级 | ≤12个单词 | 允许L1全阶段大纲词汇 | 差异为动作/状态(表情/动作区分) |
| D级 | ≤15个单词 | 允许L1+L2前2单元大纲词汇 | 差异为逻辑推断(因果/情境区分) |

View File

@ -0,0 +1,10 @@
{
"description": "L1阶段官方大纲单词库生产题目时优先使用本库中的词汇禁止使用超纲词汇",
"version": "1.0",
"update_time": "2026-04-09",
"words": [
// L1
// {"word": "blue", "pos": "adj", "meaning": "蓝色的", "unit": "L1 U1"},
// {"word": "red", "pos": "adj", "meaning": "红色的", "unit": "L1 U1"}
]
}

View File

@ -0,0 +1,240 @@
#!/usr/bin/env python3
import argparse
import json
import re
import sys
import os
from typing import List, Dict
# 角色名称库
CHARACTERS = ["Otis", "Ben", "Skylar", "Brainy", "Daisy", "Jim", "Paul", "Fred"]
# 单词库路径
WORD_LIST_PATH = os.path.join(os.path.dirname(__file__), "../references/l1_word_list.json")
# 难度对应规则
DIFFICULTY_RULES = {
"A": {
"visual": "强视觉特征,依赖大色块、明显大物品区分",
"audio": "简单句语速慢SVO结构关键词后置",
"interference": "低,干扰组差异非常明显,仅需识别基础名词或颜色形容词"
},
"B": {
"visual": "细节特征,依赖花纹、衣着款式、具体方位",
"audio": "复合句包含介词短语、连词and/but",
"interference": "中,干扰组差异在于细节,需分辨修饰性短语"
},
"C": {
"visual": "状态与动作,依赖面部表情、身体姿态、动作细节",
"audio": "描述性语言,使用丰富的形容词、副词,语速正常",
"interference": "高,干扰组动作极其相似,需分辨程度副词或具体形容词"
},
"D": {
"visual": "情境推断,依赖抽象线索或因果状态",
"audio": "隐含逻辑,包含推测、因果关系,语速较快",
"interference": "极高,干扰组无法直接通过视觉匹配,需结合上下文逻辑推理排除"
}
}
# 能力标签对应(与官方统一定义对齐)
ABILITY_TAGS = [
"显性事实理解(关键词识别)",
"显性事实理解(关键词识别)",
"多信息整合",
"干扰抑制 / 语用推断(否定与纠错)"
]
def parse_args():
parser = argparse.ArgumentParser(description="Generate Listening Drag & Drop questions")
parser.add_argument("--knowledge", required=True, help="知识点列表,分号分隔")
parser.add_argument("--difficulty", required=True, choices=["A", "B", "C", "D"], help="难度等级")
parser.add_argument("--names", required=True, help="人名列表,逗号分隔")
parser.add_argument("--shuffled_names", required=True, help="打乱后的人名列表,逗号分隔")
return parser.parse_args()
def load_word_list() -> List[str]:
"""加载L1单词库"""
try:
with open(WORD_LIST_PATH, "r", encoding="utf-8") as f:
data = json.load(f)
return [word["word"].lower() for word in data["words"]]
except Exception as e:
print(f"警告:加载单词库失败,跳过超纲校验:{str(e)}", file=sys.stderr)
return []
def validate_knowledge_with_wordlist(knowledge: str, word_list: List[str]) -> bool:
"""校验知识点是否在单词库中"""
if not word_list:
return True
knowledge_words = [item.split()[0].lower() for item in knowledge.split(";") if item.strip()]
out_of_range = []
for word in knowledge_words:
if word not in word_list:
out_of_range.append(word)
if out_of_range:
print(f"错误以下知识点超纲不在L1单词库中{','.join(out_of_range)}", file=sys.stderr)
return False
return True
def validate_input(args) -> bool:
"""校验输入参数合法性"""
names = args.names.split(",")
shuffled_names = args.shuffled_names.split(",")
if len(names) != 5 or len(shuffled_names) !=5:
print("错误人名列表必须包含5个名字", file=sys.stderr)
return False
if set(names) != set(shuffled_names):
print("错误:打乱后的人名列表与原列表不一致", file=sys.stderr)
return False
if not args.knowledge.strip():
print("错误:知识点不能为空", file=sys.stderr)
return False
# 超纲校验
word_list = load_word_list()
if not validate_knowledge_with_wordlist(args.knowledge, word_list):
return False
return True
def generate_prompt(args) -> str:
"""生成生产prompt"""
difficulty_rule = DIFFICULTY_RULES[args.difficulty]
return f"""
你是资深K12英语教研专家严格按照以下要求生成听力拖拽题
## 难度要求
{difficulty_rule}
## 输入参数
知识点{args.knowledge}
人名列表{args.names}
打乱后人名列表{args.shuffled_names}
## 题目要求
1. 共4道小题对应P1-P4P5为干扰项
2. P3-P5为干扰组共享一个核心特征仅通过细节区分
3. Q4必须包含纠错逻辑如No, sorry/I mean或否定逻辑
4. 角色从{CHARACTERS}中选择2个不同的角色
5. 对话要求自然日常避免统一使用祈使句可使用陈述句疑问句等多种形式参考示例
One -
Girl: Look! The girl with the red shirt is happy.
Boy: Yes. Thats Julia.
Two -
Girl: Who is the girl in the yellow skirt?
Boy: Thats Sue.
Three -
Girl: The girl with the blue watch is pretty.
Boy: Thats May.
Four -
Girl: Is the boy in the white shirt Dan?
Boy: No, sorry. Thats Peter.
## 输出格式
严格按照以下格式输出不要添加任何额外内容
听力文本
One -
[角色1]: [对话指向P1]
[角色2]: Yes. Thats [Name1].
Two -
[角色1]: [对话指向P2]
[角色2]: Thats [Name2].
Three -
[角色1]: [对话指向P3从干扰组筛选]
[角色2]: Thats [Name3].
Four -
[角色1]: [对话指向P4包含纠错逻辑]
[角色2]: Oh! Thats [Name4].
图片描述
风格: 卡通简单线条
场景[符合知识点的场景]
[人物1描述] - [动作/特征]
[人物2描述] - [动作/特征]
[人物3描述] - [动作/特征]
[人物4描述] - [动作/特征]
[人物5描述] - [动作/特征]
人物顺序
[{args.names.split(',')}]
选项排序
[{args.shuffled_names.split(',')}]
任务描述
You will hear [角色1] and [角色2] talking about [场景相关内容]. Drag the names to the correct people.
选项数量
5
答案
[Name1在打乱列表中的索引,Name2索引,Name3索引,Name4索引]例如03,01,00,04
能力项
题目1 - 显性事实理解关键词识别- [Q1考察的核心知识点关键词例如blue T-shirt]
题目2 - 显性事实理解关键词识别- [Q2考察的核心知识点关键词例如red dress]
题目3 - 多信息整合 - [Q3考察的组合知识点关键词例如pink hairband + white skirt]
题目4 - 干扰抑制 / 语用推断否定与纠错- [Q4考察的核心知识点关键词例如green cap]
"""
def call_llm(prompt: str) -> str:
"""调用大模型生成内容(此处留空,实际使用时替换为对应模型调用逻辑)"""
# 实际生产环境替换为模型API调用
print("请输入模型生成的内容:")
return sys.stdin.read()
def validate_output(output: str, original_names: List[str], shuffled_names: List[str]) -> bool:
"""校验输出格式合法性"""
# 检查必填字段是否存在
required_sections = ["【听力文本】", "【图片描述】", "【人物顺序】", "【选项排序】", "【任务描述】", "【选项数量】", "【答案】", "【能力项】"]
for section in required_sections:
if section not in output:
print(f"错误:缺少必填字段{section}", file=sys.stderr)
return False
# 校验人物顺序格式
person_order_match = re.search(r"【人物顺序】\s*\[(.*)\]", output)
if not person_order_match:
print("错误:人物顺序格式不正确", file=sys.stderr)
return False
person_order = [name.strip().strip("'\"") for name in person_order_match.group(1).split(",")]
if person_order != original_names:
print(f"错误:人物顺序与输入人名列表不一致,预期:{original_names},实际:{person_order}", file=sys.stderr)
return False
# 校验选项排序格式
option_order_match = re.search(r"【选项排序】\s*\[(.*)\]", output)
if not option_order_match:
print("错误:选项排序格式不正确", file=sys.stderr)
return False
option_order = [name.strip().strip("'\"") for name in option_order_match.group(1).split(",")]
if option_order != shuffled_names:
print(f"错误:选项排序与输入打乱后的人名列表不一致,预期:{shuffled_names},实际:{option_order}", file=sys.stderr)
return False
# 校验答案格式
answer_match = re.search(r"【答案】\s*([\d,]+)", output)
if not answer_match:
print("错误:答案格式不正确", file=sys.stderr)
return False
answers = answer_match.group(1).split(",")
if len(answers) !=4:
print("错误答案必须包含4个索引", file=sys.stderr)
return False
for ans in answers:
if not ans.isdigit() or int(ans) <0 or int(ans)>=5:
print(f"错误:答案索引{ans}不合法", file=sys.stderr)
return False
# 校验答案对应的人名是否在列表中
for ans in answers:
idx = int(ans)
if idx >= len(shuffled_names):
print(f"错误:答案索引{idx}超出范围", file=sys.stderr)
return False
# 校验能力项格式
ability_pattern = r"【能力项】\s*题目1 - .* - .*\s*题目2 - .* - .*\s*题目3 - .* - .*\s*题目4 - .* - .*"
if not re.search(ability_pattern, output, re.DOTALL):
print("错误能力项格式不正确必须按以下格式分行列出题目N - 能力标签 - 考察知识点", file=sys.stderr)
return False
return True
def main():
args = parse_args()
if not validate_input(args):
sys.exit(1)
prompt = generate_prompt(args)
output = call_llm(prompt)
original_names = args.names.split(",")
shuffled_names = args.shuffled_names.split(",")
if validate_output(output, original_names, shuffled_names):
print(output)
sys.exit(0)
else:
sys.exit(1)
if __name__ == "__main__":
main()