ai_member_xiaobian/scripts/allocate_words.py
2026-04-04 08:10:01 +08:00

201 lines
7.8 KiB
Python

# 完整160词分配草稿生成
# L1-S2 U17-U24
# 格式: (单词, 词性, 词义, 原始主题)
ALL_WORDS = [
# 交通与出行 (4)
("boat", "n", "小船", "交通"),
("helicopter", "n", "直升机", "交通"),
("motorbike", "n", "摩托车", "交通"),
("ship", "n", "", "交通"),
# 人物 (8)
("child", "n", "儿童", "人物"),
("children", "n", "孩子们", "人物"),
("Chinese", "adj", "中国的", "人物"),
("kid", "n", "小孩", "人物"),
("men", "n", "男人(复数)", "人物"),
("people", "n", "", "人物"),
("person", "n", "", "人物"),
("women", "n", "女人(复数)", "人物"),
# 人物特征 (2)
("old", "adj", "年老的", "人物特征"),
("young", "adj", "年轻的", "人物特征"),
# 动作与行为 (12)
("begin", "v", "开始", "动作"),
("choose", "v", "选择", "动作"),
("complete", "v", "使完整", "动作"),
("get", "v", "收到", "动作"),
("hold", "v", "抓住", "动作"),
("know", "v", "知道", "动作"),
("pick up", "v", "捡起", "动作"),
("point", "v", "指向", "动作"),
("show", "v", "显示", "动作"),
("try", "n", "尝试", "动作"),
("understand", "v", "理解", "动作"),
("wave", "v", "挥动", "动作"),
# 动物 (2)
("crocodile", "n", "鳄鱼", "动物"),
("pet", "n", "宠物", "动物"),
# 地点与建筑 (3)
("China", "n", "中国", "地点"),
("hometown", "n", "家乡", "地点"),
("park", "n", "公园", "地点"),
# 学习用品 (4)
("eraser", "n", "橡皮擦", "学习用品"),
("pencil", "n", "铅笔", "学习用品"),
("rubber", "n", "橡皮", "学习用品"),
("ruler", "n", "尺子", "学习用品"),
# 学校生活 (13)
("blackboard", "n", "黑板", "学校"),
("Chinese", "n", "中文", "学校"),
("class", "n", "班级", "学校"),
("cross", "n", "十字标记", "学校"),
("example", "n", "例子", "学校"),
("learn", "v", "学习", "学校"),
("lesson", "n", "一节课", "学校"),
("paper", "adj", "纸质的", "学校"),
("playground", "n", "操场", "学校"),
("read", "v", "阅读", "学校"),
("subject", "n", "科目", "学校"),
("tick", "n", "对勾", "学校"),
("write", "v", "", "学校"),
# 家居与房屋 (11)
("apartment", "n", "公寓", "家居房屋"),
("bathroom", "n", "浴室", "家居房屋"),
("dining room", "n", "餐厅", "家居房屋"),
("door", "n", "", "家居房屋"),
("flat", "n", "公寓", "家居房屋"),
("hall", "n", "门厅", "家居房屋"),
("home", "adv", "回家/在家", "家居房屋"), # 虚词
("kitchen", "n", "厨房", "家居房屋"),
("living room", "n", "客厅", "家居房屋"),
("room", "n", "房间", "家居房屋"),
("toilet", "n", "厕所", "家居房屋"),
# 家居物品 (4)
("armchair", "n", "扶手椅", "家居物品"),
("bath", "n", "浴缸", "家居物品"),
("bookcase", "n", "书架", "家居物品"),
("lamp", "n", "台灯", "家居物品"),
# 家庭与朋友 (4)
("family", "n", "家庭", "家庭"),
("grandfather", "n", "祖父", "家庭"),
("grandmother", "n", "祖母", "家庭"),
("mother", "n", "母亲", "家庭"),
# 庆祝与节日 (1)
("candle", "n", "蜡烛", "庆祝"),
# 形状 (1)
("line", "n", "线", "形状"),
# 感受与情绪 (3)
("feel", "v", "感觉", "情绪"),
("sad", "adj", "悲伤的", "情绪"),
("smile", "n", "笑容", "情绪"),
# 指示和指代 (2)
("these", "det", "这些", "指代"), # 虚词
("those", "det", "那些", "指代"), # 虚词
# 数字 (1)
("number", "n", "数字", "数字"),
# 数量 (11)
("a lot", "adv", "非常", "数量"), # 虚词
("a lot", "pron", "大量", "数量"), # 虚词
("a lot of", "det", "大量的", "数量"), # 虚词
("add", "v", "添加", "数量"),
("double", "adj", "两倍的", "数量"),
("lots", "adv", "非常", "数量"), # 虚词
("lots", "pron", "大量", "数量"), # 虚词
("many", "det", "许多", "数量"), # 虚词
("one", "det", "一个", "数量"), # 虚词
("part", "n", "部分", "数量"),
("some", "det", "一些", "数量"), # 虚词
# 日常生活 (2)
("go to bed", "v", "上床睡觉", "日常"),
("go to sleep", "v", "睡觉", "日常"),
# 时间 (13)
("afternoon", "n", "下午", "时间"),
("ago", "adv", "以前", "时间"), # 虚词
("day", "n", "一天", "时间"),
("early", "adv", "早地", "时间"), # 虚词
("end", "n", "最后部分", "时间"),
("evening", "n", "晚上", "时间"),
("hour", "n", "小时", "时间"),
("minute", "n", "分钟", "时间"),
("month", "n", "", "时间"),
("now", "adv", "现在", "时间"), # 虚词
("today", "n", "今天", "时间"),
("tomorrow", "n", "明天", "时间"),
("year", "n", "", "时间"),
# 沟通与社交 (11)
("answer", "n", "答复", "沟通"),
("answer", "v", "回答", "沟通"),
("ask", "v", "询问", "沟通"),
("phone", "v", "给…打电话", "沟通"),
("question", "n", "问题", "沟通"),
("say", "v", "", "沟通"),
("speak", "v", "", "沟通"),
("talk", "v", "说话", "沟通"),
("tell", "v", "告诉", "沟通"),
("visit", "v", "拜访", "沟通"),
("want", "v", "想要", "沟通"),
# 爱好与休闲 (4)
("enjoy", "v", "享受", "爱好"),
("fun", "n", "乐趣", "爱好"),
("paint", "v", "用颜料绘画", "爱好"),
("piano", "n", "钢琴", "爱好"),
# 状态与描述 (12)
("closed", "adj", "关着的", "状态"),
("correct", "adj", "正确的", "状态"),
("English", "adj", "英格兰的", "状态"),
("fantastic", "adj", "极好的", "状态"),
("good", "adj", "好的", "状态"),
("great", "adj", "伟大的", "状态"),
("hard", "adj", "硬的", "状态"),
("interesting", "adj", "有趣的", "状态"),
("like", "prep", "", "状态"), # 虚词
("open", "adj", "开着的", "状态"),
("short", "adj", "短的", "状态"),
("silly", "adj", "愚蠢的", "状态"),
# 科技 (1)
("phone", "n", "电话", "科技"),
# 程度 (2)
("really", "adv", "真正地", "程度"), # 虚词
("very", "adv", "非常", "程度"), # 虚词
# 职业 (2)
("astronaut", "n", "宇航员", "职业"),
("job", "n", "工作", "职业"),
# 衣物与配饰 (4)
("baseball cap", "n", "棒球帽", "衣物"),
("glasses", "n", "眼镜", "衣物"),
("shoe", "n", "", "衣物"),
("wear", "v", "穿着", "衣物"),
# 购物 (3)
("bookshop", "n", "书店", "购物"),
("shop", "n", "商店", "购物"),
("store", "n", "商店", "购物"),
# 运动 (9)
("badminton", "n", "羽毛球", "运动"),
("ball", "n", "", "运动"),
("bounce", "v", "弹起", "运动"),
("hockey", "n", "曲棍球", "运动"),
("soccer", "n", "足球", "运动"),
("sport", "n", "运动", "运动"),
("table tennis", "n", "乒乓球", "运动"),
("tennis", "n", "网球", "运动"),
("tennis racket", "n", "网球拍", "运动"),
# 频率 (1)
("again", "adv", "再一次", "频率"), # 虚词
# 食物与饮品 (10)
("bean", "n", "豆,菜豆", "食物"),
("drink", "n", "饮料", "食物"),
("fruit", "n", "水果", "食物"),
("grape", "n", "葡萄", "食物"),
("kiwi", "n", "猕猴桃", "食物"),
("lime", "n", "酸橙", "食物"),
("pea", "n", "豌豆", "食物"),
("pear", "n", "", "食物"),
("pineapple", "n", "菠萝", "食物"),
("sweet(s)", "n", "糖果", "食物"),
]
print(f"总词数: {len(ALL_WORDS)}")
virtual = [(w,p,m,t) for w,p,m,t in ALL_WORDS if p in ("adv","pron","det","prep")]
print(f"虚词数: {len(virtual)}")