kids-english-script-product.../kids-english-script-production/assets/调优指南.md

2.4 KiB
Raw Permalink Blame History

英文台词生产技能调优指南

📌 核心原则

所有调优无需修改代码/核心Prompt仅需修改assets/目录下的yaml配置文件改完立即生效,核心生成策略完全不变,避免人为改动导致规则混乱。


📁 可修改配置文件说明

文件名 作用 修改场景
assets/expression_map.yaml 表达映射配置 需要调整情绪词、口语同义替换、拆分规则时修改
assets/prompt_config.yaml 生成效果配置 需要调整生成灵活度、自然化开关、剧本忠实度时修改
assets/validation_config.yaml 校验规则配置 需要调整校验严格程度、超纲词阈值、AR等级允许比例时修改
assets/stage_config.yaml 难度等级配置 需要调整各Stage的词汇、句法、句长要求时修改
assets/sci_fi_map.yaml 科幻词映射配置 需要新增/修改科幻词汇降级规则时修改
references/l1_word_list.json L1核心词表 需要更新L1词汇白名单时修改

🔧 常见调优场景示例

1. 想把"天呐"的默认表达从"Oh my"改成"Wow"

修改assets/expression_map.yaml里的emotion_map

emotion_map:
  天呐: Wow # 原来的Oh my改成Wow即可

2. 想关闭长句拆分,让句子更连贯

修改assets/prompt_config.yaml里的naturalization

naturalization:
  enable_long_sentence_split: false # 把true改成false

3. 想提高S1阶段允许的超纲词比例到10%

修改assets/validation_config.yaml里的vocab_validation

vocab_validation:
  S1_allow_OOV_ratio: 0.1 # 从0.05改成0.1

4. 想让生成的内容更灵活,不那么死板

修改assets/prompt_config.yaml里的temperature

temperature:
  S2: 0.4 # 从0.3改成0.4数值越高越灵活最高不要超过0.7

5. 想新增一个科幻词的降级规则

修改assets/sci_fi_map.yaml,在末尾加一行:

new_sci_word: "儿童易懂的表达"

⚠️ 注意事项

  1. 所有yaml文件必须严格遵守yaml格式缩进用2个空格不要用tab否则会加载失败
  2. 核心规则(禁止新增/删减原剧本内容)建议不要修改,避免输出不符合要求
  3. 修改配置后可以先拿样例剧本测试效果,没问题再批量使用
  4. 配置改乱了可以直接用备份的默认配置覆盖,恢复出厂设置