kids-english-script-product.../kids-english-script-production/assets/调优指南.md

54 lines
2.4 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 英文台词生产技能调优指南
## 📌 核心原则
**所有调优无需修改代码/核心Prompt仅需修改`assets/`目录下的yaml配置文件改完立即生效**,核心生成策略完全不变,避免人为改动导致规则混乱。
---
## 📁 可修改配置文件说明
| 文件名 | 作用 | 修改场景 |
| ---- | ---- | ---- |
| `assets/expression_map.yaml` | 表达映射配置 | 需要调整情绪词、口语同义替换、拆分规则时修改 |
| `assets/prompt_config.yaml` | 生成效果配置 | 需要调整生成灵活度、自然化开关、剧本忠实度时修改 |
| `assets/validation_config.yaml` | 校验规则配置 | 需要调整校验严格程度、超纲词阈值、AR等级允许比例时修改 |
| `assets/stage_config.yaml` | 难度等级配置 | 需要调整各Stage的词汇、句法、句长要求时修改 |
| `assets/sci_fi_map.yaml` | 科幻词映射配置 | 需要新增/修改科幻词汇降级规则时修改 |
| `references/l1_word_list.json` | L1核心词表 | 需要更新L1词汇白名单时修改 |
---
## 🔧 常见调优场景示例
### 1. 想把"天呐"的默认表达从"Oh my"改成"Wow"
修改`assets/expression_map.yaml`里的`emotion_map`
```yaml
emotion_map:
天呐: Wow # 原来的Oh my改成Wow即可
```
### 2. 想关闭长句拆分,让句子更连贯
修改`assets/prompt_config.yaml`里的`naturalization`
```yaml
naturalization:
enable_long_sentence_split: false # 把true改成false
```
### 3. 想提高S1阶段允许的超纲词比例到10%
修改`assets/validation_config.yaml`里的`vocab_validation`
```yaml
vocab_validation:
S1_allow_OOV_ratio: 0.1 # 从0.05改成0.1
```
### 4. 想让生成的内容更灵活,不那么死板
修改`assets/prompt_config.yaml`里的`temperature`
```yaml
temperature:
S2: 0.4 # 从0.3改成0.4数值越高越灵活最高不要超过0.7
```
### 5. 想新增一个科幻词的降级规则
修改`assets/sci_fi_map.yaml`,在末尾加一行:
```yaml
new_sci_word: "儿童易懂的表达"
```
---
## ⚠️ 注意事项
1. 所有yaml文件必须严格遵守yaml格式缩进用2个空格不要用tab否则会加载失败
2. 核心规则(禁止新增/删减原剧本内容)建议不要修改,避免输出不符合要求
3. 修改配置后可以先拿样例剧本测试效果,没问题再批量使用
4. 配置改乱了可以直接用备份的默认配置覆盖,恢复出厂设置