refactor: 拆分 user-feedback-collector 为数据获取层和数据处理层

- user-feedback-data-source: 原始数据来源、采集、表结构、查询（技术负责人维护） - user-feedback-processor: 分类、优先级、统计、报告（产品经理使用） - 旧 skill 归档到 backup/
2026-04-24 10:59:32 +08:00 · 2026-04-24 10:59:32 +08:00 · 6dee41a195
commit 6dee41a195
parent 8384c25319
3 changed files with 336 additions and 0 deletions
--- a/backup/user-feedback-collector-archived/SKILL.md
+++ b/backup/user-feedback-collector-archived/SKILL.md
--- a/skills/user-feedback-data-source/SKILL.md
+++ b/skills/user-feedback-data-source/SKILL.md
@ -0,0 +1,187 @@
+---
+name: user-feedback-data-source
+description: |
+  用户反馈原始数据获取层。定义所有反馈数据的来源、存储位置、表结构和查询方式。
+  支持三类数据源：
+  1. 主动上报：用户发送"用户反馈:"开头的消息，实时记录到飞书知识库
+  2. 飞书内部反馈群：「内容测试问题反馈」群消息，定时同步到 MySQL
+  3. 微信用户反馈群：「用户火线救火」群消息，实时存储到 MySQL
+  
+  **当以下情况时使用此 Skill**：
+  (1) 需要了解反馈数据从哪来、存在哪、什么结构
+  (2) 需要查询原始反馈数据（飞书群/微信群/主动上报）
+  (3) 需要维护数据采集脚本或定时任务
+  (4) 用户发送"用户反馈:"开头的消息，需要记录
+  (5) 被 user-feedback-processor 技能引用，作为数据源说明
+---
+
+# 用户反馈数据获取
+
+本技能定义用户反馈的**原始数据来源**、存储方式和查询接口。是反馈处理流程的底层数据层。
+
+> **维护负责人：** 技术负责人（李若松）
+> **下游消费者：** `user-feedback-processor` 技能（产品经理使用）
+
+## 数据源总览
+
+| 反馈渠道 | 来源 | 存储位置 | 更新频率 |
+|---------|------|----------|----------|
+| 主动上报 | 用户发送 `用户反馈:` 前缀消息 | 飞书知识库文档 | 实时 |
+| 飞书内部测试反馈 | 「内容测试问题反馈」群（`oc_fabff7672e62a9ced7b326ee4a286c26`） | MySQL：`vala_test.lark_group_message` | 每天 8 次（08/10/12/14/16/18/20/22 点） |
+| 微信用户反馈 | 「用户火线救火」群 | MySQL：`vala_test.wechat_group_message` | 实时（每分钟同步） |
+
+## 数据源一：主动上报
+
+### 触发条件
+
+用户消息以 `用户反馈:` 或 `用户反馈：` 开头。
+
+### 执行流程
+
+1. **提取反馈正文** — 去掉前缀，去除前后空白
+2. **总结梳理** — 提炼核心观点，保留关键事实和诉求，不超过 300 字；原文条理清晰则保持原文
+3. **获取提交人** — 通过 `sender_id` 调用 `feishu_get_user` 获取姓名
+4. **追加写入文档** — Bot 身份写入知识库文档：
+   ```bash
+   LARKSUITE_CLI_CONFIG_DIR=/root/.openclaw/credentials/xiaokui \
+     lark-cli docs +update --doc NVCRdIChwot7oPxcpopcBFMOned --as bot --mode append \
+     --markdown '<写入内容>'
+   ```
+5. **确认回复** — 成功：「✅ 反馈已记录，感谢！」；失败：告知具体错误
+
+### 写入格式
+
+```markdown
+---
+
+**📅 时间：** YYYY-MM-DD HH:mm
+
+**👤 提交人：** <用户姓名>
+
+**📝 反馈摘要：**
+
+<总结梳理后的内容，不超过300字>
+
+**💬 原始反馈：**
+
+<反馈原文>
+```
+
+- 时间使用 Asia/Shanghai 时区
+- 文档为空时先写标题 `# 📋 用户反馈记录`，首条不需要开头分割线
+
+### 存储位置
+
+- **文档标题：** 用户反馈问题汇总
+- **Wiki Token：** `ApVZw0fxGiv48ekuRS8cIfUjnRf`
+- **知识空间 ID：** `7612229802338045122`
+
+## 数据源二：飞书内部测试反馈群
+
+### 采集方式
+
+定时脚本 `feishu-group-msg-sync` 以 Bot 身份拉取群消息，媒体文件上传到腾讯 COS，所有记录写入 MySQL。
+
+- **定时任务：** `scripts/run_lark_group_sync.sh`（crontab 每天 8 次）
+- **底层脚本：** `skills/feishu-group-msg-sync/scripts/sync_group_to_mysql.py`
+- **同步状态文件：** `/tmp/last_feishu_feedback_sync_time`
+
+### 数据库表：`vala_test.lark_group_message`
+
+| 字段 | 类型 | 说明 |
+|------|------|------|
+| id | bigint unsigned | 自增主键 |
+| chat_id | varchar(128) | 群聊 ID |
+| chat_name | varchar(255) | 群聊名称 |
+| sender_id | varchar(128) | 发送者 open_id |
+| sender_name | varchar(255) | 发送者姓名 |
+| message_id | varchar(128) | 飞书消息 ID（`om_xxx`），唯一索引 |
+| parent_id | varchar(128) | 父消息 ID（thread） |
+| root_id | varchar(128) | 根消息 ID（thread） |
+| quote_message_id | varchar(128) | 引用消息 ID（回复引用） |
+| msg_type | varchar(32) | 消息类型（text/post/image/media/audio/file/sticker） |
+| content | text | 文本内容或描述 |
+| media_url | varchar(1024) | 媒体文件 COS URL |
+| msg_time | datetime | 消息时间 |
+| msg_timestamp | bigint | 消息时间戳（毫秒） |
+| collected_at | datetime | 入库时间 |
+
+### 查询示例
+
+```sql
+-- 查询最近 7 天的飞书反馈
+SELECT sender_name, msg_type, content, media_url, msg_time
+FROM lark_group_message 
+WHERE chat_id = 'oc_fabff7672e62a9ced7b326ee4a286c26'
+  AND msg_time >= DATE_SUB(NOW(), INTERVAL 7 DAY)
+ORDER BY msg_timestamp DESC;
+
+-- 查询某条消息的完整对话链（原消息 + 所有回复）
+SELECT message_id, sender_name, content, msg_time,
+       IF(quote_message_id IS NULL, '原消息', '↳ 回复') AS role
+FROM lark_group_message 
+WHERE message_id = '<target_id>' OR quote_message_id = '<target_id>'
+ORDER BY msg_timestamp;
+```
+
+## 数据源三：微信用户反馈群
+
+### 采集方式
+
+微信群消息通过外部同步工具实时写入 MySQL，每分钟增量同步。
+
+- **定时任务：** `scripts/sync_wechat_feedback_minutely.py`（crontab 每分钟）
+
+### 数据库表：`vala_test.wechat_group_message`
+
+| 字段 | 类型 | 说明 |
+|------|------|------|
+| svr_msg_id | bigint | 消息唯一 ID |
+| sender_name | varchar(255) | 发送者昵称 |
+| msg_type | int | 消息类型 |
+| content | text | 文本内容 |
+| media_url | varchar(1024) | 媒体文件 URL |
+| refer_msg_svrid | bigint | 引用消息 ID（回复引用） |
+| msg_time | datetime | 消息时间 |
+| msg_timestamp | bigint | 消息时间戳（毫秒） |
+
+### 查询示例
+
+```sql
+-- 查询最近 7 天的微信反馈
+SELECT sender_name, msg_type, content, media_url, msg_time
+FROM wechat_group_message 
+WHERE msg_time >= DATE_SUB(NOW(), INTERVAL 7 DAY)
+ORDER BY msg_timestamp DESC;
+
+-- 查询完整对话链
+SELECT svr_msg_id, sender_name, content, msg_time,
+       IF(refer_msg_svrid IS NULL, '原消息', '↳ 回复') AS role
+FROM wechat_group_message 
+WHERE svr_msg_id = <target_id> OR refer_msg_svrid = <target_id>
+ORDER BY msg_timestamp;
+```
+
+## 引用回复关系（跨渠道对照）
+
+| 说明 | 飞书 `lark_group_message` | 微信 `wechat_group_message` |
+|------|---------------------------|------------------------------|
+| 消息唯一 ID | `message_id`（varchar, `om_xxx`） | `svr_msg_id`（bigint） |
+| 被引用消息 ID | `quote_message_id`（varchar） | `refer_msg_svrid`（bigint） |
+| 判断是否为回复 | `quote_message_id IS NOT NULL` | `refer_msg_svrid IS NOT NULL` |
+
+## 数据库连接信息
+
+- **主机：** `bj-cdb-8frbdwju.sql.tencentcdb.com`
+- **端口：** `25413`
+- **用户：** `chatbot`
+- **密码：** 见 `secrets.env`
+- **数据库：** `vala_test`
+- **权限：** 查询操作默认只读
+
+## 注意事项
+
+- 所有飞书操作使用 Bot 身份（`--as bot`），不触发用户授权
+- 反馈数据为原始数据，不做分类和优先级判定（由下游 `user-feedback-processor` 处理）
+- 任何人都可以提交主动上报反馈，无权限限制
+- 数据采集脚本和定时任务的维护由技术负责人负责
--- a/skills/user-feedback-processor/SKILL.md
+++ b/skills/user-feedback-processor/SKILL.md
@ -0,0 +1,149 @@
+---
+name: user-feedback-processor
+description: |
+  用户反馈数据处理层。基于 user-feedback-data-source 技能提供的原始数据，进行分类、优先级评估、统计分析、报告生成和跟进管理。
+  
+  **当以下情况时使用此 Skill**：
+  (1) 需要对反馈进行分类、评估优先级
+  (2) 需要生成反馈统计报告（日报/周报/月报）
+  (3) 需要汇总多渠道反馈到统一表格
+  (4) 需要查询反馈处理进度、跟进状态
+  (5) 用户提到"反馈统计"、"反馈报告"、"反馈分类"、"问题优先级"
+---
+
+# 用户反馈数据处理
+
+本技能负责对用户反馈进行**分类、分析和跟进管理**。原始数据由 `user-feedback-data-source` 技能提供。
+
+> **使用者：** 产品经理及业务负责人
+> **数据来源：** 依赖 `user-feedback-data-source` 技能（技术负责人维护）
+
+## 数据来源
+
+**不要直接操作数据采集逻辑。** 原始数据的来源、存储和采集由 `user-feedback-data-source` 技能定义和维护。
+
+### 可用数据源速查
+
+| 渠道 | 数据库表 | 关键字段 | 更新频率 |
+|------|---------|---------|----------|
+| 飞书内部测试反馈 | `vala_test.lark_group_message` | sender_name, content, media_url, msg_time, quote_message_id | 每天 8 次 |
+| 微信用户反馈 | `vala_test.wechat_group_message` | sender_name, content, media_url, msg_time, refer_msg_svrid | 实时 |
+| 主动上报 | 飞书知识库文档（Wiki Token: `ApVZw0fxGiv48ekuRS8cIfUjnRf`） | — | 实时 |
+
+> 完整表结构和查询示例请参考 `user-feedback-data-source` 技能。
+
+## 反馈处理流程
+
+### 1. 分类
+
+将原始反馈按以下维度分类：
+
+| 维度 | 分类选项 |
+|------|---------|
+| 问题所属模块 | 启动/运行、版本/更新、声音/音频、语音识别/判分、关卡/内容、UI显示、其他 |
+| 问题所属类型 | Bug、体验问题、功能建议、内容问题、兼容性问题、其他 |
+| 反馈渠道 | 飞书群、微信群、主动上报 |
+
+### 2. 优先级评估
+
+| 优先级 | 定义 | 对应问题分类 |
+|--------|------|-------------|
+| P0 | 阻断使用 / 大面积影响 / 严重数据问题 | 启动/运行异常问题 |
+| P1 | 核心流程问题，影响较大 | 版本/更新问题、声音/音频问题、语音识别/判分问题、关卡/内容问题 |
+| P2 | 一般问题或体验问题 | UI显示问题、用户反馈问题、带媒体的问题 |
+| P3 | 建议/优化项，低影响 | 其他问题 |
+
+### 3. 汇总到标准表格
+
+将多渠道反馈统一汇总到标准格式：
+
+| 序号 | 评估后优先级 | 问题所属模块 | 问题所属类型 | 反馈时间 | 反馈渠道 | 提交人 | 用户电话 | 用户角色ID | 文字描述 | 提交图片 | 提交视频 | 备注 | 当前解决进度 | 问题跟进人 |
+|------|-------------|-------------|-------------|---------|---------|--------|---------|-----------|---------|---------|---------|------|------------|-----------|
+| | P0-P3 | | | | 飞书群/微信群/主动上报 | | | | | | | | 待确认/处理中/已解决 | |
+
+#### 飞书渠道字段映射
+
+| 飞书原始字段 | 标准表格字段 | 映射规则 |
+|-------------|-------------|---------|
+| msg_time | 反馈时间 | 直接填写，Asia/Shanghai 时区 |
+| sender_name | 提交人 | 直接填写 |
+| msg_type | — | 判断写入哪一列：text→文字描述，image→提交图片，media→提交视频 |
+| content / media_url | 文字描述/提交图片/提交视频 | 根据 msg_type 写入对应列 |
+| — | 反馈渠道 | 固定填写「飞书群」 |
+| — | 当前解决进度 | 默认「待确认」 |
+
+#### 微信渠道字段映射
+
+| 微信原始字段 | 标准表格字段 | 映射规则 |
+|-------------|-------------|---------|
+| msg_time | 反馈时间 | 直接填写 |
+| sender_name | 提交人 | 直接填写 |
+| msg_type | — | 同飞书逻辑 |
+| content / media_url | 文字描述/提交图片/提交视频 | 根据 msg_type 写入对应列 |
+| — | 反馈渠道 | 固定填写「微信群」 |
+| — | 当前解决进度 | 默认「待确认」 |
+
+## 统计分析
+
+### 支持的统计维度
+
+| 统计类型 | 说明 |
+|---------|------|
+| 按时间 | 日/周/月反馈数量趋势 |
+| 按渠道 | 飞书 vs 微信 vs 主动上报 的反馈量对比 |
+| 按优先级 | P0-P3 各级别的数量分布 |
+| 按模块 | 各模块的反馈量排名 |
+| TOP 问题 | 被回复最多的消息（热门问题） |
+| 处理进度 | 待确认/处理中/已解决 的比例 |
+
+### 跨渠道统计查询示例
+
+```sql
+-- 最近 7 天各渠道反馈量
+SELECT '飞书' AS channel, COUNT(*) AS count FROM lark_group_message 
+WHERE msg_time >= DATE_SUB(NOW(), INTERVAL 7 DAY)
+UNION ALL
+SELECT '微信', COUNT(*) FROM wechat_group_message 
+WHERE msg_time >= DATE_SUB(NOW(), INTERVAL 7 DAY);
+
+-- 飞书热门问题（被回复最多）
+SELECT m.message_id, m.sender_name, m.content, COUNT(r.id) AS reply_count
+FROM lark_group_message m
+JOIN lark_group_message r ON r.quote_message_id = m.message_id
+WHERE m.msg_time >= DATE_SUB(NOW(), INTERVAL 7 DAY)
+GROUP BY m.message_id ORDER BY reply_count DESC LIMIT 10;
+```
+
+## 报告生成
+
+### 每日反馈推送
+
+- **时间：** 每日上午 9:30
+- **推送对象：** 业务负责人刘新玉
+- **内容：** 前一天所有渠道新增反馈汇总
+
+### 周报/月报
+
+按需生成，包含：
+- 反馈总量及趋势
+- 按优先级/模块/渠道分布
+- TOP 问题列表
+- 处理进度统计
+- 同步到飞书知识库文档
+
+## 目标存储位置
+
+### 全量反馈汇总知识库文档
+- **文档标题：** 用户反馈问题汇总
+- **Wiki Token：** `ApVZw0fxGiv48ekuRS8cIfUjnRf`
+- **知识空间 ID：** `7612229802338045122`
+
+### 全量反馈汇总多维表格（待上线）
+将三个数据源的反馈统一汇总到飞书多维表格，支持分类、筛选、统计和跟进。
+
+## 注意事项
+
+- **只消费数据，不修改采集逻辑** — 数据采集的任何问题请联系技术负责人
+- 数据库查询默认只读
+- 所有飞书操作使用 Bot 身份，不触发用户授权
+- 分类和优先级判定可能需要人工确认，自动判定结果仅供参考