auto backup 2026-04-25 08:10:01

refactor: 拆分 user-feedback-collector 为数据获取层和数据处理层
- user-feedback-data-source: 原始数据来源、采集、表结构、查询（技术负责人维护） - user-feedback-processor: 分类、优先级、统计、报告（产品经理使用） - 旧 skill 归档到 backup/
2026-04-25 08:10:01 +08:00 · 2026-04-24 10:59:32 +08:00 · 2026-04-24 10:52:06 +08:00
7 changed files with 400 additions and 3 deletions
--- a/.vala_skill_hashes
+++ b/.vala_skill_hashes
@ -12,3 +12,5 @@ vala_git_workspace_backup.vala 4cf352bec88fe84af065ba1ffcbb06647b77df0e01860faaf
 tencent-cos-upload 172517ed41d06c48425cd961ec5972a48495cfd62ec588bc1c2912ddf31b3a06
 feishu-group-msg-sync c6e6e1007f417d76582bd7f7e10da063313f2ae93f9d7ee54f629a3642c66a74
 user-feedback-collector c0320451bf7ea0ce3d8ceaa603ae0a7b55c373c048363a5142258a4c23f45e81
 user-feedback-data-source a95eb9142f3019fd193c46f89147dc7e0bf01dfe250202565a86f8bc52f37b13
 user-feedback-processor 3bc199b29eaec4e20d7904ae13e006276532145d203df92718cbf3197825bc44
--- a/backup/user-feedback-collector-archived/SKILL.md
+++ b/backup/user-feedback-collector-archived/SKILL.md
--- a/data/last_wechat_sync_id
+++ b/data/last_wechat_sync_id
@ -1 +1 @@
-634
+714
--- a/memory/2026-04-24-request-timed-out-before-a-res.md
+++ b/memory/2026-04-24-request-timed-out-before-a-res.md
@ -0,0 +1,57 @@
 # Session: 2026-04-24 03:21:24 UTC
 - **Session Key**: agent:xiaokui:feishu:direct:ou_088ee79216826be4a24af44f7268f880
 - **Session ID**: 69c82899-33f7-4a72-8cd8-859d22706da4
 - **Source**: feishu
 ## Conversation Summary
 assistant: ✅ New session started · model: cloudsway/MaaS_Cl_Opus_4.6_20260205_cache (default: volcengine/doubao-seed-2-0-pro-260215)
 user: System: [2026-04-24 11:16:52 GMT+8] Feishu[xiaokui] DM | 李若松 (ou_088ee79216826be4a24af44f7268f880) [msg:om_x100b519a44f834a4b2a8e87267a838f]
 A new session was started via /new or /reset. Run your Session Startup sequence - read the required files before responding to the user. Then greet the user in your configured persona, if one is provided. Be yourself - use your defined voice, mannerisms, and mood. Keep it to 1-3 sentences and ask what they want to do. If the runtime model differs from default_model in the system prompt, mention the default model. Do not mention internal steps, files, tools, or reasoning.
 Current time: Friday, April 24th, 2026 — 11:17 AM (Asia/Shanghai) / 2026-04-24 03:17 UTC
 assistant: 
 Let me run through my startup sequence.
 assistant: Now let me confirm the sender's identity.
 assistant: 当前对话者是李若松（ou_088ee79216826be4a24af44f7268f880），对应 USER.md 中的技术负责人，user_id `4aagb443`，拥有最高权限。身份确认完毕。
 若松，周五上午好。当前会话用的是 Opus 4.6 模型，日常默认模型是豆包 seed-2.0-pro。有什么需要处理的？
 user: System: [2026-04-24 11:17:42 GMT+8] Feishu[xiaokui] DM | 李若松 (ou_088ee79216826be4a24af44f7268f880) [msg:om_x100b519a450e38b0b3c6dfeb5ddc429]
 Conversation info (untrusted metadata):
 ```json
 {
  "message_id": "om_x100b519a450e38b0b3c6dfeb5ddc429",
  "sender_id": "ou_088ee79216826be4a24af44f7268f880",
  "sender": "李若松",
  "timestamp": "Fri 2026-04-24 11:17 GMT+8"
 }
 ```
 Sender (untrusted metadata):
 ```json
 {
  "label": "李若松 (ou_088ee79216826be4a24af44f7268f880)",
  "id": "ou_088ee79216826be4a24af44f7268f880",
  "name": "李若松"
 }
 ```
 看看今天   飞书 和 微信   的 用户反馈消息  有多少条
 assistant: 
 我来查询今天两个渠道的用户反馈消息数量。
 assistant: 今天（4月24日）两个渠道的反馈消息都是 **0 条**：
 | 渠道 | 今日消息数 |
 |------|-----------|
 | 飞书「内容测试问题反馈」群 | 0 |
 | 微信「用户火线救火」群 | 0 |
 两点补充：
 1. 飞书群消息同步是定时任务（每天8次，整点同步），如果今天有新消息但还没到同步时间点，可能存在延迟。
 2. 微信群是每分钟同步，基本实时，0 条说明今天确实没有微信端反馈。
 需要我拉一下最近几天的数据趋势看看吗？
--- a/scripts/run_lark_group_sync.sh
+++ b/scripts/run_lark_group_sync.sh
@ -2,9 +2,11 @@
 # 飞书群消息同步到MySQL - 定时执行脚本
 # crontab: 每4小时执行一次
 # 0 */4 * * * /root/.openclaw/workspace-xiaokui/scripts/run_lark_group_sync.sh >> /var/log/lark_group_sync.log 2>&1
 #
 # 2026-04-24 修复：改用新版脚本（支持 quote_message_id / parent_id / root_id）
 # 旧脚本 scripts/sync_lark_group_to_mysql.py 不再使用
 export PATH="/root/.nvm/versions/node/v24.14.0/bin:$PATH"
 export LARK_SYNC_DB_PASS='xhuBx7d@uT2gUVv'
 cd /root/.openclaw/workspace-xiaokui
-python3 scripts/sync_lark_group_to_mysql.py
+python3 skills/feishu-group-msg-sync/scripts/sync_group_to_mysql.py
--- a/skills/user-feedback-data-source/SKILL.md
+++ b/skills/user-feedback-data-source/SKILL.md
@ -0,0 +1,187 @@
 ---
 name: user-feedback-data-source
 description: |
  用户反馈原始数据获取层。定义所有反馈数据的来源、存储位置、表结构和查询方式。
  支持三类数据源：
  1. 主动上报：用户发送"用户反馈:"开头的消息，实时记录到飞书知识库
  2. 飞书内部反馈群：「内容测试问题反馈」群消息，定时同步到 MySQL
  3. 微信用户反馈群：「用户火线救火」群消息，实时存储到 MySQL
  **当以下情况时使用此 Skill**：
  (1) 需要了解反馈数据从哪来、存在哪、什么结构
  (2) 需要查询原始反馈数据（飞书群/微信群/主动上报）
  (3) 需要维护数据采集脚本或定时任务
  (4) 用户发送"用户反馈:"开头的消息，需要记录
  (5) 被 user-feedback-processor 技能引用，作为数据源说明
 ---
 # 用户反馈数据获取
 本技能定义用户反馈的**原始数据来源**、存储方式和查询接口。是反馈处理流程的底层数据层。
 > **维护负责人：** 技术负责人（李若松）
 > **下游消费者：** `user-feedback-processor` 技能（产品经理使用）
 ## 数据源总览
 | 反馈渠道 | 来源 | 存储位置 | 更新频率 |
 |---------|------|----------|----------|
 | 主动上报 | 用户发送 `用户反馈:` 前缀消息 | 飞书知识库文档 | 实时 |
 | 飞书内部测试反馈 | 「内容测试问题反馈」群（`oc_fabff7672e62a9ced7b326ee4a286c26`） | MySQL：`vala_test.lark_group_message` | 每天 8 次（08/10/12/14/16/18/20/22 点） |
 | 微信用户反馈 | 「用户火线救火」群 | MySQL：`vala_test.wechat_group_message` | 实时（每分钟同步） |
 ## 数据源一：主动上报
 ### 触发条件
 用户消息以 `用户反馈:` 或 `用户反馈：` 开头。
 ### 执行流程
 1. **提取反馈正文** — 去掉前缀，去除前后空白
 2. **总结梳理** — 提炼核心观点，保留关键事实和诉求，不超过 300 字；原文条理清晰则保持原文
 3. **获取提交人** — 通过 `sender_id` 调用 `feishu_get_user` 获取姓名
 4. **追加写入文档** — Bot 身份写入知识库文档：
   ```bash
   LARKSUITE_CLI_CONFIG_DIR=/root/.openclaw/credentials/xiaokui \
     lark-cli docs +update --doc NVCRdIChwot7oPxcpopcBFMOned --as bot --mode append \
     --markdown '<写入内容>'
   ```
 5. **确认回复** — 成功：「✅ 反馈已记录，感谢！」；失败：告知具体错误
 ### 写入格式
 ```markdown
 ---
 **📅 时间：** YYYY-MM-DD HH:mm
 **👤 提交人：** <用户姓名>
 **📝 反馈摘要：**
 <总结梳理后的内容，不超过300字>
 **💬 原始反馈：**
 <反馈原文>
 ```
 - 时间使用 Asia/Shanghai 时区
 - 文档为空时先写标题 `# 📋 用户反馈记录`，首条不需要开头分割线
 ### 存储位置
 - **文档标题：** 用户反馈问题汇总
 - **Wiki Token：** `ApVZw0fxGiv48ekuRS8cIfUjnRf`
 - **知识空间 ID：** `7612229802338045122`
 ## 数据源二：飞书内部测试反馈群
 ### 采集方式
 定时脚本 `feishu-group-msg-sync` 以 Bot 身份拉取群消息，媒体文件上传到腾讯 COS，所有记录写入 MySQL。
 - **定时任务：** `scripts/run_lark_group_sync.sh`（crontab 每天 8 次）
 - **底层脚本：** `skills/feishu-group-msg-sync/scripts/sync_group_to_mysql.py`
 - **同步状态文件：** `/tmp/last_feishu_feedback_sync_time`
 ### 数据库表：`vala_test.lark_group_message`
 | 字段 | 类型 | 说明 |
 |------|------|------|
 | id | bigint unsigned | 自增主键 |
 | chat_id | varchar(128) | 群聊 ID |
 | chat_name | varchar(255) | 群聊名称 |
 | sender_id | varchar(128) | 发送者 open_id |
 | sender_name | varchar(255) | 发送者姓名 |
 | message_id | varchar(128) | 飞书消息 ID（`om_xxx`），唯一索引 |
 | parent_id | varchar(128) | 父消息 ID（thread） |
 | root_id | varchar(128) | 根消息 ID（thread） |
 | quote_message_id | varchar(128) | 引用消息 ID（回复引用） |
 | msg_type | varchar(32) | 消息类型（text/post/image/media/audio/file/sticker） |
 | content | text | 文本内容或描述 |
 | media_url | varchar(1024) | 媒体文件 COS URL |
 | msg_time | datetime | 消息时间 |
 | msg_timestamp | bigint | 消息时间戳（毫秒） |
 | collected_at | datetime | 入库时间 |
 ### 查询示例
 ```sql
 -- 查询最近 7 天的飞书反馈
 SELECT sender_name, msg_type, content, media_url, msg_time
 FROM lark_group_message 
 WHERE chat_id = 'oc_fabff7672e62a9ced7b326ee4a286c26'
  AND msg_time >= DATE_SUB(NOW(), INTERVAL 7 DAY)
 ORDER BY msg_timestamp DESC;
 -- 查询某条消息的完整对话链（原消息 + 所有回复）
 SELECT message_id, sender_name, content, msg_time,
       IF(quote_message_id IS NULL, '原消息', '↳ 回复') AS role
 FROM lark_group_message 
 WHERE message_id = '<target_id>' OR quote_message_id = '<target_id>'
 ORDER BY msg_timestamp;
 ```
 ## 数据源三：微信用户反馈群
 ### 采集方式
 微信群消息通过外部同步工具实时写入 MySQL，每分钟增量同步。
 - **定时任务：** `scripts/sync_wechat_feedback_minutely.py`（crontab 每分钟）
 ### 数据库表：`vala_test.wechat_group_message`
 | 字段 | 类型 | 说明 |
 |------|------|------|
 | svr_msg_id | bigint | 消息唯一 ID |
 | sender_name | varchar(255) | 发送者昵称 |
 | msg_type | int | 消息类型 |
 | content | text | 文本内容 |
 | media_url | varchar(1024) | 媒体文件 URL |
 | refer_msg_svrid | bigint | 引用消息 ID（回复引用） |
 | msg_time | datetime | 消息时间 |
 | msg_timestamp | bigint | 消息时间戳（毫秒） |
 ### 查询示例
 ```sql
 -- 查询最近 7 天的微信反馈
 SELECT sender_name, msg_type, content, media_url, msg_time
 FROM wechat_group_message 
 WHERE msg_time >= DATE_SUB(NOW(), INTERVAL 7 DAY)
 ORDER BY msg_timestamp DESC;
 -- 查询完整对话链
 SELECT svr_msg_id, sender_name, content, msg_time,
       IF(refer_msg_svrid IS NULL, '原消息', '↳ 回复') AS role
 FROM wechat_group_message 
 WHERE svr_msg_id = <target_id> OR refer_msg_svrid = <target_id>
 ORDER BY msg_timestamp;
 ```
 ## 引用回复关系（跨渠道对照）
 | 说明 | 飞书 `lark_group_message` | 微信 `wechat_group_message` |
 |------|---------------------------|------------------------------|
 | 消息唯一 ID | `message_id`（varchar, `om_xxx`） | `svr_msg_id`（bigint） |
 | 被引用消息 ID | `quote_message_id`（varchar） | `refer_msg_svrid`（bigint） |
 | 判断是否为回复 | `quote_message_id IS NOT NULL` | `refer_msg_svrid IS NOT NULL` |
 ## 数据库连接信息
 - **主机：** `bj-cdb-8frbdwju.sql.tencentcdb.com`
 - **端口：** `25413`
 - **用户：** `chatbot`
 - **密码：** 见 `secrets.env`
 - **数据库：** `vala_test`
 - **权限：** 查询操作默认只读
 ## 注意事项
 - 所有飞书操作使用 Bot 身份（`--as bot`），不触发用户授权
 - 反馈数据为原始数据，不做分类和优先级判定（由下游 `user-feedback-processor` 处理）
 - 任何人都可以提交主动上报反馈，无权限限制
 - 数据采集脚本和定时任务的维护由技术负责人负责
--- a/skills/user-feedback-processor/SKILL.md
+++ b/skills/user-feedback-processor/SKILL.md
@ -0,0 +1,149 @@
 ---
 name: user-feedback-processor
 description: |
  用户反馈数据处理层。基于 user-feedback-data-source 技能提供的原始数据，进行分类、优先级评估、统计分析、报告生成和跟进管理。
  **当以下情况时使用此 Skill**：
  (1) 需要对反馈进行分类、评估优先级
  (2) 需要生成反馈统计报告（日报/周报/月报）
  (3) 需要汇总多渠道反馈到统一表格
  (4) 需要查询反馈处理进度、跟进状态
  (5) 用户提到"反馈统计"、"反馈报告"、"反馈分类"、"问题优先级"
 ---
 # 用户反馈数据处理
 本技能负责对用户反馈进行**分类、分析和跟进管理**。原始数据由 `user-feedback-data-source` 技能提供。
 > **使用者：** 产品经理及业务负责人
 > **数据来源：** 依赖 `user-feedback-data-source` 技能（技术负责人维护）
 ## 数据来源
 **不要直接操作数据采集逻辑。** 原始数据的来源、存储和采集由 `user-feedback-data-source` 技能定义和维护。
 ### 可用数据源速查
 | 渠道 | 数据库表 | 关键字段 | 更新频率 |
 |------|---------|---------|----------|
 | 飞书内部测试反馈 | `vala_test.lark_group_message` | sender_name, content, media_url, msg_time, quote_message_id | 每天 8 次 |
 | 微信用户反馈 | `vala_test.wechat_group_message` | sender_name, content, media_url, msg_time, refer_msg_svrid | 实时 |
 | 主动上报 | 飞书知识库文档（Wiki Token: `ApVZw0fxGiv48ekuRS8cIfUjnRf`） | — | 实时 |
 > 完整表结构和查询示例请参考 `user-feedback-data-source` 技能。
 ## 反馈处理流程
 ### 1. 分类
 将原始反馈按以下维度分类：
 | 维度 | 分类选项 |
 |------|---------|
 | 问题所属模块 | 启动/运行、版本/更新、声音/音频、语音识别/判分、关卡/内容、UI显示、其他 |
 | 问题所属类型 | Bug、体验问题、功能建议、内容问题、兼容性问题、其他 |
 | 反馈渠道 | 飞书群、微信群、主动上报 |
 ### 2. 优先级评估
 | 优先级 | 定义 | 对应问题分类 |
 |--------|------|-------------|
 | P0 | 阻断使用 / 大面积影响 / 严重数据问题 | 启动/运行异常问题 |
 | P1 | 核心流程问题，影响较大 | 版本/更新问题、声音/音频问题、语音识别/判分问题、关卡/内容问题 |
 | P2 | 一般问题或体验问题 | UI显示问题、用户反馈问题、带媒体的问题 |
 | P3 | 建议/优化项，低影响 | 其他问题 |
 ### 3. 汇总到标准表格
 将多渠道反馈统一汇总到标准格式：
 | 序号 | 评估后优先级 | 问题所属模块 | 问题所属类型 | 反馈时间 | 反馈渠道 | 提交人 | 用户电话 | 用户角色ID | 文字描述 | 提交图片 | 提交视频 | 备注 | 当前解决进度 | 问题跟进人 |
 |------|-------------|-------------|-------------|---------|---------|--------|---------|-----------|---------|---------|---------|------|------------|-----------|
 | | P0-P3 | | | | 飞书群/微信群/主动上报 | | | | | | | | 待确认/处理中/已解决 | |
 #### 飞书渠道字段映射
 | 飞书原始字段 | 标准表格字段 | 映射规则 |
 |-------------|-------------|---------|
 | msg_time | 反馈时间 | 直接填写，Asia/Shanghai 时区 |
 | sender_name | 提交人 | 直接填写 |
 | msg_type | — | 判断写入哪一列：text→文字描述，image→提交图片，media→提交视频 |
 | content / media_url | 文字描述/提交图片/提交视频 | 根据 msg_type 写入对应列 |
 | — | 反馈渠道 | 固定填写「飞书群」 |
 | — | 当前解决进度 | 默认「待确认」 |
 #### 微信渠道字段映射
 | 微信原始字段 | 标准表格字段 | 映射规则 |
 |-------------|-------------|---------|
 | msg_time | 反馈时间 | 直接填写 |
 | sender_name | 提交人 | 直接填写 |
 | msg_type | — | 同飞书逻辑 |
 | content / media_url | 文字描述/提交图片/提交视频 | 根据 msg_type 写入对应列 |
 | — | 反馈渠道 | 固定填写「微信群」 |
 | — | 当前解决进度 | 默认「待确认」 |
 ## 统计分析
 ### 支持的统计维度
 | 统计类型 | 说明 |
 |---------|------|
 | 按时间 | 日/周/月反馈数量趋势 |
 | 按渠道 | 飞书 vs 微信 vs 主动上报 的反馈量对比 |
 | 按优先级 | P0-P3 各级别的数量分布 |
 | 按模块 | 各模块的反馈量排名 |
 | TOP 问题 | 被回复最多的消息（热门问题） |
 | 处理进度 | 待确认/处理中/已解决 的比例 |
 ### 跨渠道统计查询示例
 ```sql
 -- 最近 7 天各渠道反馈量
 SELECT '飞书' AS channel, COUNT(*) AS count FROM lark_group_message 
 WHERE msg_time >= DATE_SUB(NOW(), INTERVAL 7 DAY)
 UNION ALL
 SELECT '微信', COUNT(*) FROM wechat_group_message 
 WHERE msg_time >= DATE_SUB(NOW(), INTERVAL 7 DAY);
 -- 飞书热门问题（被回复最多）
 SELECT m.message_id, m.sender_name, m.content, COUNT(r.id) AS reply_count
 FROM lark_group_message m
 JOIN lark_group_message r ON r.quote_message_id = m.message_id
 WHERE m.msg_time >= DATE_SUB(NOW(), INTERVAL 7 DAY)
 GROUP BY m.message_id ORDER BY reply_count DESC LIMIT 10;
 ```
 ## 报告生成
 ### 每日反馈推送
 - **时间：** 每日上午 9:30
 - **推送对象：** 业务负责人刘新玉
 - **内容：** 前一天所有渠道新增反馈汇总
 ### 周报/月报
 按需生成，包含：
 - 反馈总量及趋势
 - 按优先级/模块/渠道分布
 - TOP 问题列表
 - 处理进度统计
 - 同步到飞书知识库文档
 ## 目标存储位置
 ### 全量反馈汇总知识库文档
 - **文档标题：** 用户反馈问题汇总
 - **Wiki Token：** `ApVZw0fxGiv48ekuRS8cIfUjnRf`
 - **知识空间 ID：** `7612229802338045122`
 ### 全量反馈汇总多维表格（待上线）
 将三个数据源的反馈统一汇总到飞书多维表格，支持分类、筛选、统计和跟进。
 ## 注意事项
 - **只消费数据，不修改采集逻辑** — 数据采集的任何问题请联系技术负责人
 - 数据库查询默认只读
 - 所有飞书操作使用 Bot 身份，不触发用户授权
 - 分类和优先级判定可能需要人工确认，自动判定结果仅供参考