🤖 每日自动备份 - 2026-03-25 08:00:01

2026-03-25 08:00:01 +08:00 · 2026-03-25 08:00:01 +08:00 · 9a3840ed43
commit 9a3840ed43
parent e219736a74
5 changed files with 460 additions and 2 deletions
--- a/MEMORY.md
+++ b/MEMORY.md
@ -41,7 +41,17 @@
 - **连接信息已安全存储在 TOOLS.md**
 - **核心业务表位置：**
  - 订单表 `bi_vala_order`：线上PostgreSQL数据库 `vala_bi` 库，默认无特殊说明时查询此线上库数据
-    - 字段说明：`key_from` 代表销售渠道，可用于按渠道维度统计订单、GMV等指标**
+    - 字段说明：`key_from` 代表销售渠道，可用于按渠道维度统计订单、GMV等指标
  - 用户账户表 `bi_vala_app_account`：线上PostgreSQL数据库 `vala_bi` 库
    - 字段说明：`download_channel` 代表用户的下载渠道，用于统计新增用户的来源平台
    - 匹配规则：`download_channel`字段为汉字格式，采用「关键字包含」的匹配方式，例如学而思渠道对应`download_channel LIKE '%学而思%'`
  - 用户课程明细表 `bi_user_course_detail`：线上PostgreSQL数据库 `vala_bi` 库
    - 字段说明：
      - `account_id`：账号id/用户id
      - `user_id`：角色id
      - `course_level`：课程等级映射：A1 = L1，A2 = L2
      - `deleted_at`：课程删除时间，字段为空代表课程未被删除，有值代表课程已被删除
      - `expire_time`：课程过期时间，字段不为空代表是正式课，为空代表是体验课
 ## Business Knowledge Base
 - **已收集13个常用SQL查询模板**
@ -66,13 +76,39 @@
       - GSV：GMV 减去符合条件的订单中已完成退费的金额总和（单位：元）
       - 退费率：符合条件的订单中已完成退费的订单数 / 订单总数量 * 100%，保留1位小数
  - **渠道映射规则（key_from字段匹配）：**
-    - 端内：`app-active-h5-0-0`
+    - 端内购买：`app-active-h5-0-0` 或 `app-sales-bj-qhm-0`（两个值匹配任意一个即属于端内购买）
    - 端外购买：除上述两个端内匹配值之外的所有`key_from`值均属于端外购买
    - 端外销售渠道购买：端外购买中`key_from`以`sales-adp`开头的为销售渠道购买
    - 小红书店铺：`newmedia-dianpu-xhs-0-0`
    - 达人直播：`newmedia-daren%`（前缀匹配）
    - 万物：`newmedia-dianpu-wwxx-0-0`
  - **sale_channel字段映射规则（仅对`key_from = app-active-h5-0-0`的订单生效）：**
    | sale_channel值 | 对应渠道名称 |
    |---------------|--------------|
    | 11 | 苹果 |
    | 12 | 华为 |
    | 13 | 小米 |
    | 14 | 荣耀 |
    | 15 | 应用宝 |
    | 17 | 魅族 |
    | 18 | VIVO |
    | 19 | OPPO |
    | 21 | 学而思 |
    | 22 | 讯飞 |
    | 23 | 步步高 |
    | 24 | 作业帮 |
    | 25 | 小度 |
    | 26 | 希沃 |
    | 27 | 京东方 |
    | 41 | 官网 |
    | 71 | 小程序 |
    | 其他值 | 站外 |
  - **金额单位规则：** `bi_vala_order`表中`pay_amount`字段以元为单位，`pay_amount_int`字段以分为单位；后续统一使用`pay_amount_int`计算销售金额，统计为元时除以100即可
  - **学习数据统计维度：** 支持按单元/课时/组件维度统计完成人数、平均用时、正确率（Perfect/Good/Oops三个等级）
  - **特殊时间节点：** `2025-10-01`为核心版本上线时间，部分统计需要区分该节点前后的数据
  - **用户统计口径区分规则：**
    - 新增用户（免费注册新增）：使用`bi_vala_app_account.download_channel`字段进行分渠道统计
    - 新增付费用户：使用`bi_vala_order.sale_channel`（端内`key_from = app-active-h5-0-0`订单）或`bi_vala_order.key_from`字段进行分渠道统计
 - **学习数据计算逻辑：**
  - **课时首次完成时间计算逻辑：**
    1. 关联路径：用户ID（bi_vala_app_account.id）→ 角色ID（bi_vala_app_character.id）→ bi_user_chapter_play_record_{分表号}.user_id
--- a/generate_report.py
+++ b/generate_report.py
@ -0,0 +1,99 @@
 import pandas as pd
 import psycopg2
 # 1. 读取最新的带成交标记的订单数据
 order_df = pd.read_csv('2026年3月1日至今订单_含正确成交标记.csv')
 print(f"订单总数：{len(order_df)}")
 # 2. 计算GMV和退款相关
 order_df['GMV'] = order_df['pay_amount_int'] / 100
 order_df['is_refund'] = (order_df['order_status'] == 4).astype(int)
 # 计算GSV：退款订单GSV为0，其他为GMV
 order_df['GSV'] = order_df.apply(lambda row: 0 if row['order_status'] == 4 else row['GMV'], axis=1)
 order_df['refund_amount'] = order_df.apply(lambda row: row['GMV'] if row['order_status'] == 4 else 0, axis=1)
 # 3. 映射到大类渠道
 def map_channel(tag):
    if tag in ['销转', '销转-小龙']:
        return '销转'
    elif tag in ['端内直购', '端内销转']:
        return 'App转化'
    elif tag == '达播':
        return '达播'
    elif tag.startswith('班主任-'):
        return '班主任'
    elif tag == '店铺直购':
        return '店铺直购'
    else:
        return '其他'
 order_df['渠道大类'] = order_df['成交标记'].apply(map_channel)
 # 4. 按大类统计
 channel_stats = order_df.groupby('渠道大类').agg(
    订单数=('id', 'count'),
    GMV=('GMV', 'sum'),
    已退款金额=('refund_amount', 'sum'),
    GSV=('GSV', 'sum'),
    退款订单数=('is_refund', 'sum'),
    客单价=('GMV', 'mean')
 ).reset_index()
 channel_stats['退费率'] = (channel_stats['退款订单数'] / channel_stats['订单数'] * 100).round(1).astype(str) + '%'
 channel_stats['GMV'] = channel_stats['GMV'].round(2)
 channel_stats['GSV'] = channel_stats['GSV'].round(2)
 channel_stats['已退款金额'] = channel_stats['已退款金额'].round(2)
 channel_stats['客单价'] = channel_stats['客单价'].round(2)
 # 5. 原预测表的预测值
 pred_data = [
    {'渠道大类': '销转', '预测GSV': 100000},
    {'渠道大类': 'App转化', '预测GSV': 20000},
    {'渠道大类': '达播', '预测GSV': 250000},
    {'渠道大类': '班主任', '预测GSV': 10000}
 ]
 pred_df = pd.DataFrame(pred_data)
 # 6. 合并实际和预测数据
 report_df = pd.merge(pred_df, channel_stats, on='渠道大类', how='left')
 # 加上店铺直购的统计
 shop_stats = channel_stats[channel_stats['渠道大类'] == '店铺直购']
 report_df = pd.concat([report_df, shop_stats], ignore_index=True)
 # 加上总计
 total = pd.DataFrame({
    '渠道大类': ['总计'],
    '预测GSV': [pred_df['预测GSV'].sum()],
    '订单数': [channel_stats['订单数'].sum()],
    'GMV': [channel_stats['GMV'].sum()],
    '已退款金额': [channel_stats['已退款金额'].sum()],
    'GSV': [channel_stats['GSV'].sum()],
    '退款订单数': [channel_stats['退款订单数'].sum()],
    '客单价': [channel_stats['GMV'].sum()/channel_stats['订单数'].sum()],
    '退费率': [str((channel_stats['退款订单数'].sum()/channel_stats['订单数'].sum()*100).round(1)) + '%']
 })
 report_df = pd.concat([report_df, total], ignore_index=True)
 report_df['完成率'] = report_df.apply(lambda row: str(round(row['GSV']/row['预测GSV']*100, 1)) + '%' if pd.notna(row['预测GSV']) else '-', axis=1)
 # 7. 保存报表
 output_file = '2026年3月收入预测报表_最新版.xlsx'
 with pd.ExcelWriter(output_file) as writer:
    report_df.to_excel(writer, sheet_name='整体统计', index=False)
    # 达播分达人明细
    dabo_df = order_df[order_df['渠道大类'] == '达播'].groupby('key_from').agg(
        订单数=('id', 'count'),
        GMV=('GMV', 'sum'),
        GSV=('GSV', 'sum'),
        退费率=('is_refund', lambda x: str((x.sum()/x.count()*100).round(1)) + '%')
    ).reset_index()
    dabo_df.to_excel(writer, sheet_name='达播达人明细', index=False)
    # 成交标记明细
    tag_df = order_df.groupby('成交标记').agg(
        订单数=('id', 'count'),
        GMV=('GMV', 'sum'),
        GSV=('GSV', 'sum'),
        退费率=('is_refund', lambda x: str((x.sum()/x.count()*100).round(1)) + '%')
    ).reset_index()
    tag_df.to_excel(writer, sheet_name='成交标记明细', index=False)
 print(f"\n最新3月收入预测报表已生成：{output_file}")
 print("\n整体统计结果：")
 print(report_df[['渠道大类', '预测GSV', 'GSV', '完成率', '订单数', 'GMV', '退费率']])
--- a/process_order.py
+++ b/process_order.py
@ -0,0 +1,68 @@
 import pandas as pd
 import numpy as np
 # 读取表A（用户提供的参考表）
 table_a = pd.read_excel('reference_order.xlsx')
 # 重命名列方便匹配
 table_a = table_a.rename(columns={'订单号': 'out_trade_no', 'keyFrom': 'key_from_a'})
 # 只保留需要的字段
 table_a = table_a[['out_trade_no', 'key_from_a', '成交标记']]
 print(f"表A总订单数：{len(table_a)}，其中成交标记非空：{len(table_a[table_a['成交标记'].notna()])}")
 # 读取表B（导出的3月1日至今订单）
 table_b = pd.read_csv('2026年3月1日至今订单.csv')
 print(f"表B总订单数：{len(table_b)}")
 # 第一步：匹配重复订单（两个表都有的订单）
 merged = pd.merge(table_b, table_a, on='out_trade_no', how='left', indicator=True)
 # 统计匹配情况
 match_stats = merged['_merge'].value_counts()
 print(f"\n匹配结果：")
 print(f"  两个表都有的订单：{match_stats.get('both', 0)}条 → 直接使用表A的成交标记")
 print(f"  仅表B存在的新增订单：{match_stats.get('left_only', 0)}条 → 按规则生成新标记")
 # 第二步：处理新增订单的标记逻辑
 # 先从已匹配的订单中学习key_from到成交标记的映射
 learned_map = merged[merged['_merge'] == 'both'].drop_duplicates('key_from')[['key_from', '成交标记']].set_index('key_from')['成交标记'].to_dict()
 print(f"\n从匹配的订单中学习到的key_from→成交标记映射（共{len(learned_map)}条）：")
 for k, v in learned_map.items():
    if pd.notna(v):
        print(f"  {k} → {v}")
 # 定义标记生成规则
 def get_final_tag(row):
    # 如果是匹配到的订单，直接用表A的标记
    if row['_merge'] == 'both' and pd.notna(row['成交标记']):
        return row['成交标记']
    # 新增订单优先用学习到的映射
    key_from = row['key_from']
    if key_from in learned_map and pd.notna(learned_map[key_from]):
        return learned_map[key_from]
    # 规则匹配
    if key_from.startswith('newmedia-daren-'):
        return '达播'
    elif key_from == 'app-active-h5-0-0':
        return '端内直购'
    elif key_from.startswith('sales-adp-') or key_from.startswith('app-sales-'):
        return '销转'
    elif key_from.startswith('newmedia-dianpu-'):
        return '店铺直购'
    else:
        return '其他'
 # 生成最终成交标记
 merged['最终成交标记'] = merged.apply(get_final_tag, axis=1)
 # 将标记为0的修改为店铺直购
 merged['最终成交标记'] = merged['最终成交标记'].replace(0, '店铺直购')
 merged['最终成交标记'] = merged['最终成交标记'].replace('0', '店铺直购')
 # 清理不需要的字段
 final_df = merged.drop(columns=['key_from_a', '_merge', '成交标记']).rename(columns={'最终成交标记': '成交标记'})
 # 保存结果
 output_file = '2026年3月1日至今订单_含正确成交标记.csv'
 final_df.to_csv(output_file, index=False, encoding='utf-8-sig')
 print(f"\n处理完成，已生成最终文件：{output_file}")
 print(f"最终成交标记分布：")
 print(final_df['成交标记'].value_counts())
--- a/regenerate_report.py
+++ b/regenerate_report.py
@ -0,0 +1,204 @@
 import pandas as pd
 import numpy as np
 import psycopg2
 # 1. 正确计算GSV：同时满足bi_refund_order.status=3 和 bi_vala_order.order_status=4
 conn = psycopg2.connect(
    host="bj-postgres-16pob4sg.sql.tencentcdb.com",
    port=28591,
    user="ai_member",
    password="LdfjdjL83h3h3^$&**YGG*",
    database="vala_bi"
 )
 # 获取退款数据
 cur = conn.cursor()
 cur.execute("""
    SELECT out_trade_no, SUM(refund_amount_int) as total_refund_int
    FROM bi_refund_order 
    WHERE status = 3 AND created_at >= '2026-03-01 00:00:00+08'
    GROUP BY out_trade_no
 """)
 refund_data = cur.fetchall()
 refund_df = pd.DataFrame(refund_data, columns=['out_trade_no', 'total_refund_int'])
 cur.close()
 conn.close()
 # 获取订单数据
 order_df = pd.read_csv('2026年3月1日至今订单_含正确成交标记.csv')
 # 合并计算
 order_df = pd.merge(order_df, refund_df, on='out_trade_no', how='left')
 order_df['total_refund_int'] = order_df['total_refund_int'].fillna(0)
 order_df['GMV'] = order_df['pay_amount_int'] / 100
 order_df['refund_amount'] = order_df.apply(
    lambda row: row['total_refund_int']/100 if row['order_status'] == 4 else 0, 
    axis=1
 )
 order_df['GSV'] = order_df['GMV'] - order_df['refund_amount']
 order_df['is_valid_refund'] = (order_df['order_status'] == 4) & (order_df['total_refund_int'] > 0)
 # 2. 渠道映射（和原表一致）
 def map_channel(tag):
    if tag in ['销转', '销转-小龙']:
        return '销转'
    elif tag in ['端内直购', '端内销转']:
        return 'App转化'
    elif tag == '达播':
        return '达播'
    elif tag.startswith('班主任-'):
        return '班主任'
    else:
        return '其他'
 order_df['渠道大类'] = order_df['成交标记'].apply(map_channel)
 # 3. 按原表格式构建报表
 # 原表表头结构
 report_data = [
    # 第一部分：3月剩余预测 & 3月实际 汇总
    ['3月剩余预测', 'GMV', '', 'GSV', '', '', '3月实际', 'GMV', '', 'GSV', '', '完成率', ''],
    ['销转', '', '', 100000, '', '', '', '', '', 0, '', '', ''],
    ['App转化', '', '', 20000, '', '', '', '', '', 0, '', '', ''],
    ['达播', '', '', 250000, '', '', '', '', '', 0, '', '', ''],
    ['班主任', '', '', 10000, '', '', '', '', '', 0, '', '', ''],
    ['', '', '', '', '', '', '', '', '', '', '', '', ''],
    # 销转明细
    ['', '', '线索量', '线索成本', '转化率', '客单价', 'GMV', '退款率', 'GSV', '投放成本', '退后ROI', '', ''],
    ['销转', '第一周', 0, 0, 0, 0, 0, 0, 0, 0, 0, '', ''],
    ['', '第二周', 0, 0, 0, 0, 0, 0, 0, 0, 0, '', ''],
    ['', '第三周', 0, 0, 0, 0, 0, 0, 0, 0, 0, '', ''],
    ['', '第四周', 0, 0, 0, 0, 0, 0, 0, 0, 0, '', ''],
    ['', '小计', 0, 0, 0, 0, 0, 0, 0, 0, 0, '', ''],
    ['', '', '', '', '', '', '', '', '', '', '', '', ''],
    # App转化明细
    ['App转化', '', '注册人数', '转化率', '客单价', 'GMV', '退款率', 'GSV', '', '', '', '', ''],
    ['', '自然转化', 0, 0, 0, 0, 0, 0, 0, '', '', '', ''],
    ['', '销售转化', 0, 0, 0, 0, 0, 0, 0, '', '', '', ''],
    ['', '小计', 0, 0, 0, 0, 0, 0, 0, '', '', '', ''],
    ['', '', '', '', '', '', '', '', '', '', '', '', ''],
    # 达播明细
    ['达播', '', '达人', '订单量', '均单价', 'GMV', '退款率', 'GSV', '', '', '', '', ''],
 ]
 # 计算汇总数据
 channel_summary = order_df.groupby('渠道大类').agg(
    总订单数=('id', 'count'),
    总GMV=('GMV', 'sum'),
    总GSV=('GSV', 'sum'),
    退款订单数=('is_valid_refund', 'sum'),
    总退款金额=('refund_amount', 'sum')
 ).reset_index()
 # 填充汇总行
 channel_map = {'销转': 1, 'App转化': 2, '达播': 3, '班主任': 4}
 for _, row in channel_summary.iterrows():
    if row['渠道大类'] in channel_map:
        idx = channel_map[row['渠道大类']]
        report_data[idx][3] = 100000 if idx ==1 else 20000 if idx==2 else 250000 if idx==3 else 10000
        report_data[idx][8] = round(row['总GSV'], 2)
        report_data[idx][9] = round(row['总GMV'], 2)
        report_data[idx][10] = f"{round(row['总GSV']/report_data[idx][3]*100, 1)}%"
        report_data[idx][7] = round(row['总GMV'], 2)
        report_data[idx][11] = f"{round(row['退款订单数']/row['总订单数']*100,1)}%"
 # 填充达播达人明细
 dabo_orders = order_df[order_df['渠道大类'] == '达播']
 dabo_summary = dabo_orders.groupby('key_from').agg(
    订单数=('id', 'count'),
    GMV=('GMV', 'sum'),
    GSV=('GSV', 'sum'),
    退款数=('is_valid_refund', 'sum')
 ).reset_index()
 dabo_summary['退费率'] = (dabo_summary['退款数'] / dabo_summary['订单数'] * 100).round(1)
 dabo_summary['均单价'] = (dabo_summary['GMV'] / dabo_summary['订单数']).round(2)
 # 匹配达人名称
 def get_daren_name(key):
    if '晚柠' in key:
        return '晚柠'
    elif '念妈' in key:
        return '念妈'
    elif '小花生' in key:
        return '小花生'
    elif '盈姐' in key:
        return '盈姐'
    elif '百克力' in key:
        return '百克力'
    elif '海淀妈妈优选' in key:
        return '海淀妈妈优选'
    elif '海淀小水妈' in key:
        return '海淀小水妈'
    else:
        return '其他达人'
 dabo_summary['达人'] = dabo_summary['key_from'].apply(get_daren_name)
 dabo_final = dabo_summary.groupby('达人').agg(
    订单数=('订单数', 'sum'),
    GMV=('GMV', 'sum'),
    GSV=('GSV', 'sum'),
    退费率=('退费率', 'mean'),
    均单价=('均单价', 'mean')
 ).reset_index()
 for _, row in dabo_final.iterrows():
    report_data.append([
        '', '', row['达人'], row['订单数'], round(row['均单价'],2), round(row['GMV'],2), f"{row['退费率']}%", round(row['GSV'],2), '', '', '', '', ''
    ])
 # 添加达播小计
 dabo_total = dabo_final.sum()
 report_data.append([
    '', '', '小计', dabo_total['订单数'], round(dabo_total['GMV']/dabo_total['订单数'],2), round(dabo_total['GMV'],2), 
    f"{round(dabo_orders['is_valid_refund'].sum()/len(dabo_orders)*100,1)}%", round(dabo_total['GSV'],2), '', '', '', '', ''
 ])
 # 班主任明细
 report_data.extend([
    ['', '', '', '', '', '', '', '', '', '', '', '', ''],
    ['班主任', '', '分类', '订单量', 'GMV', '退款订单', '退款金额', 'GSV', '', '', '', '', ''],
    ['', '', '季转年', 0, 0, 0, 0, 0, '', '', '', '', ''],
    ['', '', '年转年', 0, 0, 0, 0, 0, '', '', '', '', ''],
    ['', '', '转介绍', 0, 0, 0, 0, 0, '', '', '', '', ''],
    ['', '', '退费重报', 0, 0, 0, 0, 0, '', '', '', '', ''],
 ])
 banzhuren_orders = order_df[order_df['渠道大类'] == '班主任']
 bzr_summary = banzhuren_orders.groupby('成交标记').agg(
    订单数=('id', 'count'),
    GMV=('GMV', 'sum'),
    GSV=('GSV', 'sum'),
    退款数=('is_valid_refund', 'sum'),
    退款金额=('refund_amount', 'sum')
 ).reset_index()
 for _, row in bzr_summary.iterrows():
    if '年续' in row['成交标记'] or '年转年' in row['成交标记']:
        idx = -4
    elif '转介绍' in row['成交标记']:
        idx = -3
    elif '重报' in row['成交标记']:
        idx = -2
    else:
        idx = -5
    report_data[idx][3] = row['订单数']
    report_data[idx][4] = round(row['GMV'],2)
    report_data[idx][5] = row['退款数']
    report_data[idx][6] = round(row['退款金额'],2)
    report_data[idx][7] = round(row['GSV'],2)
 # 班主任小计
 bzr_total = bzr_summary.sum()
 report_data.append([
    '', '', '小计', bzr_total['订单数'], round(bzr_total['GMV'],2), bzr_total['退款数'], round(bzr_total['退款金额'],2), round(bzr_total['GSV'],2), '', '', '', '', ''
 ])
 # 转换为DataFrame并保存
 df = pd.DataFrame(report_data)
 output_file = '2026年3月收入预测报表_与原表格式一致.xlsx'
 with pd.ExcelWriter(output_file, engine='openpyxl') as writer:
    df.to_excel(writer, index=False, header=False, sheet_name='3月收入报表')
 print("报表已生成，格式与原表完全一致，GSV已按正确口径重新计算：")
 print(channel_summary[['渠道大类', '总GMV', '总GSV', '退款订单数']])
 print(f"\n总GSV：{round(order_df['GSV'].sum(),2)} 元，总GMV：{round(order_df['GMV'].sum(),2)} 元，整体退费率：{round(order_df['is_valid_refund'].sum()/len(order_df)*100,1)}%")
--- a/scripts/xueersi_weekly_report.sh
+++ b/scripts/xueersi_weekly_report.sh
@ -0,0 +1,51 @@
 #!/bin/bash
 set -e
 # 配置信息
 PG_PASSWORD="LdfjdjL83h3h3^$&**YGG*"
 FEISHU_APP_ID="cli_a929ae22e0b8dcc8"
 FEISHU_APP_SECRET="OtFjMy7p3qE3VvLbMdcWidwgHOnGD4FJ"
 RECEIVE_OPEN_ID="ou_e63ce6b760ad39382852472f28fbe2a2"
 # 计算时间范围：上周一到上周日
 START_DATE=$(date -d "last monday -7 days" +%Y-%m-%d)
 END_DATE=$(date -d "last sunday" +%Y-%m-%d)
 REPORT_DATE=$(date +%Y%m%d)
 CSV_PATH="/tmp/xueersi_weekly_data_${REPORT_DATE}.csv"
 EXCEL_PATH="/tmp/学而思渠道周度数据_${START_DATE//-/}-${END_DATE//-/}.xlsx"
 # 1. 查询数据导出CSV
 PGPASSWORD="${PG_PASSWORD}" psql -h bj-postgres-16pob4sg.sql.tencentcdb.com -p 28591 -U ai_member -d vala_bi -c "\copy (WITH date_range AS (SELECT generate_series('${START_DATE}'::date, '${END_DATE}'::date, '1 day'::interval) AS stat_date), daily_new_users AS (SELECT DATE(created_at) AS stat_date, COUNT(DISTINCT id) AS new_user_count FROM bi_vala_app_account WHERE download_channel LIKE '%学而思%' AND created_at >= '${START_DATE} 00:00:00+08' AND created_at < '$(date -d "${END_DATE} +1 day" +%Y-%m-%d) 00:00:00+08' AND deleted_at IS NULL GROUP BY DATE(created_at)), daily_orders AS (SELECT DATE(o.pay_success_date) AS stat_date, COUNT(DISTINCT o.id) AS total_order_count, COUNT(DISTINCT CASE WHEN r.status = 3 AND o.order_status = 4 THEN o.id END) AS refund_order_count, ROUND(SUM(o.pay_amount_int)/100.0, 2) AS gmv, ROUND(SUM(o.pay_amount_int)/100.0 - COALESCE(SUM(CASE WHEN r.status = 3 AND o.order_status = 4 THEN r.refund_amount_int ELSE 0 END)/100.0, 0), 2) AS gsv FROM bi_vala_order o LEFT JOIN bi_refund_order r ON o.out_trade_no = r.out_trade_no WHERE o.key_from = 'app-active-h5-0-0' AND o.sale_channel = 21 AND o.pay_success_date >= '${START_DATE} 00:00:00+08' AND o.pay_success_date < '$(date -d "${END_DATE} +1 day" +%Y-%m-%d) 00:00:00+08' AND o.pay_success_date IS NOT NULL GROUP BY DATE(o.pay_success_date)), daily_data AS (SELECT TO_CHAR(d.stat_date, 'YYYY-MM-DD') AS 日期, COALESCE(u.new_user_count, 0) AS 新增用户数, COALESCE(o.total_order_count - o.refund_order_count, 0) AS 有效订单数, COALESCE(o.gsv, 0) AS GSV_元 FROM date_range d LEFT JOIN daily_new_users u ON d.stat_date = u.stat_date LEFT JOIN daily_orders o ON d.stat_date = o.stat_date) SELECT * FROM daily_data UNION ALL SELECT '合计' AS 日期, SUM(新增用户数) AS 新增用户数, SUM(有效订单数) AS 有效订单数, SUM(GSV_元) AS GSV_元 FROM daily_data ORDER BY 日期) TO '${CSV_PATH}' WITH (FORMAT csv, HEADER true, ENCODING 'UTF8');"
 # 2. CSV转Excel
 python3 -c "import pandas as pd; df = pd.read_csv('${CSV_PATH}'); df.to_excel('${EXCEL_PATH}', index=False);"
 # 3. 获取飞书租户token
 TOKEN_RESP=$(curl -s -X POST "https://open.feishu.cn/open-apis/auth/v3/tenant_access_token/internal" \
  -H "Content-Type: application/json" \
  -d "{\"app_id\":\"${FEISHU_APP_ID}\",\"app_secret\":\"${FEISHU_APP_SECRET}\"}")
 TOKEN=$(echo "$TOKEN_RESP" | grep -o '"tenant_access_token":"[^"]*"' | cut -d'"' -f4)
 if [ -z "$TOKEN" ]; then echo "ERROR: 获取token失败"; exit 1; fi
 # 4. 上传文件
 FILE_NAME=$(basename "${EXCEL_PATH}")
 UPLOAD_RESP=$(curl -s -X POST "https://open.feishu.cn/open-apis/im/v1/files" \
  -H "Authorization: Bearer ${TOKEN}" \
  -F "file_type=xls" \
  -F "file_name=${FILE_NAME}" \
  -F "file=@${EXCEL_PATH}")
 FILE_KEY=$(echo "$UPLOAD_RESP" | grep -o '"file_key":"[^"]*"' | cut -d'"' -f4)
 if [ -z "$FILE_KEY" ]; then echo "ERROR: 上传文件失败"; exit 1; fi
 # 5. 发送文件消息
 SEND_RESP=$(curl -s -X POST "https://open.feishu.cn/open-apis/im/v1/messages?receive_id_type=open_id" \
  -H "Authorization: Bearer ${TOKEN}" \
  -H "Content-Type: application/json" \
  -d "{\"receive_id\":\"${RECEIVE_OPEN_ID}\",\"msg_type\":\"file\",\"content\":\"{\\\"file_key\\\":\\\"${FILE_KEY}\\\"}\"}")
 MSG_ID=$(echo "$SEND_RESP" | grep -o '"message_id":"[^"]*"' | cut -d'"' -f4)
 if [ -z "$MSG_ID" ]; then echo "ERROR: 发送消息失败"; exit 1; fi
 # 清理临时文件
 rm -f "${CSV_PATH}" "${EXCEL_PATH}"
 echo "学而思周度报表发送成功，日期范围：${START_DATE} 至 ${END_DATE}"