# 每日用户识别策略（10:00 名单，P0-P3 + 覆盖补漏）

## 你关心的指标（近7天）
本策略按你给的口径执行，核心指标为：
- 主动互动：`recent7_active_interact_total`（点赞/评论/关注等主动互动总和）
- 被动互动：`recent7_passive_total`（作品收到的点赞+评论）
- 创作发布：`recent7_publish_cnt`
- 活跃天数：`recent7_active_days`

数据源：ByteHouse
- `bigbangdatabase.dws_ssid_allinfo`
- `bigbangdatabase.dws_collection_allinfo`

## 固定触达策略（近7天）
先筛基线人群：
- 今天有发帖：`publish_cnt_today > 0`
- 今天当前被动互动为 0：`passive_interact_total_today = 0`

分层阈值（与你给的一致）：
- `P0`: 发帖>=8 且 被动互动=0 且 主动互动>=40 且 活跃天数>=4
- `P1`: 发帖>=4 且 被动互动<=1 且 主动互动>=15 且 活跃天数>=3
- `P2`: 发帖>=2 且 被动互动<=1 且 主动互动>=5 且 活跃天数>=2
- `P3`: 发帖>=1 且 被动互动<=2 且 主动互动>=5 且 活跃天数>=2
- 其余为 `P4`

## 每日动态刷新（保证覆盖）
仅靠固定阈值会漏掉一部分“今天无反馈但有创作意愿”的用户，因此增加补漏层 `S1`：
- 先全量保留 `P0-P3`
- 若 `P0-P3` 数量低于当日目标，则从 `P4` 按 `priority_score` 降序补充到目标

当日目标：
- `target_selected_cnt = clamp(round(base_today_cnt * 15%), min=900, max=1800)`

这层的作用是保证“需要评论的用户”每天都有稳定覆盖面，不会因阈值过硬漏掉边缘高潜用户。

## 今日样例（2026-03-18 执行）
说明：宽表最新分区日为 `run_dt=2026-03-17`（按日分区，属于正常现象）。

来自 `daily_trigger_priority_summary_20260318.csv`：
- `base_today_cnt = 7308`
- 固定阈值命中 `P0-P3 = 866`
- 动态目标 `target_selected_cnt = 1096`
- 补漏 `S1 = 230`
- 最终名单 `final_selected_cnt = 1096`
- 覆盖率 `final_coverage_rate_pct = 15.0%`

分层明细：
- `P0=34`
- `P1=189`
- `P2=512`
- `P3=131`
- `S1=230`

## 输出文件（给 worker）
- 汇总：`data/csv/daily_trigger_priority_summary_YYYYMMDD.csv`
- 明细（ByteHouse原始）：`data/csv/daily_trigger_userlist_raw_YYYYMMDD.csv`
- 明细（已映射 MySQL 用户名）：`data/csv/daily_trigger_userlist_YYYYMMDD.csv`
  - 额外字段：`user_id`, `nick_name`

## 可复跑 SQL 与脚本
- `sql/04_daily_trigger_userlist.sql`
- `sql/05_daily_trigger_priority_summary.sql`
- `script/generate_daily_trigger_userlist.sh`
- `script/enrich_trigger_userlist_with_mysql.py`

执行命令（在仓库任意目录执行）：
```bash
REPO_ROOT="$(git rev-parse --show-toplevel)"
cd "$REPO_ROOT/task/20260127_AI评论策略整合/history/20260318_openclaw_soul_md"
./script/generate_daily_trigger_userlist.sh "$(date +%Y%m%d)"
```

## 历史依据文件（已找到）
- `/Users/rating/workspace/Data/archive/historical_tasks/task/20260127_AI评论策略整合/report/human_trigger_exec_brief_20260226.html`

## 说明
当前策略是“历史相关性 + 当日覆盖补漏”，仍建议上线后持续做 AB 验证（留存/互评/投诉率）。
