短视频平台是怎么把“推荐系统”变成“现金流”的?
推荐的目标函数如果只盯着“时长”,很难养活一家公司;真正落地的是一套多目标加权的机器:时长 / 互动 / 广告收益 / GMV / 订阅留存,在不同场景、不同人群间动态换挡。
话不多说,我们直接进入正文。
0. 先把“目标函数”说清楚
平台侧常见四个一等公民指标:Watch Time(时长)、Ads Revenue(广告)、GMV(带货)、Subscription(订阅)。它们不会共享同一个最优点,所以线上一般是分场景多目标排序:信息流的主目标偏时长,穿插广告位时在收益上调权重;直播间偏打赏概率/预期收入;货架/导购页偏转化与客单;付费内容页偏续费率与N天留存。
简单写成一个目标函数是这样的:
maximize ( w₁·WT + w₂·AdRev + w₃·GMV + w₄·Subs )
subject to 频控、体验阈值(跳失率上限、投诉率上限)、品牌安全、合规要求、延迟预算等约束
权重不写死,人群×时段×上下文都是调参点。
1. 数据与在线服务的“底座”
先给一张总览图,后面逐块展开:
flowchart A[客户端埋点\\n曝光/点击/停留/转化/支付] --> B[Log Agent] B -->|实时| C[Kafka Topic] C --> D[Flink 实时计算\\n曝光/点击/频控/转化回补] C --> E[离线Batch\\n特征汇总/样本产出] D --> F[特征服务(Feature Store)\\n在线特征] E --> F F --> G[召回层\\nCF/Embedding/Graph/规则] G --> H[粗排\\n轻模型] H --> I[精排\\n多目标学习] I --> J[重排&约束\\n频控/多样性/新鲜度/品牌安全] J --> K[下发Feed/广告/直播/带货位] K --> L[AB平台\\n指标采集/归因/显著性检验] L --> E L --> D I --> M[收入结算&对账\\n广告/分成/佣金/订阅]
关键点:
- 埋点不是“越多越好”,而是可回放、可对账、可归因。曝光、视完、点击、加购、支付、退货,都要链路打通。
- 特征服务同时提供低延迟在线特征(近5/30/180分钟行为、近场会话特征)与稳态离线特征(长期偏好、画像、创作者画像)。
- 召回多路并行:CF、向量召回(ANN/HNSW/IVF)、图召回、规则/冷启动,保证覆盖率与多样性。
- 多目标排序:多任务学习(CTR/CVR/时长/打赏/下单/续费),线上做重排与约束(频控、品牌安全、多样性、topic阈值)。
- AB平台是生命线:指标定义要统一,归因要可解释,显著性检验别玩花样。
2. 广告变现:从竞价到频控
链路:请求 → 候选广告召回 → 预测(CTR/CVR/ARPU) → 出价/eCPM → 拍卖/排序 → 展示与落地页 → 结算。
几个落地点:
- 出价与eCPM:不同计费模型(CPC/CPM/CPA/oCPM),线上常把“预期价值”统一到eCPM空间做可比排序:
eCPM ≈ Bid × p(click) × p(value|click) × ...
- 多目标排序:信息流中广告要与自然内容一起排,常见是把广告的收益值映射到与时长接近的分值,再统一排序。
- 频控(Frequency Capping):人均/创意/广告主维度的上限,避免“广告疲劳”拉高跳失。
- 预算节奏(Pacing):平滑消耗,避免早晨就花完预算;对大促/节点做节奏模型。
- 品牌安全:类目/语义/画面检测,屏蔽不合宜的上下文;再做负反馈快速生效。
- 效果衡量:线上看 eCPM、CTR、CVR、跳失、次日留存;归因既要广告内转化,也要看间接影响(比如时长下降是不是被广告频次拉的)。
3. 直播打赏与虚拟礼物:激励与反作弊
商业核心是分成模型 + 激励设计:
- 分成:平台、主播、公会、渠道的比例与发放周期;礼物价格档位设计(从几毛到几百),配合特效与社交放大。
- 激励:任务阈值(连击解锁、榜单冲刺)、PK 倒计时、行为闭环(送礼→主播反馈→继续送)。
- 模型侧:预测打赏概率与预期收入,直播feed排序时把潜在高ARPPU用户与高转化场景匹配。
- 反作弊:识别“自刷/对倒”与“黑产礼物”:设备指纹、支付指纹、同构图谱、异常时序/金额分布;风控与财务对账要打通。
4. 带货:从内容到GMV的转化漏斗
把“上头剁手”翻译成指标,就是一条转化漏斗:曝光 → 点击 → 到达 → 停留 → 加购 → 下单 → 支付 → 退款。
工程点:
- 内容-商品匹配:视频/直播内容向量与商品向量做相似度召回;再加类目/价格带/人群匹配。
- 多目标排序:不仅看点击,更看预期GMV与退货风险(有的类目高退货会吃掉利润)。
- 归因:last-click 很“省事”但常常失真;多触点/时间衰减/路径模型更稳,至少要做对比线上验证。
- 风控:高返利场景要盯“刷单/羊毛党/虚假物流”;对账维度细到订单、商家、达人三侧。
- 实验:别只盯GMV,总要搭配净利润/客诉/退款率看;否则“拔苗助长”。
5. 订阅与反流失:付费墙是个策略问题
订阅不是“弹个窗”这么简单,它是一个漏斗 + 生命周期问题:
- 漏斗节点:曝光 → 点击 → 试用 → 支付 → 次月续费 → N月留存。
- 付费墙:触发时机(关键内容、关键时长、关键能力)、权益打包(免广告、画质、独家内容)、价格分层。
- 反流失:续费预测、价格弹性测试(降价/延长试用)、到期前唤回(Push/站内信/福利)。
- 合规与体验:自动续费明确告知、取消路径清晰、扣费前提醒;这些不是“形式”,它们影响复购口碑与投诉率,最终回到指标。
6. 激励玩法与“金币返现”:单位经济学算得过来吗?
很多“看视频赚金币”的玩法,本质上是以激励换时长/留存。能不能长期跑通,看两条:
- 单位经济学:激励成本(可视为现金等价) vs. 额外带来的广告/电商收入增量。如果每小时激励支出 > 每小时增收,就是在烧钱换“漂亮报表”。
- 风控与清结算:批量设备、模拟器、自动脚本很好混入;没有设备/账号/行为三合一的识别,很快被薅秃。
- 经验上,这类玩法适合冷启动/节点拉活,长期要用阈值、衰减、上限控制成本,并与主目标(时长/留存)做边际收益分析。
7. 短剧小额付费:切片、定价与AB
短剧火不是偶然,它把“内容切片 + 付费点设计”做到了极致。
- 内容切片:高密度反转/悬念点在1min左右卡断,提升下一集点击与付费转化。
- 定价:金币打包 vs. 单集直付 vs. 套餐;不同用户分层价格测试(注意合规边界)。
- 指标:CPM/千次播收入、ARPU/ARPPU、完播率、集间流失、退款率;不要只看收入,退费与投诉会反噬口碑。
- 风控与合规:自动续费提示、未成年人限额、消费二次确认、显著的“价格-时长”信息披露。
8. 一张可落地的系统蓝图
延迟预算:信息流/广告位一般要在 50~150ms 内给出排序结果;召回与特征服务各自占一部分,缓存命中与降级预案要写进SLO。
召回与向量检索:ANN(HNSW/IVF/PQ),冷热分层;Embedding 训练走对比学习/多任务,线上做域适配。
重排与约束:多样性(topic/作者去重)、新鲜度(冷启保护)、频控(广告/创意/达人数),以及“品牌安全/内容安全”的硬约束。
AB与指标:统一指标平台、统一归因口径;显著性检验别“厨艺”,小流量先验算,避免业务大动脉被抖坏。
结算与对账:广告账期、佣金结算、主播/达人分成、渠道费与退款回冲;财务侧的单据与日志哈希留痕,支撑审计。
治理:黑灰产识别(设备指纹、同构图谱、异常时序)、内容安全(审核+增量在线拦截)、未成年人保护(时长/夜间/付费限额)。
9. 取舍与边界:别让目标函数跑偏
- 收益 vs 体验:短期把广告频次拉满会涨收入,但抬跳失、掉留存,三周后ARPU回落得更快。
- GMV vs 口碑:强推高退货类目带来的“假繁荣”,会在客服与退款里找回来。
- 订阅 vs 信任:取消路径一旦“绕”,投诉与差评就会教育增长团队什么叫“负向飞轮”。
10. 结语:把“商业”还给“系统”
如果只把“推荐系统”当成“让人多看两条”的工具,最后会陷在时长里拔不出来;把变现指标、风控合规、体验约束纳入统一的目标函数,用工程化方式治理,系统才会越跑越稳。