推荐系统架构及粗排设计

招聘联系方式：

粗排模块算法设计

粗排模型的设计以及 多样性保证两方面内容

全民k歌是一个非常大的ugc平台 级联架构

粗排存在的必要性：

· 防止召回到精排的漏斗过大 · 相较于召回，更强调排序（目标约束） --------- 召回内部没有排序一种策略召回许多条目此时粗排可以有打分 · 相较于精排，更强调性能（算力约束） --------- 精排无法处理较大规模的候选集

可以针对不同策略的召回有统一的打分（对不对不确定是一种思路）

目前的两种思路：

ROUTE1 从召回的角度：集合选择方案最大问题- 目标不一致各个环节目标不一致

ROUTE2 从排序的角度：排序预估方案表达能力强，目标对齐程度高

route2 双塔模型结构：

双塔优缺点：

引出模型蒸馏： Transfer Learning with Soft Labels （0-1之间的连续值）

其中上面的是Teacher模型，复杂的模型，下方的student模型，简单

预训练好的teacher网络输出一个 logits， student网络不仅要拟合真实label，还要拟合logits（soft labels）

（相当于 teacher对子网络的学习加了指导以及约束）

分为模型蒸馏和特征蒸馏：

之前双塔无法做到 特征交叉 使用模型蒸馏即引入更复杂的模型又在teacher网络中引入了交叉特征

teacher网络即精排网络？使用精排模型来蒸馏（目标一致性以及学习上限都有保证）

具体训练上线实践：

更多探索方向：

召回可能偏重于多样性 精排偏重于具体顺序精准性粗排如何衡量二者

多样性调节算法

目前常见的一些方案路线：

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

全民k歌-推荐系统架构及粗排设计.md

全民k歌-推荐系统架构及粗排设计.md

推荐系统架构及粗排设计