前几天偶然在一个公众号看到了小红书技术团队有关于小红书算法架构的分享,里面聊到了小红书的每一篇爆款笔记是如何被推荐系统所发掘并不断推荐的,收获繁多,整理一下分享给大家!
笔记是如何被分发和推荐的?
1)笔记被推荐的综合考虑因素很多,没有标准的公式一概而论。具体说,纳入考虑的因子包括点击、时长、完播、下滑、质量、点赞、收藏、关注、转发、评论等。
2)一般会综合考虑消费、互动和体验类指标,结合用户的消费行为偏好,实现个性化的权重组合。
3)例如,日常分享类的笔记更看重点赞,工具类笔记更看重收藏,求助类笔记更看重评论
推荐系统如何做到挖掘长尾,高效分发?
1)小红书开创性地构建了一整套内容质量框架,利用封面图片画质美学模型和多模态笔记质量分模型,定义有用和美好的内容。
2)小红书技术团队借助大规模多模态预训练模型,通过将笔记封面图和笔记标题组对的方式获取训练样本,通过算法实现对复杂多模态内容的综合语义表征。
3)同时,团队利用内容的后验分发数据(例如点击率、点赞率、快划率等),对预训练向量进行微调,从而实现对内容分发质量的级别预测
新笔记如何冷启动,种子人群如何识别?
1)小红书发现,扶持新发布、低曝光的笔记可以增强作者的发布意愿。
2)哪怕一条笔记的初始数据一般,只要它有价值,系统捕捉到中长尾信号,依然会被推荐给需要的用户,与发布时效无关。
3)在冷启动阶段,系统更加关注高质量评论的数量、挖掘高潜笔记,因为高质量的评论数量反映了目标人群对新内容的互动情况,也即新内容是否被准确分发到了符合其特性的人群中。
总结:
1)小红书算法对普通用户笔记更友好,容易产生「素帖爆火」的现象
2)笔记声明周期可以很长,跟时间没关系,如果笔记周期时间短只能证明没有布局关键词,或者涉及关键词没有搜索量
3)相比点赞,高热互动对笔记是否被更多次分发的影响更大
来源:Vic的营销思考