推荐算法的目的是让用户在海量数据中定位到自己想要的数据,针对于短视频来说,就是在快速找到用户感兴趣的视频,市面上常见的推荐算法分为以下几种
基于流行度的的算法
根据pv,uv,点赞量,收藏量,分享量等等指标把最火的内容无差别推送给用户
特点: 比较简单粗暴,针对于大众,如果想要对不同用户做个性化推荐的话,可以根据用户群体分类下流量排行进行分类
比如含有美食标签和含有运动标签推荐的视频是不一样的
根据用户行为数据的算法
基于用户的历史数据,会出现冷启动问题(首次没有历史数据)
基于协同过滤的推荐机制是现今应用最为广泛的推荐机制
主要细分为3个算法
基于用户的协同过滤算法:
原理是通过比对多个用户与当前用户的行为,如果相似度越高,则会向当前的用户推荐相似度高的用户且没有被当前用户浏览的数据
比如用户A,B,C,D都喜欢王者荣耀视频,都喜欢刷张大仙的视频,点赞然后也喜欢在其视频下评论,计算这些人群评价得分(通过相似用户点赞浏览关注评论得出),把他们“认为”评分最高,而且A没看过的视频推给A
基于项目的协同过滤算法
原理是通过比对多个用户与当前用户的行为,如果相似度越高,则会向当前的用户推荐相似度高的用户的历史数据
比如A,B,C,D都是电脑设备的忠实脑残粉,A喜欢Mac,B喜欢华硕,C喜欢Mac,系统会像A推荐C历史购买过的商品
基于模型的协同过滤算法
机器学习与数据挖掘暂时用不到
基于内容的算法
根据用户过去喜好的内容和项目本身的一些特征
比如A过去痴迷于看NBA篮球比赛,系统也会时不时向A推送一些NBA类的视频
- 平台自动打标签(闲鱼)
- 大众自己打标签(掘金)
优点是不那么依赖大众推荐热门视频,跟用户历史数据有关
缺点是标签的相关性难以保证,需要用户配合
基于关联规则的推荐
适用于电商系统
评估推荐算法的效果
当推荐算法完成后,怎样来评估这个算法的效果? CTR(点击率)、CVR(转化率)、停留时间等都是很直观的数据。在完成算法后,可以通过线下计算算法的RMSE(均方根误差)或者线上进行ABTest来对比效果。
业界短视频方面的推荐系统是怎么做的
https://www.sohu.com/a/899390218_122326373
参考文章