算法简介
随着网络信息和电子商务信息的爆炸式增长,在复杂的信息中很容易造成丢失。在此背景下,用户的个性化推荐系统就显得尤为重要,它对电子商务平台和社交信息平台产生了质的影响。
协同过滤推荐算法是最早也是比较著名的推荐算法。主要功能是预测和推荐。该算法通过挖掘历史用户行为数据发现用户偏好,根据不同偏好对用户进行分组,推荐口味相近的产品。
其主要价值体现在:
将潜在用户转化为付费用户;提升电商平台的交叉销售能力;提高客户对网站的忠诚度;提高广告渠道的转化效率;提升用户个性化体验。协同过滤算法分类算法分阶段工作内容第一阶段
建立用户行为评分权重模型,实现数据可视化和用户行为可视化。
以电子商品平台为例:
第二阶段
创建一个测试集和一个训练集。
测试集和训练集的建立是为了防止模型构建的过拟合,也是为了监控模型的准确性和可行性,以利于模型的进一步修正。
比如,衣服是根据班上的身高和腰围来定制的。衣服做好后,全班都会穿得很好。然而协同过滤推荐算法java,当这个标准的衣服被引入全校时,很多学生都不能穿。原因可能是没有考虑到肩膀。宽度、翼展等。这里这个类是训练集,其他类是测试集。
第三阶段
建立合理的数据监控,监控召回率、准确率和覆盖率。为以后模型的修改提供了依据。
计算公式
欧几里得距离公式
(为了控制方便,可以取倒数,使结果分布在0-1之间)
余弦定理计算公式(N维空间)
(这里 V1 和 V2 是向量)
计算过程
应用
【余弦公式和ICF示例】以实际用户评分为起点,建立产品评分矩阵(如下表所示)
通过计算 4 个用户对 4 个项目的评分(在一个四维空间中),我们得到了用户之间的相关性数据(如下表所示)。
系数浮动区间在-1和1之间。系数越接近1,向量角度越小,两个乘积之间的相关性越高。可以看出A&B和A&D之间的相关性最高,C&D之间的相关性很弱。
相关系数:
2、使用用户为产品生成的记录来计算其相关性。
【示例】:用户对商品A和商品B的行为评分赋予权重,并对商品C和商品D进行加权排序,得分最高的优先推荐。
在相关性和加权评分之后,首先推荐产品 C。
数据去噪校正
【示例】:某用户购买衣服A,经过算法综合排名,发现第一名是方便面,第六名是衣服B协同过滤算法分类算法工作内容工作原理及应用实例,结果推荐方便面。会不会是个玩笑。但是商品是归一化分类的,服装类商品只推荐服装,所以会先推荐服装B。
【示例】:家具产品属于低频产品协同过滤推荐算法java,用户长期只需要购买一件,购买后再次推荐无法提高付费率。但用户付款下单后,可通过计算推荐其他家具周边产品(如配饰、窗帘等)。由于设置了合理的扣分以及相关商品品类的加分机制,可以在一定程度上提高周边商品的推荐率,降低低频商品的推荐率,从而提高支付转化从侧面评价。
该方案的缺点
数据稀疏。由于这类协同过滤模型需要训练数据支持,并且用户不会在冷启动时完成数据模型中的所有项目,因此数据会比较稀疏。
【解决方案】:可根据该品类产品用户的平均水平进行推荐(项目冷启动时的解决方案待商榷)。
可扩展性。协同过滤算法可以轻松地为成千上万的用户提供定量推荐,但对于电子商务网站来说,往往需要向成千上万的用户提供推荐。一方面,需要提高响应速度,能够实时推荐用户。; 另一方面,也要考虑存储空间的要求,尽量减少推荐系统操作对系统的负担。
【解决思路】:划定计算范围,剔除无记录、品类相关性与无操作记录用户差距较大的产品。从而减少了计算压力。同时,为了提升用户体验,推荐数据可以在离线期间进行训练和计算。但是,上述方案都会在一定程度上影响推荐的准确性。
以上解决方案有待进一步探讨,欢迎大家互相交流~~
结语
一个真正完善的个性化推荐系统,需要结合基于项目的协同过滤、基于内容的协同过滤、基于模型的协同过滤,结合平台自身的商业模式、商业模式特点、召回率、覆盖率、转化率. 为了实现优化,可以建立各种辅助模型。