The BellKor 2008 Solution to the Netflix Prize

发表于 2019-01-22 | 阅读次数: | 浏览次

介绍

主要介绍论文结构

新方法

因子模型

SVD

Asymmetric-SVD

SVD++

这些模型的学习方法是使用SGD，参数$\mu$是指训练集中的平均打分值。

时间效应

发现了三种强时间效应

电影偏差：电影会随着时间发生流行度变化
用户偏差：用户会随着时间改变他们的打分基线
用户偏好：用户的偏好会随着时间发生变化

之后，开始介绍下如何在模型中使用这些时间效应
以SVD++为例：

Here，我们预测随着时间t的打分值r。请注意，相关的参数现在构造为和时间相关的函数。这些偏差是同时学习的。
时间偏差效应更容易捕捉到，因为我们不需要最精细的细粒度。
对于item的时间效应，比较容易捕获到：
作者将训练集时间切分了30份，每一份作为一个bin。同一个电影在不同bin具有不同的结果。

对于用户层面的时间效应：

分享到：收藏夹复制网址邮件微信 QQ空间腾讯微博豆瓣一键分享更多