@xtccc 2015-10-25T09:43:31.000000Z 字数 999 阅读 2892

利用用户的行为数据

此处输入图片的描述

推荐系统

为什么要利用用户的行为数据

很难要求用户在注册时主动地告诉我们他们喜欢什么，因为：

因此，我们需要通过算法来自动地发掘用户的行为数据，从而推断出用户的喜好。基于用户行为分析的推荐算法一般被称为协同过滤推荐算法（Collaborative Filtering Recommendation）。

协同过滤算法包括多种方法：

应用最广泛的就是基于领域的方法，包括：

生活中的很多数据的分布都满足 Power Law 这个规律，用户行为数据也是如此。

令 $f_{u}(k)$ 为对k个物品产生过行为的用户的数量， $f_i(k)$ 为被k个用户产生过行为的物品的数量，那么 $f_{u}(k)$ 和 $f_{i}(k)$ 都满足长尾分布，即：

f u (k) = α u k β u

$f_{u}(k) = \alpha_u k^{\beta_u}$

f i (k) = α i k β i

$f_{i}(k) = \alpha_i k^{\beta_i}$

这里，物品流行度指对物品产生过行为的用户总数，用户活跃度指用户产生过行为的物品总数。

基于领域的协同过滤方法包含基于用户的协同过滤算法（UserCF）和基于物品的协同过滤算法（ItemCF），详见基于领域的协同过滤算法（UsrCF and ItemCF）。