[关闭]
@dragonfive 2016-05-23T16:29:38.000000Z 字数 509 阅读 1421

数据挖掘大作业

机器学习


配置环境

  1. sudo apt-get install python-scipy python-numpy
  2. sudo apt-get install python-pip
  3. sudo pip install csc-pysparse networkx divisi2

然后安装库 python-recsys

接口

数据创建

  1. 用户添加
  2. 论文添加
  3. 用户与论文关系添加

数据读取

  1. 从文件中读取论文(数据库)
  2. 从文件中读取用户(数据库)
  3. 从文件中读取用户对论文的评分(数据库)

数据保存

  1. 用户保存到文件里(数据库)
  2. 论文保存到文件里(数据库)
  3. 用户对论文的评分保存到文件里(数据库)

调用推荐

  1. 根据用户id推荐
  2. 根据用户id和item推荐

使用方法

  1. #计算数据集合的SVD 每次更新数据库 需要重新计算SVD 比较耗时
  2. def computeSVD(self):
  3. #得到与当前论文相似的论文
  4. def getSimilarPaper(self,paperId):
  5. # 根据用户推荐论文
  6. def recommendPaper(self,userId):

参考资料

推荐系统开源软件列表汇总和点评
世面上除了使用mahout做推荐系统,还有别的吗
基于Mahout的电影推荐系统
python-recsys Library

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注