@dragonfive 2016-05-23T16:29:38.000000Z 字数 509 阅读 1421

数据挖掘大作业

机器学习

配置环境

sudo apt-get install python-scipy python-numpy
sudo apt-get install python-pip
sudo pip install csc-pysparse networkx divisi2

然后安装库 python-recsys

接口

数据创建

用户添加
论文添加
用户与论文关系添加

数据读取

从文件中读取论文(数据库)
从文件中读取用户(数据库)
从文件中读取用户对论文的评分(数据库)

数据保存

用户保存到文件里（数据库）
论文保存到文件里（数据库）
用户对论文的评分保存到文件里（数据库）

调用推荐

根据用户id推荐
根据用户id和item推荐

使用方法

    #计算数据集合的SVD 每次更新数据库 需要重新计算SVD 比较耗时
    def computeSVD(self):
    #得到与当前论文相似的论文
    def getSimilarPaper(self,paperId):
# 根据用户推荐论文
def recommendPaper(self,userId):

数据挖掘大作业

配置环境

接口

数据创建

数据读取

数据保存

调用推荐

使用方法

参考资料

内容目录

选择主题