[关闭]
@Wayne-Z 2017-06-09T07:39:55.000000Z 字数 388 阅读 1532

康龙炀毕设运行

未分类


他的代码运行于python2平台,一开始用python3进行测试遇到了一些阻碍,如unicode编码格式的设置,以及基本的语法变动,修改以后的精度输出为Nan,很奇怪,问题没有解决。于是自己去下载了原生的fasttext去跑,并没有借助python去进行实验的实现,得到结果如下图,我们会发现训练时间只有14秒,比论文上的结果要好些,但是测试得到的精度有所下降。下面是两个图的实验结果对比。
康2.PNG-32.2kB
康龙炀实验.PNG-797.5kB
python包的引入延缓了训练和分类耗时,但是分类准确率却要略低一些,不知道什么原因,不过还是比清华的那个文本分类器的精度要高啦。
个人觉得没有跑的价值,用的dpedia数据集就是论文中原生的数据集,fastText原论文用的八个数据集再去年九月推出源码的时候就顺着找齐并测试了一遍,论文对原理的阐述还是比较清晰的,对大家学习word2vec这一系列的方法应该帮助不小

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注