@Wayne-Z
2017-06-09T15:39:55.000000Z
字数 388
阅读 1773
未分类
他的代码运行于python2平台,一开始用python3进行测试遇到了一些阻碍,如unicode编码格式的设置,以及基本的语法变动,修改以后的精度输出为Nan,很奇怪,问题没有解决。于是自己去下载了原生的fasttext去跑,并没有借助python去进行实验的实现,得到结果如下图,我们会发现训练时间只有14秒,比论文上的结果要好些,但是测试得到的精度有所下降。下面是两个图的实验结果对比。
python包的引入延缓了训练和分类耗时,但是分类准确率却要略低一些,不知道什么原因,不过还是比清华的那个文本分类器的精度要高啦。
个人觉得没有跑的价值,用的dpedia数据集就是论文中原生的数据集,fastText原论文用的八个数据集再去年九月推出源码的时候就顺着找齐并测试了一遍,论文对原理的阐述还是比较清晰的,对大家学习word2vec这一系列的方法应该帮助不小