@EggGump
2018-04-17T21:30:32.000000Z
字数 214
阅读 526
同义词发现算法论文
1、语料,分词,标注
2、抽取:/n+、+/n+/2、,/n+和/c+/n+/w,/n+或/c+/n+/w,/n+与/c+/n+/w
/n:名词,/w:标点,/c连词
对抽取的结果以:词为结点,词之间的联系为边,共现词数为权
3、Newman图聚类方法进行聚类
4、基于Newman方法的改进研究:
A:
将语料分成3份,只保留3份中都出现过的分
B:去低频边
C:加重双向边
D:加重相同后字