@EggGump
2018-07-02T15:49:30.000000Z
字数 588
阅读 621
未分类
HIT IR-Lab Tongyici Cilin
《同义词词林》按照树状的层次结构把所有收录的词条组织到一起,,把词汇分成大、中、小三类,大类有 12 个,中类有 97 个,小类有 1,400 个。每个小类里都有很多的词,这些词有根据词义的远近和相关性分成了若干个词群(段落)。每个段落中的词语有进一步分成了若干个行,同一行的词语要么词义相同(有的词义十分接近),要么词义有很强的相关性。例如,“大豆”、“毛豆”和 “黄豆”在同一行;“西红柿”和“番茄”在同一行;“大家”、“大伙儿”、“大家伙儿”在同一行。另外,“将官”、“校官”、“尉官”在同一行,“雇农”、“贫农”、“下中农”、“中农”、“上中农”、“富农”在同一行, “外商”、“官商”、“坐商”、“私商”也在同一行,这些词不同义,但很相关。为了将词义相关的行和同义的行区分开,词典《同义词词林》在行的左端加上“* *”作为标记。
编码位 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
---|---|---|---|---|---|---|---|---|
符号举例 | D | a | 1 | 5 | B | 0 | 2 | =,#,@ |
符号性质 | 大类 | 中类 | 小类 | 小类 | 词群 | 原子词群 | 原子词群 | |
级别 | 第1级 | 第2级 | 第3级 | 第3级 | 第4级 | 第5级 | 第5级 |
表中的编码位是按照从左到右的顺序排列。第八位的标记有 3种,分别是“=”、“#”、“@”,“=”代表“相等”、“同义”。末尾的“#”代表“不等”、“同类”,属于相关词语。末尾的“@”代表“自我封闭”、“独立”,它在词典中既没有同义词,也没有相关词