@songying
2018-07-26T16:28:09.000000Z
字数 656
阅读 1088
文本分类
能否将多个模型融合起来,然后按照少数服从多数的原则给出分类。
本文将CNN + pre-trained 词向量用于sentence-level 分类任务中。 实验表明带有少量超参数的和静态的词向量能够实现较好的结果。
句子中的第i个单词 是一个k维的词向量, 长度为n的句子表示为:
卷积核(filter) , 作用于由h个单词组成的窗口上, 并产生a new feature. 例如,feature 是从窗口: :
然后我们队feature map做一个 max-over-time 池化操作:, 该池化的作用是为了获取该filter最重要的特征。
在该模型中使用了多个filter, 来获取多个feature。然后将这些特征送往一个softmax层, 该层的输出就是lables的概率分布。