[关闭]
@songying 2018-07-26T16:28:09.000000Z 字数 656 阅读 1088

Convolutional Neural Networks for Sentence Classification

文本分类


能否将多个模型融合起来,然后按照少数服从多数的原则给出分类。

Abstract

本文将CNN + pre-trained 词向量用于sentence-level 分类任务中。 实验表明带有少量超参数的和静态的词向量能够实现较好的结果。

Model

  1. 句子中的第i个单词 是一个k维的词向量, 长度为n的句子表示为:


    这表示将所有词向量排列成一个词向量矩阵。

  2. 卷积核(filter) , 作用于由h个单词组成的窗口上, 并产生a new feature. 例如,feature 是从窗口: :


    其中 是bias项, f是一个非线性函数,卷积核w不断作用于窗口上:, 然后产生一个feature map:

  3. 然后我们队feature map做一个 max-over-time 池化操作:, 该池化的作用是为了获取该filter最重要的特征。

  4. 在该模型中使用了多个filter, 来获取多个feature。然后将这些特征送往一个softmax层, 该层的输出就是lables的概率分布。

2.1 正则化

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注