[关闭]
@songying 2018-07-05T21:50:32.000000Z 字数 556 阅读 1390

Siamese Recurrent Architectures for Learning Sentence Similarity

Sentence-Similarity


https://zhuanlan.zhihu.com/p/26996025

Abstract

我们的模型用来获取文本之间的相似度。

Instroduction

本文贡献点:
1.提出新的度量方式(基于曼哈顿距离,见细节2)。优于欧几里得距离(梯度消失)、余弦相似度。【回归】

2.通过明确的指导(距离),使用简单LSTM能够建模复杂的语义。

3.使用MaLSTM features输入给SVM来进行分类。【分类】

Relate work

Manhattan LSTM Model

这里有两个网络: LSTMa 和 LSTMb, 每一个网络处理句子对中的一个句子。

输入 通过LSTM, 然后LSTM将输入encode为 LSTM 隐层的最后一个状态
对于每一个输入的句子对, 我们使用函数

Semantic relatedness socring

添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注