@songying
2019-03-21T11:29:13.000000Z
字数 587
阅读 1404
阅读理解
来源:https://zhuanlan.zhihu.com/p/22671467
用神经网络处理机器阅读理解问题,首先面临的问题就是如何表示文章和问题这两个最重要的研究对象。
常见的有两种表示方法:
第一种: 将一篇文章看成有序的单词流序列,在这个有序序列上使用RNN来对文章进行建模表达,每个单词对应RNN序列中的一个时间步t的输入,RNN的隐层状态代表融合了本身词义以及其上下文语义的语言编码。这种表示方法并不对文章整体语义进行编码,而是对每个单词及其上下文语义进行编码,在实际使用的时候是使用每个单词的RNN隐层状态来进行相关计算。
第二种:从每个单词的语义表达推导出文章整体的Document Embedding表达,这种形式往往是在对问题和文章进行推理的内部过程中使用的表达方式。
大多数模型都是“Teaching Machines to Read and Comprehend” 提出的两个基础模型Attentive Reader”和“Impatient Reader”的变体。
此处将主流模型分为: “一维匹配模型”、“二维匹配模型”、“推理模型”等三类模型,其中“一维匹配模型”和“二维匹配模型”是基础模型,“推理模型”则是在基础模型上重点研究如何对文本内容进行推理的机制