分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2019-01-03 合作期刊: 《计算机应用研究》
摘要: 机器阅读理解中的答案获取是根据问题选择或者抽象释义出文章中的内容,但得到的序列容易出现表述不准确与信息冗余的问题。针对机器阅读理解任务中的答案获取提出一种序列生成模型SGN。首先,SGN在问题矩阵空间获取问题与文章的匹配表示,并参照潜在的问题信息,生成当前节点的词向量;然后,使用一个选择门结构从文章或者字典中选择当前词汇,并且自发学习和归纳OOV(out-of-vocabulary)单词,解决语义表述不准确的问题。最后,使用改进的覆盖机制,消除生成序列中的冗余问题,从而提高可读性。实验通过人工数据集SQuAD进行验证,其结果表明,在阅读理解任务上SGN生成的目标序列与基准模型Seq2Seq相比可读性更加优异,并且与原文语义更贴近。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-06-19 合作期刊: 《计算机应用研究》
摘要: 针对文本蕴涵问题提出一种动态交互网络(dynamic interactive network,DIN)进行识别。不同于已有交互模型,DIN将两句词向量投射到二维矩阵空间中进行交互,然后利用输出矩阵为同时处理上下文信息和控制信息流动的GRU编码器生成动态权重。前者通过更高阶形式的信息交互挖掘深层逻辑片段,后者通过改变交互信息与上下文信息的结合模式帮助编码器有效区分两者的重要性差异。模型在SNLI测试集上获得了88.0%的识别准确度,超过已有最佳模型,且使用的训练参数仅为它的一半。