Current Location:home > Detailed Browse

Article Detail

基于深度学习的中文微博作者身份识别研究

Submit Time: 2018-11-29
Author: 徐晓霖 1 ; 蔡满春 1 ; 芦天亮 1 ;
Institute: 1.中国人民公安大学 信息技术与网络安全学院;

Abstracts

作者身份识别一直在公安行业和文检工作中起着重要的作用。现有的作者语言风格建模过程繁琐、文本特征工程没有普适性。针对此问题,在无须专家进行特征建模的情况下,提出CABLSTM中文微博作者身份识别模型,并在公开微博语料集测试该模型准确度。该模型为最大化的提取短文本特征,融合Attention机制于CNN中并去除池化层,通过双向LSTM以获取上下文相关信息,身份识别结果通过Softmax层进行输出。实验结果表明,该模型在进行中文微博作者身份识别任务中与传统机器学习算法以及TextCNN和LSTM算法相对比,在准确率、召回率、F值方面都有一定的提升。
Download Comment From cooperative journals:《计算机应用研究》 Hits:683 Downloads:365
Journal:计算机应用研究
Recommended references: 徐晓霖,蔡满春,芦天亮.(2018).基于深度学习的中文微博作者身份识别研究.计算机应用研究.[ChinaXiv:201811.00197] (Click&Copy)
Version History
[V1] 2018-11-29 10:39:29 chinaXiv:201811.00197V1 Download
Related Paper

Download

Current Browse

Cross Subject Browse

  • - NO