Current Location:home > Browse
Your conditions: 蔡满春(1)

1. chinaXiv:201811.00197 [pdf]

基于深度学习的中文微博作者身份识别研究

徐晓霖; 蔡满春; 芦天亮
Subjects: Computer Science >> Integration Theory of Computer Science

作者身份识别一直在公安行业和文检工作中起着重要的作用。现有的作者语言风格建模过程繁琐、文本特征工程没有普适性。针对此问题,在无须专家进行特征建模的情况下,提出CABLSTM中文微博作者身份识别模型,并在公开微博语料集测试该模型准确度。该模型为最大化的提取短文本特征,融合Attention机制于CNN中并去除池化层,通过双向LSTM以获取上下文相关信息,身份识别结果通过Softmax层进行输出。实验结果表明,该模型在进行中文微博作者身份识别任务中与传统机器学习算法以及TextCNN和LSTM算法相对比,在准确率、召回率、F值方面都有一定的提升。

submitted time 2018-11-29 From cooperative journals:《计算机应用研究》 Hits684Downloads365 Comment 0

  [1 Pages/ 1 Totals]