您当前的位置: > 详细浏览

基于深度学习的中文微博作者身份识别研究

请选择邀稿期刊:
摘要: 作者身份识别一直在公安行业和文检工作中起着重要的作用。现有的作者语言风格建模过程繁琐、文本特征工程没有普适性。针对此问题,在无须专家进行特征建模的情况下,提出CABLSTM中文微博作者身份识别模型,并在公开微博语料集测试该模型准确度。该模型为最大化的提取短文本特征,融合Attention机制于CNN中并去除池化层,通过双向LSTM以获取上下文相关信息,身份识别结果通过Softmax层进行输出。实验结果表明,该模型在进行中文微博作者身份识别任务中与传统机器学习算法以及TextCNN和LSTM算法相对比,在准确率、召回率、F值方面都有一定的提升。

版本历史

[V1] 2018-11-29 10:39:29 ChinaXiv:201811.00197V1 下载全文
点击下载全文
预览
许可声明
metrics指标
  •  点击量1596
  •  下载量868
评论
分享