ChinaXiv.org 中国科学院科技论文预发布平台

按提交时间

2023
1
2017
2

按主题分类

情报学
3

按作者

按机构

当前资源共 3条

隐藏摘要

点击量

时间

下载量

您选择的条件: 首欢容

1. ChinaXiv:202304.00313
下载全文

基于修正点互信息的特征级情感词极性自动研判

分类：图书馆学、情报学 >> 情报学提交时间： 2023-04-01 合作期刊: 《图书情报工作》

聂卉首欢容

摘要： [目的/意义] 基于语料的情感词发现依语句上下文推断情感词极性，能显著提升情感分析的准确率，在面向领域的特征级情感分析任务中有重要应用价值。[方法/过程] 对特征级情感极性研判问题展开探讨，提出基于点互信息的特征-情感对情感极性自动判别算法，算法借助大规模领域语料，根据观点表达特征-情感对与情感语义明确的种子词的共现关系，同时引入依存句法分析语句间的情感转折，通过修正经典的点互信息算法，对上下文约束下的用户观点表达进行褒贬预测。[结果/结论] 实验证明，修正算法的性能显著优于词典匹配算法和经典的点互信息情感识别算法，不仅能够推断词典中未纳入的观点表达的情感指向，而且能较准确地推断语境中的情感词极性。在餐饮评论和数码产品评论两个评测语料集上，修正算法的F1宏平均指标分别达到0.827和0.878。该算法以领域相关的大规模语料为支撑，基于概率统计和句法分析，因数据获取便利，算法效率高，移植性好，具有普适性，尤其适用于面向领域的情感分析任务。

点击量 152 下载量 88 评论
2. ChinaXiv:201712.01388
下载全文

基于情感分析的网络谣言识别方法

分类：图书馆学、情报学 >> 情报学提交时间： 2017-12-05 合作期刊: 《数据分析与知识发现》

首欢容邓淑卿徐健

摘要：【目的】提出一种基于情感分析技术自动识别特定领域谣言的方法。【方法】界定高、低质量信息源, 在假设高质量信息源信息更可靠的情况下, 通过基于情感词典的情感分析方法, 量化高质量信息源与低质量信息源对特定对象的情感差异, 判定低质量信息源提供的信息是否属于谣言。【结果】将该方法应用于“食品养生”、 “医学健康”两个领域进行谣言识别。在 30 个疑似谣言案例中准确识别出 23 个谣言案例, 准确率为 76.67%。本文提出的谣言识别方法在谣言预测方面的 F 值为 83.34%, 查全率为 71.42%, 查准率为 100%; 在非谣言文本预测上的 F 值为 72.73%, 查全率为 100%, 查准率为 57.14%。【局限】未实现不同信息源数据自动抽取, 每个谣言案例下的人工收集的谣言数量有限。【结论】本文基于情感分析的谣言识别方法对特定类型的谣言是有效的。

点击量 1837 下载量 1048 评论
3. ChinaXiv:201712.01604
下载全文

基于情感分析的网络谣言识别方法

分类：图书馆学、情报学 >> 情报学提交时间： 2017-11-30 合作期刊: 《数据分析与知识发现》

首欢容邓淑卿徐健

摘要：【目的】提出一种基于情感分析技术自动识别特定领域谣言的方法。【方法】界定高、低质量信息源, 在假设高质量信息源信息更可靠的情况下, 通过基于情感词典的情感分析方法, 量化高质量信息源与低质量信息源对特定对象的情感差异, 判定低质量信息源提供的信息是否属于谣言。【结果】将该方法应用于“食品养生”、 “医学健康”两个领域进行谣言识别。在 30 个疑似谣言案例中准确识别出 23 个谣言案例, 准确率为 76.67%。本文提出的谣言识别方法在谣言预测方面的 F 值为 83.34%, 查全率为 71.42%, 查准率为 100%; 在非谣言文本预测上的 F 值为 72.73%, 查全率为 100%, 查准率为 57.14%。【局限】未实现不同信息源数据自动抽取, 每个谣言案例下的人工收集的谣言数量有限。【结论】本文基于情感分析的谣言识别方法对特定类型的谣言是有效的。

点击量 2721 下载量 2008 评论

基于修正点互信息的特征级情感词极性自动研判

基于情感分析的网络谣言识别方法

基于情感分析的网络谣言识别方法