• 动态热门话题的“特征词条本体”自动构建与进化研究*

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】设计一种“特征词条本体”的自动构建及进化算法。【应用背景】热门话题产生的时间和话题演化往往是快速的, 且涉及领域广泛, 而现有的本体自动构建研究局限于具体领域的知识表达, 无法有效地对这种动态热门话题进行本体语义支持, 也不能进行有效跟踪与优化。【方法】通过对热门话题中关键事件的内容分析并由特征词组合而成的“特征词条本体”来描述热门话题的方法, 设计一种快速自动生成“特征词条本体”的算法;在初始本体指导下, 利用话题跟踪结果进行“特征词条本体”进化算法的设计, 以满足不断更新的话题语义表述需求。【结果】针对热门话题“魏则西百度推广事件”, 使用爬虫工具采集11 174 条新浪微博作为语料库进行实验,抽取生成拥有7421个特征词条、39 个特征词节点、781个特征词关系的初始本体, 基于话题跟踪结果进化为拥有24564个特征词条, 67 个特征词节点, 1 818 个特征词关系的进化本体, 其漏报率、误报率、损耗代价分别为0.1261, 0.0964, 0.5985, 优于TF-IDF 算法。【结论】“特征词条本体”的表述方式明显比单个词汇的本体表述准确率高, 且语义相似度更容易计算, 比较符合动态热门话题的快速语义处理。

  • 个体视角下的网络舆情传递链路预测分析

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-10-11 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】通过网络舆情传播中网民个体的“从众效应”和“阈值效应”的传递特点分析, 对舆情传递的链路结构进行预测。【方法】采集真实网络舆情传递在线数据, 利用舆情传递个体的节点属性及舆情传递网络结构的已知信息, 使用链路预测方法, 分别针对网络舆情无标度(BA)网络模拟数据和真实舆情传递网络数据, 预测已有节点间即将产生的舆情传递连接。【结果】通过网络数据仿真和BBS 真实数据链路预测分析发现, 在众多的链路预测相似性指标中, 局部路径指标(LP)算法得出的链路预测结论正确率最高, 说明LP 算法适合此类舆情传递网络的链路预测分析。【局限】仅限于对已有链路预测相似性指标的应用, 没有对传统链路预测相似性指标进行相应的改进。【结论】从数据角度提供一个有效的预测舆情发展趋势的分析方法, 以期为网络舆情控制提供相关理论支持。

  • 语义社会网络的超网络模型构建及关键节点自动化识别方法研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-10-11 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】通过对语义社会网络的建模, 讨论如何识别对舆论传播演化起核心作用的关键节点。【方法】引入超网络理论对微博语义社会网络进行理论建模, 使用情感本体以及LDA 话题模型对数据实现节点量化, 提出超边排序算法对用户节点进行计算和排序从而获取关键节点。【结果】利用真实微博网络数据编程实现超网络模型的构建和量化, 通过结果分析证明本文的关键节点识别方法在实际应用场景中的有效性和准确性。【局限】关键节点识别方法的实时应用效果和对识别关键节点后如何有效引导和干预机制未能全面涉及。【结论】本文的关键节点识别方法能够挖掘出微博网络的关键节点, 为政府对网络舆情监管和引导提供一种解决方案, 减少负面内容和消极舆论对互联网健康发展的影响。