您选择的条件: 安仲杰
  • 基于地理坐标的微博事件检测与分析

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-10-11 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】利用数据挖掘算法, 从海量繁杂的微博数据中检测出有价值的事件信息。【方法】针对国内具有代表性的微博网站, 通过使用微博网络开放接口高效收集带有地理坐标的微博数据。使用K-means、KNN 和决策树三种数据挖掘算法, 根据微博数据的发布数、转发数、评论数、用户活跃度和移动强度5 个指标构建微博的地理规律性特征。将日常地区性的微博数据特征与该地区微博特征的地理规律性进行比较, 从而检测出该区域是否有事件发生。【结果】以2015 年4 月15 日、16 日的微博数据作为测试语料, 使用文中提出的微博事件检测框架, 成功检测到“北京沙尘暴”事件。【局限】在抽取微博地理规律性特征时, 采用的样本数据偏少, 一定程度上影响了事件检测框架的效果。【结论】基于地理坐标的微博事件检测框架是切实有效的, 分析出的事件信息不仅可以帮助用户获取感兴趣的事件资讯, 而且可以协助政府部门进行舆情管控和行政决策。