您当前的位置: > 详细浏览

基于关键词关联度指标(KRI)进行LDA噪声主题过滤的方法研究

请选择邀稿期刊:

Topic Filtering of LDA Model Recognition Results Based on the Keywords Relevance Index (KRI)

摘要: [目的/意义] 针对LDA模型主题识别结果通常包含噪声主题的问题,建立科学有效的主题过滤方法,排除噪声主题,确保主题识别及后续演化分析的准确性。[方法/过程] 基于关键词之间的共现关系,构建关键词关联度指标(KRI),借助定量手段进行主题筛选和过滤。以单细胞研究领域为例,计算各主题-关键词分布的KRI值,与人工判读结果进行对比分析。[结果/结论] 实验结果表明,该方法能够有效排除LDA模型识别结果中的噪声主题,提高主题识别的准确性,也在一定程度上降低了主题识别过程对人工判读的依赖性。

版本历史

[V1] 2023-04-01 16:15:49 ChinaXiv:202304.00347V1 下载全文
点击下载全文
预览
许可声明
metrics指标
  •  点击量155
  •  下载量87
评论
分享