您选择的条件: 李春旺
  • 基于核心主题特征的作者身份识别研究

    分类: 图书馆学、情报学 >> 情报检索 提交时间: 2023-02-09

    摘要: 【背景及目的】作者识别正在向多层次特征的使用发展,而相较于文体风格特征,主题特征在历来作者识别研究应用中仍是少数,特别是针对中文社交媒体文本的作者识别。同时针对主题特征的利用研究,更多的是对主题特征的抽取技术和方法的创新,而未对识别出的主题以及主题特征的应用方法进行进一步研究。所以,本研究以主题特征在中文社交媒体文本作者识别中的使用研究为基本目的,同时进一步制定策略对主题特征中的核心主题进行识别和筛选,优化主题特征的使用方法,从而提高主题特征在作者识别中的使用效果。【方法】研究首先利用LDA主题模型抽取候选作者的学术主题和社交主题,然后利用word2vec制定合并筛选策略进行核心主题的识别和表示,最后结合N-gram特征和相似度计算的办法实现作者识别。【结果】实验结果显示主题特征在本研究语料上对作者识别有一定的积极作用,同时本研究提出的核心主题特征相关策略和应用也能优化主题特征的使用效果。

  • 基于关联数据的类簇语义揭示模型研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-08 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】调研基于关联数据揭示类簇内主题词间语义关系的模型和技术方法。【方法】利用Google Scholar、Springer、CNKI 等检索与研究主题相关的文献, 调研分析并梳理当前类簇分析和语义关系揭示相关研究, 构建基于关联数据的类簇语义关系揭示模型, 通过实验验证模型的有效性。【结果】实验结果表明, 利用关联数据可以有效揭示主题词间语义关系, 弥补传统共词聚类分析在语义方面的不足。【局限】受实验数据限制, 目前揭示出的语义关系局限于上下位类关系、类与实例关系和相关关系等类型, 未考虑关联数据质量问题对语义揭示结果造成的影响。【结论】提出的基于关联数据的类簇语义关系揭示模型可以有效揭示主题词间语义关系, 为共词聚类结果的理解和分析提供一种新的方式。

  • 基于LOD的注释服务技术研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-05-17

    摘要: 本文对基于关联开放数据(LOD)进行的文本、图像和视频等Web 资源注释服务的相关技术方法进行了梳理和总结,介绍了注释流程中的关联数据查询、语义消歧技术、关联扩展技术、关联数据过滤技术和关联模型技术,并提出注释服务应用面临的问题。