• 英文科技论文摘要的语义特征词典构建

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 论文摘要是信息组织的重要标引对象,将论文摘要按一定结构进行标引有利于科学传播、知识发现和情报分析。如何对现有非结构式摘要进行精准快速的自动标引是亟待解决的现实问题。[方法/过程] 假定不同类别的摘要具有内在一致性,即对结构式摘要的研究可为非结构式摘要自动标引提供方法和技术参考。据此,基于美国国家医学图书馆结构要素标签术语集和标签分类映射关系,提出结构要素BOMRC体系和结构式摘要的识别与规范化标引方法。其次选取研究样本并采用文本挖掘方法对样本语料中的单词、动词、三词词块、四词词块等词汇进行词频、TFIDF值等多个指标的定量统计分析,构建能够进行结构要素识别的语义特征词典。最后利用非结构式摘要测试集进行语义特征词典有效性检验。[结果/结论] 结果显示,利用语义特征词典方法能够有效识别非结构式摘要的各类要素,并可用于优化以机器学习方法为核心的自动识别模型。

  • 生物科学研究前沿演进时序分析

    分类: 其他 >> 综合 提交时间: 2017-04-20 合作期刊: 《中国科学院院刊》

    摘要: 识别、监测科学研究前沿的演进和迁移,有利于把握科技领域知识的流动规律,追溯科技领域的发展轨迹,为有效地遴选和追踪重点研究领域提供借鉴和参考。基于2013-2016年《研究前沿》报告,以生物科学领域为例,解读分析该领域40个热点研究前沿演进时序和发展态势,判断研究前沿的演进类型,揭示研究前沿的演进规律和特征。该方法可用于捕捉前沿领域的动态演化,识别研究前沿的发展时序和演化脉络。