您选择的条件: 姜恩波
  • 科学文献与科学数据的融合方法与实例 研究

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-10-08 合作期刊: 《知识管理论坛》

    摘要: [ 目的 / 意义 ] 关注开放科学运动的发展以及科学数据对科学研究的影响,介绍科学文献与科学 数据融合的实例,阐述科学文献与科学数据融合的方法与困难。[ 方法 / 过程 ] 描述文献与数据分离的现 状,说明二者融合的推动因素,通过案例介绍了科学文献与科学数据融合的 3 种呈现方式。[ 结果 / 结论 ] 科学文献与科学数据的融合是科学研究本身的一种需要,同时也是开放科学与大数据对现代科学研究的一 种影响形式。在实际应用中主要有“硬关联”“软关联”和“深度融合”三种方式。科学文献与科学数据 的深度融合需要顶级学术机构的综合性措施来推动。

  • 面向开放科学的元出版理念与平台建设实践

    分类: 统计学 >> 社会统计学 提交时间: 2023-08-12 合作期刊: 《中国科学院院刊》

    摘要: 基于对国内外开放出版领域的充分调研,阐述开放科学对学术交流体系与机制演变的推动作用,着重 分析总结学术出版模式的历史演进、发展更迭与演变规律,提出适应开放科学时代需求的元出版理念,以适 应学术出版的发展演进与模式转变态势。基于“元出版”概念,提出了元出版平台建设思路,以推动建设科 学共同体主导的、融合多样化出版内容、实现多维度内容关联、聚合多元参与者、支持科学成果再集成的开 放科学学术出版新范式。按元出版平台的设计思路,建成包含结构化出版物引擎、同行评议子系统、开放出 版子系统、知识发现子系统和学术交流社区子系统等 5 个模块的元出版平台 MetaPub。元出版平台是与开放 科学发展趋势相适应的具体实践,将在科学共同体开展学术交流的过程中发挥积极支撑作用。

  • 研究图书馆数字资源建设的转型与发展-以中国科学院文献情报系统为例

    分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2023-07-26 合作期刊: 《图书情报工作》

    摘要: [目的/意义]旨在对研究图书馆数字资源建设转型与发展,特别是开放资源触发的第二次转型与发展进行总结,以探索研究图书馆数字资源建设的未来发展方向。[方法/过程]以中国科学院文献情报系统为例,梳理其数字资源建设实践与成效,并对今后发展做出预期以综合科技资源、开放资源建设为转型基础,以细粒化的知识关联与呈现为发展目标。[结果/结论]研究图书馆在数字资源建设转型时会遇到诸多问题,提出以下建议:①制定明确的数字资源建设方案;②合理投入经费、人力和技术;③明确开放资源使用权益,积极推动开放获取;④加强开放资源建设的馆际合作与共享;⑤加强知识资源组织的跨界合作。

  • 政策工具自动识别方法与实证研究

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2023-04-01 合作期刊: 《图书情报工作》

    摘要: [目的/意义] 政策工具的识别与分析是政策研究的重要手段之一。此项工作目前多以人工开展。本文运用深度学习方法进行政策工具的自动识别,以期提高政策工具识别的效率。[方法/过程] 设计与实施政策数据采集与清洗——政策工具人工标引——模型训练——结果解读的政策工具自动识别的实验流程,并以北上广贵四地的政府信息公开政策为例,对比传统机器学习方法和深度学习方法在政策工具识别任务上的性能表现。此外,提出整合政策全局信息进行各段落政策工具识别的方案,并通过实验证明方案的有效性。[结果/结论] 深度学习模型CNN在全量测试数据上达到76.51%的准确率,整合全局信息的CNN模型达到77.13%的准确率。而仅对模型的高置信度结果进行评估发现,整合全局信息的CNN模型在其中55.63%的测试数据上准确率达到了95.44%。该准确率已经达到了实用的要求,表明超过一半的政策工具标引可以借用模型的高置信度结果,无需人工复核。基于深度学习方法研究政策工具的自动识别取得较好的效果,提升政策工具标引的效率,为大数据量的政策工具自动识别提供正面经验。

  • 文本相似度计算方法研究综述

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-12-05 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】分析文本相似度计算方法, 了解该领域的发展态势。【文献范围】在 CNKI 和 Web of Science 中 分别以检索式“篇名: 文本相似度 OR 篇名: 词汇相似度 OR 篇名: 语义相似度”和“TI: ‘text similarity’ or ‘semantic similarity’ or ‘lexical similarity’ ”并限定文献类型进行检索, 最终得到 69 篇重点文献。【方法】对文本相 似度计算方法进行系统梳理, 分析重点方法的基本思想、特点并总结未来发展方向。【结果】形成了较为全面的 分类描述体系, 文本相似度计算方法可分为 4 类: 基于字符串的方法、基于语料库的方法、基于世界知识的方法 和其他方法。其中, 基于神经网络和基于世界知识的方法以及针对跨领域文本的相似度计算将成为该领域的发 展趋势。【局限】仅将不同方法本身作为探讨的核心, 未进一步分析方法的应用情况。【结论】有助于全面把握 和深入了解文本相似度计算方法的研究现状和未来趋势。

  • 文本相似度计算方法研究综述

    分类: 图书馆学、情报学 >> 情报学 提交时间: 2017-11-30 合作期刊: 《数据分析与知识发现》

    摘要: 【目的】分析文本相似度计算方法, 了解该领域的发展态势。【文献范围】在 CNKI 和 Web of Science 中 分别以检索式“篇名: 文本相似度 OR 篇名: 词汇相似度 OR 篇名: 语义相似度”和“TI: ‘text similarity’ or ‘semantic similarity’ or ‘lexical similarity’ ”并限定文献类型进行检索, 最终得到 69 篇重点文献。【方法】对文本相 似度计算方法进行系统梳理, 分析重点方法的基本思想、特点并总结未来发展方向。【结果】形成了较为全面的 分类描述体系, 文本相似度计算方法可分为 4 类: 基于字符串的方法、基于语料库的方法、基于世界知识的方法 和其他方法。其中, 基于神经网络和基于世界知识的方法以及针对跨领域文本的相似度计算将成为该领域的发 展趋势。【局限】仅将不同方法本身作为探讨的核心, 未进一步分析方法的应用情况。【结论】有助于全面把握 和深入了解文本相似度计算方法的研究现状和未来趋势。