分类: 图书馆学、情报学 >> 情报学 提交时间: 2016-06-12
摘要: 本文以文本处理中的基本任务之一--实体名称规范为主题,阐明了实体名称规范中两[摘要]本文以文本处理中的基本任务之一--实体名称规范为主题,阐明了实体名称规范中两种类型的任务,一个实体多个名称的实体共指消解问题和一个名称指代不同实体的实体歧义问题,结合这两类任务,综合分析了当前的相关研究成果,重点介绍了当前解决实体名称规范时典型的思路与方法,推动实体名称规范研究的重要的项目与重要评测会议,并结合当前研究中仍存在的问题,分析探讨了实体名称规范的研究趋势。
分类: 计算机科学 >> 自然语言理解与机器翻译 提交时间: 2016-06-12
摘要: 随着电子商务的快速发展,互联网上出现大量商品评论信息,商品评论文本的情感分析与挖掘对于研究商品口碑、进行商品推荐都具有重要的价值。文中设计商品属性提取与过滤算法、情感词判别算法,分析商品的评论信息并自动抽取用户关注的商品属性和用户对相应属性的评价观点,进一步将其应用于商品评价文本的情感倾向性分析。在真实数据集上进行测试取得了准确率81.08%,召回率88.23%。
分类: 图书馆学、情报学 >> 图书馆学 提交时间: 2016-06-12
摘要: 数字资源长期保存中,保存元数据是支持数字资源长期可生存能力、可呈现能力、可理解能力、真实性、一致性的重要信息。为了全面了解保存元数据的最新发展,为国内从事长期保存的机构制定长期保存元数据的实施策略、建设方案提供参考,笔者综合分析了长期保存领域核心理论标准、重要会议和重要项目的研究进展,总结归纳了保存元数据在权利元数据,重要属性元数据,特殊类型数字资源及学科化特色的保存元数据、保存元数据的语义化、起源元数据等方面的重要发展趋势。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2016-06-12
摘要: 摘要:干部信息管理系统存在着数据管理效率低下、搜索结果简单的问题。基于 VIVO 语义摘要:干部信息管理系统存在着数据管理效率低下、搜索结果简单的问题。基于 VIVO 语义网技术在关联数据、本体知识库以及语义搜索的实现机制,设计干部信息智能分析系统架构,构建 RDF 协议定义的干部信息本体知识库,建立不同类型数据之间的关系映射,实现数据关联和隐性数据发现,提高干部信息管理系统语义搜索效率。结构化和关联性的本体框架也降低信息管理成本。
分类: 图书馆学、情报学 >> 情报学 提交时间: 2016-06-12
摘要: Technology assessment is a systematic examination of the effects on or of new developments such as technologies, processes, policies, organizations, and so on. In this paper, we present a systematic method for technology assessment, as a part of the suite of tools for Forecasting Innovation Pathways (FIP). We explore means to combine tech mining tools with human intelligence in several idea exchange rounds to uncover potential secondary effects, and array them in terms of likelihood and magnitude. Big Data is studied as the case study. This is on-going research. We are currently on the 2nd round of stage 2. Technology assessment is a necessary component of FIP. It identifies areas in which significant impacts may occur, their likelihood, and their significance. The forecaster must evaluate these impacts, consider measures to enhance or inhibit them, and factor them into the planning process for developing the technology.
分类: 图书馆学、情报学 >> 情报学 提交时间: 2016-06-12
摘要: [目的]拓展以物种为中心的生物多样性知识抽取框架,探索实现语义知识抽取方法 [方法]结合当前生物多样性抽取的主流研究,以物种为中心,设计包含多种实体及实体间关系的知识抽取框架,利用已有的众多专业数据库,设计并实现相应的识别方法。 [结果]设计了以物种为核心的知识抽取框架,探索实现了多种实体及实体间关系的语义知识抽取方法,拓展了生物多样性领域抽取内容和思路。 [局限]本研究实体识别的完整性和准确性受底层知识库影响较大,且实体间关系的类型局限于共现、上下位类、语法关系几类,还需进一步研究。 [结论] 拓展了生物多样性领域抽取内容和思路,可有效支持后续的语义检索、科学计算。