ChinaXiv.org 中国科学院科技论文预发布平台

按提交时间

按主题分类

按作者

按机构

当前资源共 6条

隐藏摘要

点击量

时间

下载量

您选择的条件: 2016-06-12

1. ChinaXiv:201606.00098
下载全文

实体名称规范的研究探索

分类：图书馆学、情报学 >> 情报学提交时间： 2016-06-12

刘建华郭红梅

摘要：本文以文本处理中的基本任务之一--实体名称规范为主题，阐明了实体名称规范中两[摘要]本文以文本处理中的基本任务之一--实体名称规范为主题，阐明了实体名称规范中两种类型的任务，一个实体多个名称的实体共指消解问题和一个名称指代不同实体的实体歧义问题，结合这两类任务，综合分析了当前的相关研究成果，重点介绍了当前解决实体名称规范时典型的思路与方法，推动实体名称规范研究的重要的项目与重要评测会议，并结合当前研究中仍存在的问题，分析探讨了实体名称规范的研究趋势。

同行评议状态:待评议

点击量 17641 下载量 1775 评论
2. ChinaXiv:201606.00097
下载全文

面向商品评论文本的情感分析与挖掘

分类：计算机科学 >> 自然语言理解与机器翻译提交时间： 2016-06-12

李涵昱周鹏飞

摘要：随着电子商务的快速发展，互联网上出现大量商品评论信息，商品评论文本的情感分析与挖掘对于研究商品口碑、进行商品推荐都具有重要的价值。文中设计商品属性提取与过滤算法、情感词判别算法，分析商品的评论信息并自动抽取用户关注的商品属性和用户对相应属性的评价观点，进一步将其应用于商品评价文本的情感倾向性分析。在真实数据集上进行测试取得了准确率81.08%，召回率88.23%。

同行评议状态:待评议

点击量 4559 下载量 3082 评论
3. ChinaXiv:201606.00096
下载全文

保存元数据的发展趋势研究

分类：图书馆学、情报学 >> 图书馆学提交时间： 2016-06-12

刘建华张智雄

摘要：数字资源长期保存中，保存元数据是支持数字资源长期可生存能力、可呈现能力、可理解能力、真实性、一致性的重要信息。为了全面了解保存元数据的最新发展，为国内从事长期保存的机构制定长期保存元数据的实施策略、建设方案提供参考，笔者综合分析了长期保存领域核心理论标准、重要会议和重要项目的研究进展，总结归纳了保存元数据在权利元数据，重要属性元数据，特殊类型数字资源及学科化特色的保存元数据、保存元数据的语义化、起源元数据等方面的重要发展趋势。

同行评议状态:待评议

点击量 3052 下载量 1346 评论
4. ChinaXiv:201606.00095
下载全文

VIVO语义网技术在干部信息管理中的应用

分类：计算机科学 >> 计算机科学的集成理论提交时间： 2016-06-12

任玮黄金霞

摘要：摘要：干部信息管理系统存在着数据管理效率低下、搜索结果简单的问题。基于 VIVO 语义摘要：干部信息管理系统存在着数据管理效率低下、搜索结果简单的问题。基于 VIVO 语义网技术在关联数据、本体知识库以及语义搜索的实现机制，设计干部信息智能分析系统架构，构建 RDF 协议定义的干部信息本体知识库，建立不同类型数据之间的关系映射，实现数据关联和隐性数据发现，提高干部信息管理系统语义搜索效率。结构化和关联性的本体框架也降低信息管理成本。

同行评议状态:待评议

点击量 4991 下载量 1481 评论
5. ChinaXiv:201606.00094
下载全文

A systematic method for technology assessment: Illustrated for ‘Big Data’

分类：图书馆学、情报学 >> 情报学提交时间： 2016-06-12

Liu,Jianhua Guo, Ying Alan Porter Huang,Ying

摘要： Technology assessment is a systematic examination of the effects on or of new developments such as technologies, processes, policies, organizations, and so on. In this paper, we present a systematic method for technology assessment, as a part of the suite of tools for Forecasting Innovation Pathways (FIP). We explore means to combine tech mining tools with human intelligence in several idea exchange rounds to uncover potential secondary effects, and array them in terms of likelihood and magnitude. Big Data is studied as the case study. This is on-going research. We are currently on the 2nd round of stage 2. Technology assessment is a necessary component of FIP. It identifies areas in which significant impacts may occur, their likelihood, and their significance. The forecaster must evaluate these impacts, consider measures to enhance or inhibit them, and factor them into the planning process for developing the technology.

同行评议状态:待评议

点击量 34087 下载量 1415 评论
6. ChinaXiv:201606.00093
下载全文

生物多样性语义知识抽取研究探索

分类：图书馆学、情报学 >> 情报学提交时间： 2016-06-12

刘建华

摘要： [目的]拓展以物种为中心的生物多样性知识抽取框架，探索实现语义知识抽取方法 [方法]结合当前生物多样性抽取的主流研究，以物种为中心，设计包含多种实体及实体间关系的知识抽取框架，利用已有的众多专业数据库，设计并实现相应的识别方法。 [结果]设计了以物种为核心的知识抽取框架，探索实现了多种实体及实体间关系的语义知识抽取方法，拓展了生物多样性领域抽取内容和思路。 [局限]本研究实体识别的完整性和准确性受底层知识库影响较大，且实体间关系的类型局限于共现、上下位类、语法关系几类，还需进一步研究。 [结论] 拓展了生物多样性领域抽取内容和思路，可有效支持后续的语义检索、科学计算。

同行评议状态:待评议

点击量 15830 下载量 1501 评论

实体名称规范的研究探索

面向商品评论文本的情感分析与挖掘

保存元数据的发展趋势研究

VIVO语义网技术在干部信息管理中的应用

A systematic method for technology assessment: Illustrated for ‘Big Data’

生物多样性语义知识抽取研究探索