分类: 其他 >> 综合 提交时间: 2023-03-28 合作期刊: 《中国科学院院刊》
摘要: 近年来,大数据技术与系统在性能和效率方面已经取得了显著的提升,大数据应用到各个行业,赋能产业智能化发展,成为信息社会进入智能化阶段的关键要素。然而,大数据技术发展也面临着更深层次的挑战,如数据泛滥与高价值数据缺失并存、大数据分析研判复杂不确定、数据流通共享与数据可信安全使用难以兼顾等。这些挑战将推动大数据分析处理技术的创新变革,促进新技术体系的建立与发展。文章面向大数据分析处理面临的新架构、新模式、新范式和安全可信需求,提出构建新一代大数据分析处理系统栈,探索大数据价值利用新范式,并展望新技术体系下的牵引性需求与重大应用。
分类: 其他 >> 综合 提交时间: 2023-03-28 合作期刊: 《中国科学院院刊》
摘要: 数据科学的发展,将为计算智能的持续发展提供新的可能与机遇;与此同时,计算智能的发展与新型智能范式的兴起,也将为大数据在各行业和各领域的应用提供新的契机。文章阐述了数据科学的内涵,探讨了计算智能的发展与新型智能范式,列举了引领数据科学与计算智能研究的应用方向;进而基于香山科学会议第667次学术讨论会与会专家的讨论,提炼形成数据科学与计算智能领域的七大关键问题,以期使该领域研究得到相关领域研究者与应用者的共同关注,从而把握时代的机遇,推动数据科学与计算智能持续发展。
分类: 计算机科学 >> 计算机网络 提交时间: 2017-03-10
摘要: 随着网络数据的爆炸性增长,信息处理技术面临着前所未有的巨大挑战。如何从体量巨大、增长迅速、结构复杂、良莠不齐的数据中发掘潜在价值成为了关键难题。面向网络大数据的信息检索与挖掘技术,旨在通过对大数据的深度分析与建模,有效弥合用户需求与网络数据之间的信息鸿沟。本文介绍了面向网络大数据的深度检索与挖掘的一系列关键技术,包括用户查询理解与处理、文档建模与理解及检索模型等。
分类: 计算机科学 >> 计算机网络 提交时间: 2017-03-09
摘要: 随着网络在线视频的广泛应用,对等传输(P2P)技术越来越受到业界的重视。我们开发的CoolFish是一个基于对等传输技术,集视频点播、直播于一体的流媒体系统。在本文中,我们基于CoolFish 系统,对目前流行的视频传输技术做了较为详细的探讨和阐述,并对CoolFish 的架构、功能和模块设计进行了全面介绍,另外,我们对CoolFish 系统中涉及到的对等传输关键技术和算法进行了深入探讨。
分类: 计算机科学 >> 计算机应用技术 提交时间: 2017-03-09
摘要: 随着互联网信息的指数增长,为了提高信息挖掘的效率,信息检索与话题检测等技术近年得到了广泛关注。本文首先回顾了话题检测与跟踪技术发展的历史,并在介绍传统话题检测方法的基础上,从突发性检测与基于社会网络的话题检测与跟踪方法两个方面进行深入探讨;对话题检测与跟踪的评价方法进行了分析;最后展望了话题检测与跟踪方法的发展趋势。
分类: 计算机科学 >> 计算机应用技术 提交时间: 2017-03-09
摘要: 网络等技术的快速发展,使人们能够访问的数据规模急剧增加。如何从海量信息中找到需要的信息成为难题。信息检索技术是应对该问题的有效手段,可以快速有效地帮助人们找到自己需要的信息。本文介绍了检索技术中使用的索引组织、检索模型、查询分析等关键技术及本课题组开发和维护的高性能开源检索系统FirteX。
分类: 计算机科学 >> 计算机应用技术 提交时间: 2017-03-09
摘要: 如何对大规模富含情感信息的文本进行倾向性分析是当前web应用一个亟待解决的问题。本文在分析目前国内外情感倾向性分析研究现状的基础上,介绍了我们为进行中文情感倾向性分析所构建的语料集及开发的实验平台,然后重点介绍我们的工作,包括整篇文本的倾向性分析、领域情感词典构建、跨领域情感倾向性分析等方面的关键技术,从而通过不同角度提高文本倾向性分析精度。最后总结了我们已有的工作,并展望下一步我们将深入开展的研究工作。
分类: 计算机科学 >> 计算机应用技术 提交时间: 2017-03-09
摘要: 信息抽取是当前搜索引擎与自然语言处理研究领域的核心技术之一,它用来对文本做匹配,以获得其中包含的各种实体以及它们的属性及关系。本文对实体及其属性的抽取做了简单介绍,包括基于规则的抽取技术和基于统计的抽取技术,并介绍了几个典型的系统实例,如:IE2、GATE和SystemT及它们的原理,最后简单介绍了我们在这个领域的工作成果。