随着网络数据的爆炸性增长,信息处理技术面临着前所未有的巨大挑战。如何从体量巨大、增长迅速、结构复杂、良莠不齐的数据中发掘潜在价值成为了关键难题。面向网络大数据的信息检索与挖掘技术,旨在通过对大数据的深度分析与建模,有效弥合用户需求与网络数据之间的信息鸿沟。本文介绍了面向网络大数据的深度检索与挖掘的一系列关键技术,包括用户查询理解与处理、文档建模与理解及检索模型等。 |
submitted time 2017-03-10 Hits2743, Downloads1922, Comment 0
submitted time 2017-03-10 Hits16981, Downloads2446, Comment 0
submitted time 2017-03-09 Hits2040, Downloads1489, Comment 0
submitted time 2017-03-09 Hits50325, Downloads9894, Comment 0
CoolFish:一个兼容BitTorrent的P2P视频点播、直播系统
李哲中; 张铁赢; 刘悦; 程学旗
随着网络在线视频的广泛应用,对等传输(P2P)技术越来越受到业界的重视。我们开发的CoolFish是一个基于对等传输技术,集视频点播、直播于一体的流媒体系统。在本文中,我们基于CoolFish 系统,对目前流行的视频传输技术做了较为详细的探讨和阐述,并对CoolFish 的架构、功能和模块设计进行了全面介绍,另外,我们对CoolFish 系统中涉及到的对等传输关键技术和算法进行了深入探讨。 |
submitted time 2017-03-09 Hits2780, Downloads2033, Comment 0
随着互联网信息的指数增长,为了提高信息挖掘的效率,信息检索与话题检测等技术近年得到了广泛关注。本文首先回顾了话题检测与跟踪技术发展的历史,并在介绍传统话题检测方法的基础上,从突发性检测与基于社会网络的话题检测与跟踪方法两个方面进行深入探讨;对话题检测与跟踪的评价方法进行了分析;最后展望了话题检测与跟踪方法的发展趋势。 |
submitted time 2017-03-09 Hits3566, Downloads3066, Comment 0
网络等技术的快速发展,使人们能够访问的数据规模急剧增加。如何从海量信息中找到需要的信息成为难题。信息检索技术是应对该问题的有效手段,可以快速有效地帮助人们找到自己需要的信息。本文介绍了检索技术中使用的索引组织、检索模型、查询分析等关键技术及本课题组开发和维护的高性能开源检索系统FirteX。 |
submitted time 2017-03-09 Hits2437, Downloads1868, Comment 0
如何对大规模富含情感信息的文本进行倾向性分析是当前web应用一个亟待解决的问题。本文在分析目前国内外情感倾向性分析研究现状的基础上,介绍了我们为进行中文情感倾向性分析所构建的语料集及开发的实验平台,然后重点介绍我们的工作,包括整篇文本的倾向性分析、领域情感词典构建、跨领域情感倾向性分析等方面的关键技术,从而通过不同角度提高文本倾向性分析精度。最后总结了我们已有的工作,并展望下一步我们将深入开展的研究工作。 |
submitted time 2017-03-09 Hits3521, Downloads2993, Comment 0
信息抽取是当前搜索引擎与自然语言处理研究领域的核心技术之一,它用来对文本做匹配,以获得其中包含的各种实体以及它们的属性及关系。本文对实体及其属性的抽取做了简单介绍,包括基于规则的抽取技术和基于统计的抽取技术,并介绍了几个典型的系统实例,如:IE2、GATE和SystemT及它们的原理,最后简单介绍了我们在这个领域的工作成果。 |
submitted time 2017-03-09 Hits7668, Downloads5827, Comment 0