分类: 计算机科学 >> 计算机应用技术 提交时间: 2017-03-09
摘要: 为了实现大词汇量连续语音识别技术的实际应用,本文提出了交互式语音识别的概念并着重研究其中的各项关键技术。所谓的交互式语音识别,是指为语音识别系统配置一位操作员,该操作员在语音识别过程中对识别系统进行指导监督并修正识别结果。同时,识别系统对交互信息进行学习,根据操作员的指导信息和修正信息对内部模型进行自适应调整,从而提高系统的识别性能。本文的研究工作是对当前大词汇量连续语音识别技术实际应用的发展和创新,具有重要科学技术意义和产业应用前景。同时,对语音识别在其他方向(如实时字幕生成,图书馆音频资料整理等)的应用具有实际的借鉴作用。
分类: 计算机科学 >> 计算机应用技术 提交时间: 2016-11-02
摘要: 非视觉语音浏览器和语音推送平台的研究和开发对解决视力残障人士(盲人和低视力者)上网具有重要的意义。本文介绍了非视觉语音浏览器和语音推送平台的发展,以及网页解析和语音推送等核心技术研究现状,提出了基于网页内容解析、采用分块浏览方式的语音推送平台解决方案,并阐述了相关系统架构和关键技术。借助语音推送系统,视力残障人士将能够方便快捷地获取网络信息和资源。
分类: 计算机科学 >> 计算机应用技术 提交时间: 2016-11-02
摘要: 现有人机交互方式大多针对普通人的需要设计,盲人使用计算机输入文字存在很大困难。针对这一现状,本文提出了一种完全符合盲人日常书写习惯的盲文点字输入系统,包括盲文点字输入装置和点字处理软件两个部分。系统通过电路触点方式获取用户输入的点字信息并由USB 接口传输至计算机;计算机中的盲文点字处理软件对点字信息进行处理,并采用自然语言处理的相关技术,将整句的盲文自动转换为汉字。实验结果证明了本文盲文点字到汉字转换方法的有效性。
分类: 计算机科学 >> 计算机应用技术 提交时间: 2016-11-02
摘要: 残疾人信息无障碍技术的目标是利用先进的信息技术和手段,消除残疾人在信息获取、使用和交流中遇到的各种障碍。本文概述了国内外在信息无障碍技术领域的研究概况,介绍了一批代表性的信息无障碍产品,并对当前的研究、产业现状和未来发展趋势做了分析和预测。
分类: 计算机科学 >> 计算机应用技术 提交时间: 2016-05-03
摘要: 自然的远程交互一直是人们追求的目标。随着普适计算技术和宽频网络技术的发展,在互联网上通过远程视频实现跨地区交流和合作成为可能。但是,传统的视频对话系统视频质量差、操作复杂,影响了远程交互的自然感受。近年来出现的一些远程呈现技术由于专注于提高人与人沟通的质量,而忽视了计算系统正由人机共生系统转化为人机物协调社会所产生的需求,因此难以实现人机物之间的自然远程交互。为了营造自然的沉浸式交互环境,让参与者有身临其境的感觉,本文对人机物三元融合端计算技术进行了研究。三元融合端计算技术是一种以用户为中心实现端内以及端间互动计算的技术,具体包括端内的人-机交互和机物协同以及端间的人-机-人交互、人-机-物交互和物-机-物交互计算技术。其中,端指一个由人、机、物构成的三元微世界。基于人机物三元融合端计算框架,我们搭建了爱心小屋远程亲情互动平台,旨在融合沉浸式人-人交互、启发式人-机交互、高保真机物协同三元交互技术,提供一个面向跨地区交流和合作的沉浸式、易操作、高保真的远程自然交互端平台。目前该平台已经成功在一个打工企业和一个村委会进行一期部署,取得了良好的社会效益。