工学 >>> 计算机科学技术 >>> 计算机科学技术基础学科 人工智能 计算机系统结构 计算机软件 计算机工程 计算机应用 计算机科学技术其他学科
搜索结果: 121-135 共查到计算机科学技术 语音相关记录226条 . 查询时间(0.161 秒)
介绍了孤立词语音识别系统,针对片上系统进行了语音识别算法的选择。对基于语音帧的端点检测算法、线性预测编码倒谱系数LPCC算法和动态时间规整DTW算法进行了分析和设计。对于新型语音识别SoC芯片的开发研制和推动片上可编程系统(SoPC)的研究与发展具有一定的理论和实践意义。
介绍了一种利用TI公司的TMS320VC5509定点DSP芯片实现多路全双工16kbps CVSD语音编解码的方案,给出了算法的详细设计过程,并基于Motorola公司的MPC860提出了利用嵌入式系统扩展DSP应用的方法,对DSP的其他方面应用也有一定的参考价值。
传统的身份识别系统利用单一的生物特征作为依据,在复杂背景下,系统性能往往会大幅下降。基于数据融合的多生物特征身份识别技术可以提高生物识别系统的准确率等性能。该文利用特征脸和矢量量化方法建立人脸识别和语音识别两个子系统,在决策层用神经网络融合子系统的输出来进行身份识别。实验证明该方法比单个子系统识别率高,在噪音环境下,优势明显。
视觉特征提取是听视觉语音识别研究的热点问题。文章引入了一种稳健的基于Visemic LDA的口形动态特征,这种特征充分考虑了发音时口形轮廓的变化及视觉Viseme划分。文章同时提出了一利利用语音识别结果进行LDA训练数据自动标注的方法。这种方法免去了繁重的人工标注工作,避免了标注错误。实验表明,将’VisemicLDA视觉特征引入到听视觉语音识别中,可以大大地提高噪声条件下语音识别系统的识别率;将...
为了适合非特定人语音识别,提出了一种由多条并行马尔可夫链组成的并行HMM(Parallel Hidden Markov Model,PHMM),从而融合了基于分类的语音识别中为各个类别建立的模板,提高了识别性能,各条链之间允许有交叉,使得融合的多模板之间存在状态共享,同时PHMM可以在训练过程中自动完成聚类,且测试语音的输出结果来自所有类别,无需聚类分析和类别判断,这些都减少了存储量和计算量,汉语...
目前PSTN网中主要仍然采取电路交换技术,由于电路交换技术有许多先天不足,如线路利用率低,因而人们一直在寻求新的交换方案。随着计算机网络技术的迅猛发展,特别是INTERNET的发展。出现了多种很有吸引力的方案以代替传统公用电话网和租用线路,分组语音技术就是其中的一种。分组语音技术具有很多诱人的优点:首先,分组语音占用的传输带宽可根据用户的要求来调整,以达到最经济有效地利用信道;其次,利用分组语音技...
基于分层设计的思想,设计了一种通用程序架构,可通过灵活配置来构建中小规模的呼叫中心,有效缩短了呼叫中心的建设周期,提高了软件的开发效率,为中小型呼叫中心的建设提供了一个参考模型,分析实现了流程控制动态配置技术方案,通过实践证明了基于语音卡的呼叫中心通用架构设计思想的正确性和可行性。
通过实验分析了国内流行的即时通信软件——腾讯QQ的流量特征以及其语音会话的流量特征,应用净荷深度检测(DPI)和智能会话关联(ISA)技术来识别腾讯语音通话流量,设计了腾讯语音业务流量的识别模型和算法。模型和算法的准确性、可扩展性和健壮性在电信运营商IP骨干网中得到了验证。
SinoSonic是清华大学计算机科学与技术系和北京炎黄新星科技发展有限公司联合开发的中英文文语转换系统。它是在国家863和国家自然科学基金的长期资助下的结晶,采用了目前世界最先进的数据驱动技术,利用精心设计的语音语料库对TTS系统进行训练,得到的系统体现了自然语言的特性,从而使系统发音自然、亲切,用户乐于接受。系统的构成分为:用户编程接口以及TTS内核两大部分。其中,内核部分又可以按照系统运作的...
产品功能及应用领域:中文语音合成技术应用于嵌入式操作系统,集成TIS技术到DSP芯片中,可使掌上PC、PDA、WAP手机、信息家电发声,增加文本阅读功能;可实现因特网浏览内容的有声输出,随时聆听网络信息。技术特点:中文语音合成技术具有独特的音库压缩和音色转换特点,该技术向嵌入式操作系统移植具备先决条件,在国内外处于领先地位。与国内外同类产品比较:系统输出语音清晰度高;系统输出具有较好的自然度;音库...
提出了一种采用最小贝叶斯信息准则(Minimum Bayesian Information Criterion,MBIC)来最优化控制决策树结点分裂程度的算法。首先在理论上证明了MBIC能够较好地解决模型参数复杂度与训练数据集规模之间的权衡问题,然后给出了基于MBIC的决策树分裂停止准则的计算公式。汉语连续语音全音节识别实验表明:与传统的最大似然准则(Maximum Likeihood Crite...
构造了两个单流单音素的动态贝叶斯网络(DBN)模型,以实现基于音频和视频特征的连续语音识别,并在描述词和对应音素具体关系的基础上,实现对音素的时间切分。实验结果表明,在基于音频特征的识别率方面:在低信噪比(0~15dB)时,DBN模型的识别率比HMM模型平均高12.79%;而纯净语音下,基于DBN模型的音素时间切分结果和三音素HMM模型的切分结果很接近。对基于视频特征的语音识别,DBN模型的识别率...
提出了一种可用于改善说话人识别效果的基于基音周期的可变窗长语音MFCC参数提取方法。基本原理是将原始的语音分解为当前基音周期整数倍长度以内部分及其以外部分,并保留前者舍去后者,以减小训练语音与测试语音的频谱失真。通过文本无关的说话人确认实验,验证了该方法能有效提高说话人确认的识别率,并能提高短时语音的稳定性。
本文提出了一种新的聚类分段算法,这个算法以段内平均离散度最小、段间平均离散度 最大为准则,采用聚类的方法逐次迭代选择最佳分段断点和分段段数,能正确地对汉语语音 进行音素分段,它和以往分段方法相比在性能上有很大提高.文中还给出了应用该算法对汉 语单音所作的部分实验统计结果,可供进一步开展基于音素或音位的汉语语音识别研究参 考.

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...