工学 >>> 信息与通信工程 >>> 信息处理技术 >>> 语音处理 >>>
搜索结果: 121-135 共查到知识库 语音处理相关记录400条 . 查询时间(7.672 秒)
利用小波变换在时频域具有一定时间和频率多分辨率的特性,设计了小波阈值优化方法.根据信号与随机噪音在小波变换下各尺度不同的性质,同时减小拒真概率和虚报概率,在有效抑制随机噪音基础上,很好地保留了信号的细节成分.峰值误差为0.7%~1.0%,峰位误差为0.1%~0.3%.提高了光谱信号分析的准确性及系统的判停准确度.
为了能在低码率下达到较高的合成语音质量,对双速率语音编解码算法G.723.1进行研究,并对该算法的高编码速率(6.3 kb/s)的源代码进行优化,改卷积运算为加减运算,改乘法运算为减法运算,大大减小了运算量,提高了运算速度;解决了算法移植的问题,即找到语音算法与开发板语音程序的切合点———将管道传输函数插入语音程序。研究结果表明,该实时系统在6.3 kb/s有较好的语音回放效果,除音量略有降低外,...
语音信号可表述成激励源和线性时变系统的冲激响应的卷积。若激励源是一白噪声信号,则声道发清音;若激励源是一准周期信号,则声道发浊音。在语音信号序列中影响语音表达速度的是浊音,它是基音,是由多次谐波构成的准周期信号。语音信号序列可以看成是基音周期经整数倍延时后叠加而成。插入部分基音周期使语音速度降低,删除部分基音周期能使语音速度提高。但是,插入或删除基音周期使语音信号的相位不连续,造成语音跳变,为此,...
结合车辆通信中语音信号的特殊性,利用傅里叶变换和最大离散熵定理,对含强噪语音的短时频谱进行分析,构造出一种熵函数来对语音信号进行语音/噪声的判决。以一段语音信号为例进行仿真,研究结果表明,谱熵检测方法计算简单,谱熵值和隔离度较大,具有稳健的抗噪特性,可以应用于车辆通信中语音信号的检测。
针对非平稳环境下噪声估计和语音增强性能降低的特点,提出一种基于Bark域的快速自适应噪声谱估计算法。它基于听觉模型,将带噪信号变换到Bark域,并在Bark域内实现基于人耳掩蔽的语音增强。仿真实验表明该算法能充分利用Bark带内频带间的相关性,跟踪快变的背景噪声,提高语音增强性能,减少运算量和复杂度。
证实普通话可以分解为辅音音素和单元音音素通过过度音的连接,提出一种单字音特征提取方法。该方法在传统的帧特征提取基础上,对相关帧进行二次处理,得到单字语音中的多个代表帧,将代表帧进行拼接作为单字的特征矢量。这种特征提取方法能更好地表现说话人单字发音中相邻语音帧之间的连续性。仿真实验表明该方法在说话人识别系统的应用中达到较高的识别率,使识别时间进一步缩短。
针对低信噪比和噪声变化情况下语音激活检测算法性能下降的问题,提出一种新的参数更新和取值算法。该算法采用Laplacian- Gaussian混合模型对带噪语音频谱的概率分布进行建模,模型参数从带噪语音中估计得到,噪声功率参数通过跟踪语音的音节间隙进行平滑。实验结果表明,该算法在-5 dB信噪比情况下,可以达到95%以上的检测率,具有优越的跟踪性能。
在当前的中文信息处理中,对短文本进行模糊匹配有广泛的应用。而现有的模糊匹配算法时间复杂度常常无法满足实际的在线需求。本文从索引检索代替顺序计算的思想出发,提出了基于索引过滤的中文短文本模糊匹配计算方法,包括长度过滤和字命中过滤两种方法,能够大大地减少模糊匹配的计算量。实验表明,本文提出的算法在不影响召回率的前提下,能够极大地减少模糊匹配任务的计算时间。
分析了光寻址空间光调制器对连续图像采样产生的噪音和假频,利用采样理论,提出设置光学去假频前置滤波器抑制噪音和假频的方法.理论分析得出去假频前置滤波器为矩形窗函数的基础上,根据视觉系统中光寻址空间光调制器的参量,计算出了本系统所用的去假频前置滤波器的结构尺寸.视觉系统图像特征提取试验结果表明效果良好.
提出人耳掩蔽效应与阶STSA- MMSE(Short Time Spectral Amplitude-Minimum Mean Square Error)算法动态结合的语音增强算法.该算法通过引入参量提高了STSA-MMSE 算法的实时性,同时结合人耳掩蔽效应,动态的确定增强滤波器的传递函数以适应语音信号的变化,来提高语音质量.实验结果表明,和STSA-MMSE 算法相比,该算法在实时性方面有...
研究基于微聚类算法的VoIP压缩码流说话人识别算法。给出直接从G.729, G.723.1(6.3 Kb/s), G.723.1(5.3 Kb/s)压缩语音的码流中提取识别参数,以微聚类算法作为识别结构的说话人识别算法。实验结果表明,对比在压缩码流中使用同样识别参数的GMM模型,微聚类算法在识别正确率和效率上都有很大的提高。
为减轻基于IP语音(VoIP)网络中因信包丢失而造成的语音失真,提出一种基于双边线性预测和基音调整的信包丢失隐藏算法。该方法利用丢失信包的前一信包或邻接信包(在后一信包可获得的情况下)预测丢失的信包。线性加权经过基音调整后的双边线性预测样点以获得最终的重建信号。重建信号在相位连续性上表现更加合理。经过ITU-T P.862协议推荐的PESQ算法测试证明,该算法重建语音信号的质量有了较为明显的改善。...
音视频同步是数字电视广播和多媒体通信等应用的关键技术。该文提出一种基于AVS并结合嵌入技术的音视频同步方法。将压缩音频数据嵌入AVS视频编码系统,保证传输或存储、接收端解码与播放过程中的音视频始终同步。实验结果表明,该方法实现了音视频完全同步,能减小用于同步的开销。
针对目前网络电话语音质量难以准确评价及预测的情况,基于E-Model对VoIP的语音质量进行预测。分析几个主要影响因素,如延时、丢包等对话音质量的影响,构建VoIP语音质量预测模型,将E-Model中未考虑到的抖动因素引入模型公式,着重考虑抖动缓冲区的大小对语音质量的影响。通过设计相关验证实验,证明该模型对VoIP语音质量的预测具有较高的准确度。
对于英语等“重音节拍语言”,重音是一个非常重要的韵律学特征。从听觉模型的角度出发,利用基音同步幅度峰值特征能同时表征瞬时频率和强度信息的特点进行重音检测。使用基音同步幅度峰值特征以及与传统特征的组合对英语连续语音的试验结果表明,新特征能使系统误识率降低1.5%。

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...