搜索结果: 1-15 共查到“信息与通信工程 语音增强”相关记录51条 . 查询时间(0.093 秒)
模式识别大讲堂:基于深度学习的语音增强(图)
模式识别大讲堂 深度学习 语音增强 张学良
2021/7/14
在复杂的声学应用场景中,语音信号容易受到环境噪声与房间混响的影响,给自动语音识别和语音通信带来较大的干扰。尽管目前基于深度学习的单通道语音增强方法能够有效抑制干扰成分,但这些方法的网络参数量较大且运算复杂度较高,难以应用于低功耗设备。对此,中科院噪声与振动重点实验室研究生李安冬与其导师郑成诗研究员等人提出了一种基于卷积循环的单通道渐进语音增强方法,在保持增强性能不变的前提下,大幅度减小了参数量并降...
改进的稀疏字典学习单通道语音增强算法
语音增强 字典学习 过完备字典 稀疏表示
2014/1/25
基于K奇异值分解字典学习方法及其非负约束下的修改算法,本文提出一种改进的单通道语音增强算法。该算法将噪声划分为结构化噪声和非结构化噪声两部分。首先通过稀疏字典学习的方法对结构化噪声进行建模,训练出噪声字典;然后,使用所得噪声字典去除带噪语音中的结构化噪声;最后,采用过完备字典和稀疏表示的方法对纯净语音进行提取,去除非结构化噪声。实验结果表明,在平稳或非平稳噪声环境下,本文算法均能有效去除加性噪声,...
面向二元麦克风小阵列改进的广义旁瓣抵消器语音增强算法
二元麦克风小阵列 语音增强 相干滤波器 广义旁瓣抵消器
2013/8/16
二元麦克风小阵列在手机、助听器等受空间、成本以及运算能力限制的设备中被广泛研究用以提高目标语音质量。二元麦克风小阵列中语音增强算法主要包括波束形成方法以及相干性滤波器方法。波束形成方法的思想是利用目标声源相对阵列的位置关系获取相应的时域和空域信息,可以保留目标声源方向的信号而抑制其他方向的干扰信号;相干性滤波器方法则通过阵元间不同信号的相关性进行噪音抑制。考虑这两种类型方法的优点,本文提出一种面向...
基于AR-HMM在线能量调整的语音增强方法
语音增强 非平稳噪声 隐马尔可夫模型 高斯混合模型
2013/6/28
针对单通道语音增强技术对非平稳噪声的跟踪不准确、噪声抑制效果较差的问题,本文提出一种基于在线能量调整的语音增强方法.该方法以归一化临界带能量为特征,采用高斯混合模型对背景噪声进行分类,利用对应类型噪声的自回归隐马尔可夫模型(Auto-Regressive Hidden Markov Model,AR-HMM)和纯净语音的AR-HMM,在最小均方误差准则下估计语音和噪声的功率谱.考虑到非平稳环境中训...
基于多元Laplace语音模型的语音增强算法
语音增强 最小均方误差 多元Laplace分布模型
2012/7/19
传统的短时谱估计语音增强算法通常假设语音谱分量相互独立,没有考虑语音谱分量间的相关性。针对这一问题,该文提出一种新的基于多元Laplace分布模型的短时谱估计算法。首先,假设语音的离散余弦变换(DCT)系数服从多元Laplace分布,以此利用谱分量间的相关性;在此基础上,利用多元随机矢量的高斯尺度混合模型表示,推导得到语音DCT系数矢量的最小均方误差(MMSE)估计的解析表达式;并进一步推导了基于...
为改善低信噪比环境下语音的质量,论文提出了一种改进相位估计的语音增强算法。算法首先根据语音和噪声频谱的统计模型的对称性得到用先验信噪比倒数形式表示的噪声频谱估计值,然后通过分析低信噪比条件下(0dB)相位估计对于幅度估计的重要性,利用噪声频谱估计值估计每一个频点的相位修正值,并给出了一种优化的先验信噪比估计算法,得到一种新的语音增强算法。由仿真实验给出的客观测试和非正式听音测试表明:该算法处理后取...
本文提出了一种基于数据驱动字典和过完备稀疏表示的自适应语音增强方法。首先在训练阶段采用干净语音基于K奇异值分解(Ksingular value decomposition, KSVD)算法训练过完备字典,然后在测试阶段根据含噪语音的噪声方差自适应选择最优的阈值,采用正交匹配追踪算法对含噪语音信号在过完备字典上进行稀疏分解,最后利用系数稀疏表示重构语音信号,从而达到语音增强的目。该方法不像传统语...
一种基于自适应噪声估计的宽带语音增强算法
宽带语音增强 噪声估计 统计模型 谱熵
2011/9/25
为解决传统算法对噪声适应性较差,残留音乐噪声较强的问题,本文提出了一种基于自适应噪声估计的宽带语音增强算法。该算法可应用于宽带语音编码器,以提升在噪声环境下的编码质量。本文所提算法利用谱熵对噪声类型进行有效的判别,将背景噪声分为白噪声和有色噪声两类,并根据噪声特性选择适当的噪声估计方法。在白噪声背景下,选择一种谱平滑的方法;在有色噪声背景下,则选择经典的最小值控制递归平均算法。在此基础上结合经典的...
一种新的基于数据场的语音增强算法
语音增强 数据场 时频掩蔽 噪声估计
2011/8/25
语音增强是消除噪声干扰的主要手段,在语音处理系统中得到广泛应用。传统语音增强算法认为相邻帧语音幅度谱之间是相互独立的,而研究表明语音幅度谱时频点之间存在相互依赖关系。缺乏对邻域时频结构信息的利用使得传统增强算法的性能难以进一步提高。本文首次将数据场引入到对语音的听觉感知领域,用数据场对语音的时频依赖性进行建模,提出一种新的基于数据场的语音增强算法。该算法通过最小化势场分布的熵确定了时频点之间的相互...