工学 >>> 信息与通信工程 >>> 信息处理技术 通信技术 广播与电视工程技术 雷达工程
搜索结果: 1-15 共查到信息与通信工程 语音增强相关记录51条 . 查询时间(0.093 秒)
近日,内蒙古大学计算机学院(软件学院)张学良教授团队的博士生刘晋江,代表学校在国际助听语音增强比赛 “The 2nd Clarity Enhancement Challenge (CEC2)”中斩获“Hearing industry research consortium prizes objectiveevaluation”和“Hearing industry research consorti...
随着智能语音交互设备的广泛使用,如何提升噪声环境下语音交互质量受到了产业界和学术界的广泛关注,语音增强是提升语音交互质量的重要技术之一。2021年7月12日,受中科院自动化所刘文举研究员邀请,张学良博士为所内师生做了“基于深度学习的语音增强”的学术报告。
在复杂的声学应用场景中,语音信号容易受到环境噪声与房间混响的影响,给自动语音识别和语音通信带来较大的干扰。尽管目前基于深度学习的单通道语音增强方法能够有效抑制干扰成分,但这些方法的网络参数量较大且运算复杂度较高,难以应用于低功耗设备。对此,中科院噪声与振动重点实验室研究生李安冬与其导师郑成诗研究员等人提出了一种基于卷积循环的单通道渐进语音增强方法,在保持增强性能不变的前提下,大幅度减小了参数量并降...
基于K奇异值分解字典学习方法及其非负约束下的修改算法,本文提出一种改进的单通道语音增强算法。该算法将噪声划分为结构化噪声和非结构化噪声两部分。首先通过稀疏字典学习的方法对结构化噪声进行建模,训练出噪声字典;然后,使用所得噪声字典去除带噪语音中的结构化噪声;最后,采用过完备字典和稀疏表示的方法对纯净语音进行提取,去除非结构化噪声。实验结果表明,在平稳或非平稳噪声环境下,本文算法均能有效去除加性噪声,...
二元麦克风小阵列在手机、助听器等受空间、成本以及运算能力限制的设备中被广泛研究用以提高目标语音质量。二元麦克风小阵列中语音增强算法主要包括波束形成方法以及相干性滤波器方法。波束形成方法的思想是利用目标声源相对阵列的位置关系获取相应的时域和空域信息,可以保留目标声源方向的信号而抑制其他方向的干扰信号;相干性滤波器方法则通过阵元间不同信号的相关性进行噪音抑制。考虑这两种类型方法的优点,本文提出一种面向...
针对单通道语音增强技术对非平稳噪声的跟踪不准确、噪声抑制效果较差的问题,本文提出一种基于在线能量调整的语音增强方法.该方法以归一化临界带能量为特征,采用高斯混合模型对背景噪声进行分类,利用对应类型噪声的自回归隐马尔可夫模型(Auto-Regressive Hidden Markov Model,AR-HMM)和纯净语音的AR-HMM,在最小均方误差准则下估计语音和噪声的功率谱.考虑到非平稳环境中训...
传统的短时谱估计语音增强算法通常假设语音谱分量相互独立,没有考虑语音谱分量间的相关性。针对这一问题,该文提出一种新的基于多元Laplace分布模型的短时谱估计算法。首先,假设语音的离散余弦变换(DCT)系数服从多元Laplace分布,以此利用谱分量间的相关性;在此基础上,利用多元随机矢量的高斯尺度混合模型表示,推导得到语音DCT系数矢量的最小均方误差(MMSE)估计的解析表达式;并进一步推导了基于...
为改善低信噪比环境下语音的质量,论文提出了一种改进相位估计的语音增强算法。算法首先根据语音和噪声频谱的统计模型的对称性得到用先验信噪比倒数形式表示的噪声频谱估计值,然后通过分析低信噪比条件下(0dB)相位估计对于幅度估计的重要性,利用噪声频谱估计值估计每一个频点的相位修正值,并给出了一种优化的先验信噪比估计算法,得到一种新的语音增强算法。由仿真实验给出的客观测试和非正式听音测试表明:该算法处理后取...
本文提出了一种基于数据驱动字典和过完备稀疏表示的自适应语音增强方法。首先在训练阶段采用干净语音基于K奇异值分解(Ksingular value decomposition, KSVD)算法训练过完备字典,然后在测试阶段根据含噪语音的噪声方差自适应选择最优的阈值,采用正交匹配追踪算法对含噪语音信号在过完备字典上进行稀疏分解,最后利用系数稀疏表示重构语音信号,从而达到语音增强的目。该方法不像传统语...
为解决传统算法对噪声适应性较差,残留音乐噪声较强的问题,本文提出了一种基于自适应噪声估计的宽带语音增强算法。该算法可应用于宽带语音编码器,以提升在噪声环境下的编码质量。本文所提算法利用谱熵对噪声类型进行有效的判别,将背景噪声分为白噪声和有色噪声两类,并根据噪声特性选择适当的噪声估计方法。在白噪声背景下,选择一种谱平滑的方法;在有色噪声背景下,则选择经典的最小值控制递归平均算法。在此基础上结合经典的...
语音增强是消除噪声干扰的主要手段,在语音处理系统中得到广泛应用。传统语音增强算法认为相邻帧语音幅度谱之间是相互独立的,而研究表明语音幅度谱时频点之间存在相互依赖关系。缺乏对邻域时频结构信息的利用使得传统增强算法的性能难以进一步提高。本文首次将数据场引入到对语音的听觉感知领域,用数据场对语音的时频依赖性进行建模,提出一种新的基于数据场的语音增强算法。该算法通过最小化势场分布的熵确定了时频点之间的相互...
针对语音增强技术中先验信噪比参数的估计问题,本文通过结合两步噪声消除技术以及语音与噪声分量的高斯统计模型,在频率域中提出了一种新的先验信噪比估计算法。该算法基于直接判决方法的输出结果,利用最小均方误差估计理论直接计算当前帧纯净语音分量的谱能量,以获取带噪语音的先验信噪比估计。算法在保留两步噪声消除算法优点的基础上,无需语音增强系统中增益因子的任何先验条件,且在有效消除背景噪声的同时能够最大程度地抑...

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...