工学 >>> 信息与通信工程 >>> 信息处理技术 >>> 语音处理 >>>
搜索结果: 1-15 共查到知识库 语音处理相关记录400条 . 查询时间(1.584 秒)
基于海云计算的智能语音处理系统研究集体。
在递归神经网络(RNN)语言模型输入中增加表示当前词所对应主题的特征向量是一种有效利用长时间跨度历史信息的方法。由于在不同文档中各主题的概率分布通常差别很大,该文提出一种使用文档主题概率改进当前词主题特征的方法,并将改进后的特征应用于基于长短时记忆(LSTM)单元的递归神经网络语言模型中。实验表明,在PTB数据集上该文提出的方法使语言模型的困惑度相对于基线系统下降11.8%。在SWBD数据集多候选...
利用小波变换提取语音信号的能量聚集带,将其隐藏在混沌载体信号中进行传输,设计一种盲提取算法实现不同混沌动力学系统下语音信号的有效提取。以3种不同维数的混沌动力学系统为背景,仿真实验定性和定量地分析了所提出算法的性能,验证了噪声环境下算法的可靠性,证明盲提取算法可作为对混沌保密通信系统保密性验证的有效方法。
Audio stories are an engaging form of communication that combine speech and music into compelling narratives. Existing audio editing tools force story producers to manipulate speech and music track...
Audio producers often use musical underlays to emphasize key moments in spoken content and give listeners time to re- flect on what was said. Yet, creating such underlays is timeconsuming as produc...
Well-performed audio narrations are a hallmark of captivating podcasts, explainer videos, radio stories, and movie trailers. To record these narrations, professional voiceover actors follow guideli...
Highly-produced audio stories often include musical scores that reflect the emotions of the speech. Yet, creating effective musical scores requires deep expertise in sound production and is time-co...
Large-scale knowledge graphs such as those in the Linked Data cloud are typically represented as subject-predicate-object triples. However, many facts about the world involve more than two entities. W...
提出一种约束条件下的结构化高斯混合模型及非平行语料语音转换方法.从源与目标说话人的原始非平行语料中提取出少量相同音节,在结构化高斯混合模型的训练过程中,利用这些相同音节包含的语义信息及声学特征对应关系对K均值聚类中心进行约束,并在(Expectation Maximum,EM)迭代过程中对语音帧属于模型分量的后验概率进行修正,得到基于约束的结构化高斯混合模型(Structured Gaussian...
There has been a widespread growth of technology in almost every facet of day to day life. But there are still important application areas in which technology advancements have not been implemented in...
This thesis describes the design and measurement of an X-band IQ up/down converter that has been fabricated on a 180nm RF CMOS process. This converter includes components for mixing, frequency doublin...
MCRA(Minima-Controlled Recursive Averaging)方法是经典的噪声估计算法,然而在语音段MCRA方法存在不能对噪声功率谱进行有效更新的问题.针对这一问题,本文利用广义自回归条件异方差(Generalized Autoregressive Conditional Heteroskedasticity,GARCH)模型在时频域对噪声信号建模,在MCRA算法原理的基础...
现有人工噪声方法发送保密信号时在合法信道零空间内加入人工噪声以降低被截获概率,但当窃听者天线数不少于发送者时,该方法失效,针对这一问题,文中提出一种物理层安全的信号子空间人工噪声跳空方法。发送者随机选择信号子空间传输保密信号,并叠加人工噪声,合法接收者根据跳空图样选择相应信号子空间接收保密信号,并利用收发双方约定的噪声信息去除其中叠加的人工噪声,解调出保密信息,窃听者未知跳空图样和噪声信息,无法找...
为有效解决现有单一模型编码器无法在中低速率对语音和音频信号进行高质量通用编码的问题,本文借助语音与音频信号的谐波特性,建立了一种对语音和音频信号统一编码的方法。首先,本文利用经验模态分解(Empirical Mode Decomposition, EMD)提取输入信号的谐波成分;其次,利用感知匹配追踪算法,并结合正弦参数建模对谐波成分进行参数提取与量化;第三,对于量化谐波后的残差进行抖动格型矢量量...
本文研究了越南语语音情感识别问题,采集并建立了越南语情感数据库。母语为越南语的两名男性和两名女性说话人进行了越南语情感语音的表演和录制,通过多人听辨实验进行了数据的验证和评选,建立了一个初步的越南语语音情感数据库,为今后的跨语言研究提供数据基础。在所获得的情感数据上,提取了基本的语音特征,并构造了可用于情感识别的静态统计特征。采用高斯混合模型进行了建模与识别,识别结果显示,本文中的系统能够较好的识...

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...