工学 >>> 计算机科学技术 >>> 计算机科学技术基础学科 人工智能 计算机系统结构 计算机软件 计算机工程 计算机应用 计算机科学技术其他学科
搜索结果: 61-75 共查到计算机科学技术 语音相关记录226条 . 查询时间(0.05 秒)
基于2.4 GHz微波信号抗干扰性好、穿透力强的特点,目前已被广泛应用于近距离无线通信领域.提出了一种基于此频率传输的具有纠错和加密功能的数字无线语音系统的实现方案,并给出以nRF2401无线收发芯片和 ATmega8L单片机为核心的系统硬件和软件的设计.新系统具有成本小、功耗低、可靠性高、保密性好等特点,可应用于要求特殊的短距离无线通信领域.
为了兼容母语与非母语说话人之间的发音变化,提出一种新的声学模型建模方法。分析中国人受母语影响产生的英语发音变化,利用中国人英语发音数据库自适应得到语音模型,采用声学模型融合技术构建融合2种发音规律的识别模型。实验结果证明,中国人英语发音的语音识别率提高了13.4%,但标准英语的语音识别率仅下降1.1%。
提出了隐条件随机场对断续基音频率序列进行直接声学建模的方法,该方法针对汉语语音中基频值在清音段连续,浊音段断续的特点,根据隐条件随机场区别于隐马尔可夫模型的重要特性——无需对观察值采用统一的建模方式,直接对不连续基频值与连续谱特征观察值一起进行声学建模。大词汇语音库上的汉语带调音节分类实验表明,隐条件随机场下对断续基音频率序列的直接建模较使用清音段人工平滑基频特征的识别率有明显的提高,还给出了与不...
IP-PBX(Internet Protocol-Private Branch Exchange,基于因特网协议的专用交换机)的数字中继基于AC48304 语音处理器,采用ARM 处理器及嵌入式Linux 操作系统,实现了较低成本的嵌入式IP-PBX 的VOIP 中继.
随着当前电子商务和金融交易领域的发展,用户身份认证的应用变得越来越广泛.结合实际,本文构建了一种基于人脸和语音的混合型身份认证系统,分别提出了基于重建误差分类器的特征脸确认算法和基于高斯混合 (Gaussian mixture models, GMM)说话人确认算法;最后在分数层进行融合,提出了基于正交多项式核函数的支持向量机.实验结果表明,该方法在分类、泛化能力和减少支持向量数目方面均取得了良好...
提出了一种二级搜索模型,该模型首先利用最小音节步长搜索算法进行语音段检测,然后采用二分搜索算法确定语音段的精确位置。理论分析及实际运行结果表明,与传统的基于能量的端点检测算法相比,其搜索效率能够提高70%以上。该算法对语音环境有较高的要求,可用于有声出版物语音自动分割,以及具有良好信噪比系统的语音端点检测。
针对信号处理领域的语音活动探测问题,提出一种基于高斯过程先验假设的概率方法,用于增强语音。利用高斯过程模型的后验概率来估计纯净语音,使用在学习过程中得到的高斯过程模型的参数探测语音活动。实验结果表明,该方法对于在白噪声和有色噪声环境下的语音有较好的增强效果。
复杂性测度是反映信号序列的一个重要的非线性特征,复杂性测度的语音端点检测技术具有非线性技术的本质特征。对C0复杂度作出改进,并与增强后的短时能量相结合,提出了一种更有效的端点检测算法——C0复杂度能量的语音端点检测方法。实验证明,该算法对噪声有很强的鲁棒性,在低信噪比(0 dB)下仍能准确地检测出语音段。
提出了将最小差别信息(MDI) 和进化计算( EC) 相结合引入到HMM的训练中去的方法. 各个模 型用个体来表示,个体的适应值采用模型的最小差别信息. 这样借助于进化计算全局搜索的特点,能克 服传统的MDI 局部搜索的不足,从而得到系统的全局最优解. 实验结果表明,该方法训练所得的系统识 别率高于传统的MDI 方法训练所得的系统.
针对招投标中抽取评标专家过程出现的不公平与效率低问题,设计一种基于多通道语音卡的招投标专家系统。该系统借鉴语音卡多通道的优势,采用自动合成语音技术实现语音自动应答和主动拨号自动完成抽取评标专家并入库的智能管理。运行结果表明,该系统运行成本低、应用范围广。
本文在L.s.Lee(1984,1986)异少模-数-模语音加密方案的基础上提出了自适应伪频插入置乱方法。这种方法有利于降低密话节奏感,提高异步加密方案的保密性,且可保证良好的恢复话音质量。
通过分析H.323协议和H.323协议的会话流程,基于H.323协议的VoIP通信过程中出现的会话特征,提取出通信双方的元组信息来识别整个会话流量,设计出相应的流存储、搜索、更新方案和识别VoIP流量的算法。实验表明,该方法能够准确识别基于H.323协议的VoIP语音流量。
研究一种应用小波特征向量和多类支持向量机进行病态语音识别的方法,该方法基于连续小波变换提取语音特征向量,利用多类支持向量机进行病态语音分类。为了简化二分类支持向量机进行多类分类时所带来的计算复杂性,根据一类支持向量机分类思想提出一种多类分类算法。该算法能够使每一类样本都独立地获得一个决策函数,通过决策函数的最大值来判断样本所属的类。实验表明,在病态语音识别系统中,多类支持向量机与小波特征向量相结合...
基于格的汉语自然对话语音索引方法研究。
由于少数民族语言有其本身的特点,不能简单的套用现有的连续语识别的方法.本文以蒙古语为例,研讨了声学和语言模型的建立,并在ATR连续语音识别器上实现了蒙古语的语音识别系统. 本文侧重于语言模型的建立,基于蒙古语黏着性语言特点,提出用相似词聚类方法建立多类N-gram模型. 实验结果显示,应用我们提出的语言模型,识别精度比用传统的词N-gram识别法提高了5.5\% ...

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...