工学 >>> 信息与通信工程 >>> 信息处理技术 >>> 语音处理 >>>
搜索结果: 151-165 共查到知识库 语音处理相关记录401条 . 查询时间(5.843 秒)
根据低延迟语音编码算法训练码书的尺寸和码字维数的特点,提出了一种改进的自组织特征映射(SOFM)神经网络的码书设计方法。对输入训练矢量以及连接权矢量进行归一化,为降低计算量和提高码书训练质量,采用快速的网络学习决定获胜的神经元并对网络权值分阶段进行自适应调整,最后应用于低延迟语音编码中。实验表明,与传统LBG算法比较,采用SOFM神经网络训练的码书其合成语音的主、客观质量均有较大提高。 ...
提出从特征提取参数、模型参数对隐马尔可夫声调模型进行区分型训练,来提高声调识别率;提出模型相关的权重对谱特征模型和声调模型的概率进行加权,并根据最小音子错误区分性目标函数对权重进行训练,来提高声调模型加入连续语音识别时的性能。声调识别实验表明区分性的声调模型训练以及特征提取方法显著提高了声调识别率。区分性模型权重训练能够在声调模型加入之后进一步连续语音识别系统的识别率。
语音信号稀疏分解是一种新的语音信号分解方法,可以将语音信号分解为很简洁的近似表达形式。在语音信号稀疏分解的基础上,可应用于语音处理的多个方面,如语音压缩、语音去噪和语音识别等。研究利用Matching Pursuit(MP)算法实现语音信号的稀疏分解,实验结果表明基于MP算法的语音信号稀疏分解具有较好的重建精度和较高的稀疏度。
基于短时谱估计的语音增强算法具有良好的降噪性能,算法高效且易于实现。本文对谱减法、维纳滤波、最小均方误差估计等此类算法进行系统的论证,结合实验,分析比较了它们的性能差异,并指出了它们各自的优缺点及适用环境。
以提高汉语耳语的识别率为目的,提出了基于概率神经网(PNN)的语音识别系统。实验结果说明该方法提高了系统的识别率,大大缩短了识别时间,提高了整个系统的实时性。在小字库内得出的识别率为94.7%。
语音信号的产生过程是非线性的,而且具有混沌性。相对于线性模型,在重构相空间中建立的语音信号模型更接近实际系统,神经网络是建立非线性系统模型的常用工具。实验结果表明:在重构相空间中建立的基于径向基函数神经网络的预测器较线性预测器在性能上有明显提高。
支持向量机(SVM)由于其强大的分类能力,引起人们广泛的重视,并且成功地应用于说话人识别。其中基于GLDS核的SVM系统性能比较优异。引入类内方差归一化(WCCN)方法来处理SVM的输入特征向量,并和GLDS核相结合,提出一种基于类内方差归一化和SVM的说话人识别方法。该方法利用WCCN方法对SVM的输入特征向量进行变换,增强特征向量的类间区分能力,再采用GLDS核函数进行SVM的训练,以提高SV...
以降低码率为目的对G.728算法进行改进,提出了一个延迟为2.5 ms的8 Kbit/s的语音编码算法。算法引入了由最近的历史激励构成的自适应码书和归一化的固定码书的双码书结构。计算增益真值并量化,增益量化时对自适应码书用固定量化,固定码书用自适应量化。码书搜索时先进行后向基音检测,在基音周期T附近对自适应码书进行精细搜索。搜索64个自适应码矢、256个固定码矢和各自8个增益值获得最佳激励,每帧耗...
在实际应用中通常无法精确估计得到背景噪音谱,传统语音增强效果也随之大大降低。为弱化估计误差引入的干扰,在对数最小均方差估计器(LSA)语音增强方法基础上提出了一套切实可行的增强方案。引入信号检测自动机判别帧成分,针对帧与帧之间的不同特点采取不同级别的噪音抑制处理方案,对确定为噪音帧的部分进行进一步深度抑制,而语音帧部分则沿用改进的LSA方法。实验表明,使用方法能有效抑制背景噪音,特别当噪音谱估计误...
提出了一种基于改进的谱减法的语音增强算法。该算法首先利用了一种由最小值控制的递归平均的噪声谱估计算法,因而无需语音端点检测,其次利用一种通过递归计算得到的基于子带信噪比的过减因子,减小了产生“音乐噪声”的可能性。分析和实验表明,提出的算法对“音乐噪声”起到了一定的抑制效果,并有效地提高了输出信噪比。
双麦克风噪声抵消应用中,由于交叉串的存在,传统自适应算法降噪性能受到很大的影响。为了提高双麦克风算法降噪性能,使用两级自适应滤波系统消除交叉串扰问题。为提高自适应滤波器收敛性能,采用主从结构LMS算法自适应调节步长因子。同时为了适合窄带处理算法,将输入信号进行子带分析预处理,对每个子带独立进行抗交叉串绕自适应处理,将各子带增强信号合并得到增强语音信号。实验结果表明,该方消噪量大,语音损伤小,语音增...
矢量水听器可同时拾取声压和振速信息,成阵后水听器间的相移信息量增大。基于矢量水听器阵的波束形成性能明显由于同条件下的声压水听器阵,但其空间分辨力依然受阵列物理空间的限制。已经有人研究了矢量水听器阵的高分辨谱估计方法(MUSIC算法),但属于对阵元域信号进行的直接处理,运算量较大。提出一种基于矢量水听器阵的波束域MUSIC算法(BMUSIC)。该算法首先将矢量水听器阵元的空间数据转换到波束空间,然后...
基于似然比测试的语音激活检测算法基于假设检验原理,引入了对噪声的降噪处理,具有良好的噪声鲁棒性,算法高效且易于实现。各种改进算法针对语音模型、判决规则等核心问题进行了系统研究,检测性能得到了进一步提高。对此类算法进行了系统的论证,结合实验,分析比较了它们的性能差异和各自的优缺点,并指出了进一步的研究方向。
针对混合噪声模型中中值滤波、线性滤波与传统各向异性扩散存在固有的缺陷,通过修改扩散项的计算方式改进扩散模型并提高扩散模型的滤波特性,改进模型具有带通滤波特性,扩散过程稳定并满足极值原理。研究结果表明:中值滤波作为一种经典的非线性滤波方法仅适合于“飞点”噪声的滤波并引起图像的角点、线条损失,线性滤波扩大或使图像边界范围模糊;传统的各向异性扩散能对随机噪声有效地压制,但对“飞点”噪声会产生虚假的边缘甚...
在说话人空间中,存在语音特征随句子和时间差异而变化的问题。这个变化主要是由语音数据中的语音信息和说话人信息的变化引起的。如果把这两种信息彼此分离就能实现鲁棒的说话人识别。在假设大的说话人变量的空间为“语音空间”和小的说话人变量的空间为“说话人空间”的情况下,通过子空间方法分离语音信息和说话人信息,提出了说话人辨认和说话人确认方法。结果显示:通过相对于传统方法的比较试验,能用小量训练数据建立鲁棒说话...

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...