工学 >>> 信息与通信工程 >>> 信息处理技术 >>> 语音处理 >>>
搜索结果: 136-150 共查到知识库 语音处理相关记录401条 . 查询时间(5.348 秒)
对于英语等“重音节拍语言”,重音是一个非常重要的韵律学特征。从听觉模型的角度出发,利用基音同步幅度峰值特征能同时表征瞬时频率和强度信息的特点进行重音检测。使用基音同步幅度峰值特征以及与传统特征的组合对英语连续语音的试验结果表明,新特征能使系统误识率降低1.5%。
用于人形机器人的实时多通道降噪方法使机器人能够在实际应用中精确地进行后续的音频分类或语音识别。引入人形机器人具有类似人体的头相关传输函数的性质,避免一般方法中在估计声传播信道模型时只考虑声达时延,而忽略声散射和共振影响的局限性。该方法通过利用麦克风阵列阵元之间的声音传输信道的差异性,削弱参考噪声和目标信号之间的相关性,从而提升对消噪声后输出信号的信噪比。仿真表明,对目标信号的信噪比提升达到15 d...
将已经成功应用到说话人识别/确认领域中的高斯混合模型和全局背景模型(UBM)引入语音发音质量评价领域,提出一种新的评价英语发音质量的算法。该算法训练出标准发音的全局背景模型。UBM模型描述与音素无关的特征分布,定义段时长归一化的相似度比例对数为音素的发音质量分数,综合得到整句发音的评分结果。实验证明,在实验室自行采集的非母语语音数据库上,该算法评分与专家评分的相关性达到了0.700,优于其他评分算...
为了提高说话人分割(SS)准确率,该文综合考虑了静音信息和性别信息在SS中的作用,提出了一种两步判决的SS算法。在从音频流中分离出语音段的基础上,采用两步判决的方法进行SS。第1步采用基频信息为主、性别模型为辅的策略进行SS,将相邻说话人基频差异大的说话人改变检测出来;第2步采用基于性别的改进T2判决公式进行SS,实现相邻说话人基频差异小的同性别SS,为此,该文提出了一个基于块的潜在说话人改变点检...
介绍一种高保真的音频信号处理系统,给出了前端音频信号调理电路设计,实现了DSP芯片TMS320VC5410与语音转换芯片TLC320AD50C的硬件接口设计,并通过FIR算法实现了对音频信号的处理。测试结果表明,此音频处理系统达到预期要求。
音频信号短时谱的基频随时间会发生变化,因此其谐波成分之间的间隔也会发生变化,在时域上信号随时间会发生或快或慢的变化,这导致短时谱分析所要求的时域和频域分辨率随时间是变化的。传统的固定分析窗由于其时频分辨率固定,无法同时满足上述要求,因而对短时分析造成偏差。本文基于正弦加噪声模型提出了一个分析窗宽受基频控制的自适应新型音频信号分析/合成系统方案,有效地提高了对信号实时分析的精度。并在此基础上,进一步...
ITU-T G.728标准是国际电信联盟于1992年制定的比特率为16kbit/s的低延时CELP类语音编码器。在扼要介绍G.728编解码算法原理和TMS320C6201定点DSP芯片的基础上,详细讨论了G.728算法在TMS320C6201上实时实现的硬件设计和软件开发及优化的关键技术。实验结果表明,单片C6201能实现至少4路G.728语音编解码。
提出一种符合人耳听觉感知的语音增强方法,使电子耳蜗能在噪声环境下获得准确的语音信息。利用Bark子波变换实现电子耳蜗中的语音处理,结合人耳听觉系统特性实现语音增强。使用根据人耳听觉掩蔽效应提出的自适应减参数。实验结果表明该算法在低信噪比情况下,信噪比可提高30 dB左右,更好地抑制了残留噪声和背景噪声,合成的语音具有较好清晰度和可懂度。
由于数字可视电话系统的性能需求和系统中回声的特点,传统的回声消除技术应用于数字可视电话系统时无法满足ITU-T G.168标准要求。该文利用NLMS算法的滑动窗自适应滤波器和简化非线性处理器设计,实现一种数字可视电话系统中的G.168自适应回声消除器,介绍其基本结构和各个功能模块的算法,并以ARM 920T为硬件平台实现该系统。仿真结果显示,简化的回声消除算法运算复杂度小、消除回声有效性高、稳定性...
分析语音信号声道特征参数提取问题,针对自相关法的缺陷,提出声道特征参数提取的改进算法。介绍其运算步骤和流程,考虑FPGA适于短期开发及高速性的优点,设计Finite State Machine来控制复杂运算操作及对寄存器的频繁访问。利用Cyclone EP1C6 FPGA实现语音信号声道特征参数提取算法。
针对室内的脉冲噪声居多的情况下,结合语音信号的特征,提出了基于声门脉冲提取的分数低阶协方差时延估计方法(LPC+FLOC),通过理论分析和仿真实验表明,具有较好的时延估计有效率,且抗混响能力较强,比较适合室内的语音源定位。
In low bit rate speech coders, pitch is usually transmitted once per frame and, when needed, the intermediate pitch values are obtained by interpolation between 2 adjacent pitch values. Although pitch...
现有的低延迟语音编码算法(LD-CELP)需要16 kb/s比特率,无疑会妨碍它的应用。提出了一种采用两阶段码书搜索的方法可以在提高低延迟语音编码算法性能的同时降低码率。首先构造了两个子码书:一个后向更新的自适应码书和一个具有代数结构的固定码书;然后设计了两阶段码书搜索方法使滤波后的激励矢量和目标矢量之间的均方误差保持最小。这样就得到了一个在8 kHz采样率下具有2.5 ms延迟的10 kb/s两...
充分考虑语音的短时相关性和叠接帧的存在,实现了一种二维形式维纳滤波。采用多帧组合成块的结构进行二维加窗滤波,然后辅以局部平滑的技术,可以有效抑制噪声,并防止乐性噪声出现。在二维维纳滤波方法与一维维纳滤波的对比实验中,采用TIMIT语音数据库,加上指定信噪比的白噪声,实验结果表明前者不但在后者基础上又显著提高了信噪比客观参数,而且MOS主观得分提升了13.8%。
对时变性强的非平稳汉语语音信号,建议采用变时-频复子波分析方法提取汉语语音信号的幅度谱、相位谱、基音周期及共振峰信息。选择有n阶消失矩及良好的时频局域化特性的复高斯子波提取汉语语音信号的幅度谱和相位谱,实验结果表明,该方法提取的语音信号的幅度谱、相位谱和子波变换谱表征了汉语语音的音节包络、细节包络及声调,区分了清、浊音,并准确提取了语音信号的动态基音周期、估计出共振峰。这对汉语语音特征提取和识别提...

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...