方略学科导航

搜索结果: 136-150 共查到“知识库语音处理”相关记录401条 . 查询时间(5.348 秒)

基于听觉模型的特征在英语重音检测中的应用重音检测听觉模型基音同步幅度峰值 2009/8/12

对于英语等“重音节拍语言”，重音是一个非常重要的韵律学特征。从听觉模型的角度出发，利用基音同步幅度峰值特征能同时表征瞬时频率和强度信息的特点进行重音检测。使用基音同步幅度峰值特征以及与传统特征的组合对英语连续语音的试验结果表明，新特征能使系统误识率降低1.5%。

存档附件原文地址

用于人形机器人的声音降噪方法人形机器人声音降噪麦克风阵列 2009/8/12

用于人形机器人的实时多通道降噪方法使机器人能够在实际应用中精确地进行后续的音频分类或语音识别。引入人形机器人具有类似人体的头相关传输函数的性质，避免一般方法中在估计声传播信道模型时只考虑声达时延，而忽略声散射和共振影响的局限性。该方法通过利用麦克风阵列阵元之间的声音传输信道的差异性，削弱参考噪声和目标信号之间的相关性，从而提升对消噪声后输出信号的信噪比。仿真表明，对目标信号的信噪比提升达到15 d...

存档附件原文地址

基于UBM的发音质量评价算法对数似然比高斯混合模型发音质量评价 2009/8/10

将已经成功应用到说话人识别/确认领域中的高斯混合模型和全局背景模型(UBM)引入语音发音质量评价领域，提出一种新的评价英语发音质量的算法。该算法训练出标准发音的全局背景模型。UBM模型描述与音素无关的特征分布，定义段时长归一化的相似度比例对数为音素的发音质量分数，综合得到整句发音的评分结果。实验证明，在实验室自行采集的非母语语音数据库上，该算法评分与专家评分的相关性达到了0.700，优于其他评分算...

存档附件原文地址

一种两步判决的说话人分割算法语音信号处理两步判决说话人分割基频信息性别信息 2011/5/17

为了提高说话人分割(SS)准确率，该文综合考虑了静音信息和性别信息在SS中的作用，提出了一种两步判决的SS算法。在从音频流中分离出语音段的基础上，采用两步判决的方法进行SS。第1步采用基频信息为主、性别模型为辅的策略进行SS，将相邻说话人基频差异大的说话人改变检测出来；第2步采用基于性别的改进T2判决公式进行SS，实现相邻说话人基频差异小的同性别SS，为此，该文提出了一个基于块的潜在说话人改变点检...

存档附件原文地址

基于DSP5410与TLC320AD50C的实时音频信号处理研究 DSP 音频信号处理放大器 2009/8/4

介绍一种高保真的音频信号处理系统，给出了前端音频信号调理电路设计，实现了DSP芯片TMS320VC5410与语音转换芯片TLC320AD50C的硬件接口设计，并通过FIR算法实现了对音频信号的处理。测试结果表明，此音频处理系统达到预期要求。

原文地址

一种新型基频变窗音频信号分析/合成系统基频估计正弦成分噪声成分 2009/8/4

音频信号短时谱的基频随时间会发生变化，因此其谐波成分之间的间隔也会发生变化，在时域上信号随时间会发生或快或慢的变化，这导致短时谱分析所要求的时域和频域分辨率随时间是变化的。传统的固定分析窗由于其时频分辨率固定，无法同时满足上述要求，因而对短时分析造成偏差。本文基于正弦加噪声模型提出了一个分析窗宽受基频控制的自适应新型音频信号分析/合成系统方案，有效地提高了对信号实时分析的精度。并在此基础上，进一步...

存档附件原文地址

用TMS320C6201实现多路ITU－TG.728语音编码标准语音编码 ITU标准 DSP 2009/8/4

ITU－T G.728标准是国际电信联盟于1992年制定的比特率为16kbit/s的低延时CELP类语音编码器。在扼要介绍G.728编解码算法原理和TMS320C6201定点DSP芯片的基础上，详细讨论了G.728算法在TMS320C6201上实时实现的硬件设计和软件开发及优化的关键技术。实验结果表明，单片C6201能实现至少4路G.728语音编解码。

原文地址

基于人耳掩蔽效应的电子耳蜗语音增强方法电子耳蜗语音增强掩蔽效应 Bark子波 2009/7/31

提出一种符合人耳听觉感知的语音增强方法，使电子耳蜗能在噪声环境下获得准确的语音信息。利用Bark子波变换实现电子耳蜗中的语音处理，结合人耳听觉系统特性实现语音增强。使用根据人耳听觉掩蔽效应提出的自适应减参数。实验结果表明该算法在低信噪比情况下，信噪比可提高30 dB左右，更好地抑制了残留噪声和背景噪声，合成的语音具有较好清晰度和可懂度。

存档附件原文地址

数字可视电话系统中的G.168回声消除技术回声消除 NLMS算法滑动窗自适应滤波器 2009/7/30

由于数字可视电话系统的性能需求和系统中回声的特点，传统的回声消除技术应用于数字可视电话系统时无法满足ITU-T G.168标准要求。该文利用NLMS算法的滑动窗自适应滤波器和简化非线性处理器设计，实现一种数字可视电话系统中的G.168自适应回声消除器，介绍其基本结构和各个功能模块的算法，并以ARM 920T为硬件平台实现该系统。仿真结果显示，简化的回声消除算法运算复杂度小、消除回声有效性高、稳定性...

存档附件原文地址

协方差斜格法的LPC参数提取及其FPGA实现语音信号声道模型特征参数 2009/7/30

分析语音信号声道特征参数提取问题，针对自相关法的缺陷，提出声道特征参数提取的改进算法。介绍其运算步骤和流程，考虑FPGA适于短期开发及高速性的优点，设计Finite State Machine来控制复杂运算操作及对寄存器的频繁访问。利用Cyclone EP1C6 FPGA实现语音信号声道特征参数提取算法。

存档附件原文地址

室内语音源定位技术中的时间延迟估计方法分数低阶协方差声门脉冲线性预测 2009/7/29

针对室内的脉冲噪声居多的情况下，结合语音信号的特征，提出了基于声门脉冲提取的分数低阶协方差时延估计方法（LPC+FLOC），通过理论分析和仿真实验表明，具有较好的时延估计有效率，且抗混响能力较强，比较适合室内的语音源定位。

存档附件原文地址

Speech Pre-Processing for Pitch and Pitch-Cylce Evolutions Smoothing Pitch speech coder bit rate pitch cycle 2009/7/28

In low bit rate speech coders, pitch is usually transmitted once per frame and, when needed, the intermediate pitch values are obtained by interpolation between 2 adjacent pitch values. Although pitch...

存档附件原文地址

低延迟低码率语音编码研究低延迟低延迟语音编码算法自适应码书 2009/7/23

现有的低延迟语音编码算法（LD-CELP）需要16 kb/s比特率，无疑会妨碍它的应用。提出了一种采用两阶段码书搜索的方法可以在提高低延迟语音编码算法性能的同时降低码率。首先构造了两个子码书：一个后向更新的自适应码书和一个具有代数结构的固定码书；然后设计了两阶段码书搜索方法使滤波后的激励矢量和目标矢量之间的均方误差保持最小。这样就得到了一个在8 kHz采样率下具有2.5 ms延迟的10 kb/s两...

存档附件原文地址

二维维纳滤波语音增强方法研究与实现语音增强乐性噪声平均主观得分 2009/7/22

充分考虑语音的短时相关性和叠接帧的存在，实现了一种二维形式维纳滤波。采用多帧组合成块的结构进行二维加窗滤波，然后辅以局部平滑的技术，可以有效抑制噪声，并防止乐性噪声出现。在二维维纳滤波方法与一维维纳滤波的对比实验中，采用TIMIT语音数据库，加上指定信噪比的白噪声，实验结果表明前者不但在后者基础上又显著提高了信噪比客观参数，而且MOS主观得分提升了13.8%。

存档附件原文地址

复子波提取语音信号特征信息相位谱基音周期共振峰 2009/7/22

对时变性强的非平稳汉语语音信号，建议采用变时－频复子波分析方法提取汉语语音信号的幅度谱、相位谱、基音周期及共振峰信息。选择有n阶消失矩及良好的时频局域化特性的复高斯子波提取汉语语音信号的幅度谱和相位谱，实验结果表明，该方法提取的语音信号的幅度谱、相位谱和子波变换谱表征了汉语语音的音节包络、细节包络及声调，区分了清、浊音，并准确提取了语音信号的动态基音周期、估计出共振峰。这对汉语语音特征提取和识别提...

存档附件原文地址

中国研究生教育排行榜-条

正在加载...

中国学术期刊排行榜-条

正在加载...

世界大学科研机构排行榜-条

正在加载...

中国大学排行榜-条

正在加载...

人　物-篇

正在加载...

课　件-篇

正在加载...

视听资料-篇

正在加载...

研招资料 -篇

正在加载...

知识要闻-篇

正在加载...

国际动态-篇

正在加载...

会议中心-篇

正在加载...

学术指南-篇

正在加载...

学术站点-篇

正在加载...

中国研究生教育排行榜-条

中国学术期刊排行榜-条

世界大学科研机构排行榜-条

中国大学排行榜-条

人 物-篇

课 件-篇

视听资料-篇

知识库-篇

研招资料 -篇

知识要闻-篇

国际动态-篇

会议中心-篇

学术指南-篇

学术站点-篇

人　物-篇

课　件-篇