1、语音是交叉学科,有深远的研究价值语音是交叉学科,有深远的研究价值近近 50 50 年的研究年的研究历史,语音识别技术已经有了历史,语音识别技术已经有了极大的发展极大的发展但大多数产品能存在于实验室,没有达到使用但大多数产品能存在于实验室,没有达到使用化的效果化的效果主要主要阐述小波变换在语音信号去噪的应用阐述小波变换在语音信号去噪的应用,语,语音端点的检测,语音特征的提取及一种简单的音端点的检测,语音特征的提取及一种简单的语音识别算法。语音识别算法。引言引言语音识别语音识别(Voice Recognition 简称简称“VR”)也称说话人识也称说话人识别,就是根据人的声音特征,识别出某段语音是
2、谁说的。别,就是根据人的声音特征,识别出某段语音是谁说的。声纹识别两方面:说话人辨认和说话人确认。声纹识别两方面:说话人辨认和说话人确认。fzhjkj/index.aspx福州海景科技开发有限公司福州海景科技开发有限公司Video1Video2小波变换在语音信号识别中的应用小波变换在语音信号识别中的应用welcome to use these PowerPoint templates,New Content design,10 years experience1.1.语音识别与小波分析简介语音识别与小波分析简介2.2.小波分析在语音识别中的应用小波分析在语音识别中的应用3.3.前端处理前端处理
3、4.4.特征提取特征提取5.5.最终识别最终识别1.1.语音识别与小波分析简介语音识别与小波分析简介语语音音识识别别声学声学语言学语言学语音学语音学数字信号处理数字信号处理信息论信息论计算机科学计算机科学 目的目的:应用领域:应用领域:v 语音识别的学科体系语音识别的学科体系v 语音识别的研究方向语音识别的研究方向语语音音识识别别语音输入系统语音输入系统语音控制系统语音控制系统基于对话系统的数据库查询系统基于对话系统的数据库查询系统口语翻译系统口语翻译系统自动身份确认自动身份确认计算机辅助教学计算机辅助教学1.1.语音识别与小波分析简介语音识别与小波分析简介语音信号特征语音信号特征 频带特征频
4、带特征:人说话声音频率范围是,男性大约在250Hz2 000 Hz之间,女性则大约在450Hz4 000 Hz之间。信号特征:信号特征:是一种时变、非平稳时变、非平稳的随机信号 语音分类语音分类 清音清音无周期性,主要在高频部分,易混于噪音 浊音浊音接近周期信号,主要分布在低频部分 噪音噪音语音之间间隙,纯噪音的“无声区”v 语音识别系统的性能语音识别系统的性能1.识别词汇表的大小和语音的复杂性;2.语音信号的质量;3.单个说话人还是多个说话人;4.硬件因素(性价比)。语音信号特征语音信号特征研究的热点与难点研究的热点与难点1.语音识别系统的适应性差适应性差;2.高噪声环境高噪声环境下语音识别
5、进展困难;3.如何把语言学、生理学、心理学方面的研究成果量化量化、建模并用于语音识别,还需研究;4.我们对人类的听觉理解、知识积累和学习机制以及大脑神经系统的控制机理等分面的认识还很不清楚;5.若将语音识别系统商品化商品化,还有识别速度、拒识问题以及关键词/句检测技术等细节问题需要解决。小波分析小波分析一种强有力的信号强有力的信号分析工具是语音信号处理的一个重要分支当噪声与语音的频谱相似时,传统的单纯时域或频域处理往往无法达到很好的效果在信号的高频高频域部分,可取得较好的时间分辨率时间分辨率在信号的低频低频域部分,可取得较好的频率分辨率频率分辨率小波阈值去噪方法是实现最简单、计算量最小的一种方
6、法,因而得到了最广泛的应用2 小波分析在语音识别中的应用小波分析在语音识别中的应用2.1 语音信号的降噪处理2.2 语音信号压缩与重构2.3 幅度突变信号的检测2.1 2.1 连续小波基函数连续小波基函数小波函数定义小波函数定义设(t)为一平方可积函数平方可积函数,也即(t)L2(R)。若其傅里叶变换()满足条件 称(t)为一个基本小波或小波母函数基本小波或小波母函数,将母函数(t)经伸缩或平移后,就可以得到一个小波序列小波序列。dR2)(2 小波分析在语音识别中的应用小波分析在语音识别中的应用 ,2 小波分析在语音识别中的应用小波分析在语音识别中的应用,1(),0,attaRaa连续小波基函
7、数连续小波基函数连续小波变换连续小波变换(CWT)dtattfattfaWTRaf)()(1)(),(),(,连续小波变换的逆变换连续小波变换的逆变换(ICWT)data,WTadaCdta,WTadaCtxfa,f)(a1)()()()(021-021-d|)(|02C1.小波(t)和原始信号f(t)的开始部分进行比较 2.计算系数C该部分信号与小波的近似程度;C值越高表示信号与小波相似程度越高3.小波右移k得到的小波函数为(t-k),然后重复步骤1和2,直到信号结束 4.扩展小波,如扩展一倍,得到的小波函数为(t/2)5.重复步骤14 连续小波变换的过程连续小波变换的过程连续小波运算的基本
8、步骤连续小波运算的基本步骤 dtattfaaWTRf)()(1),(离散小波变换的逆变换离散小波变换的逆变换(IDWT)(),(1)(,)(,tkjWTAtftfkjkjfkjkjkj)()(002000020,00ktaakataatjjjjjkaj 离散小波离散小波2 小波分析在语音识别中的应用小波分析在语音识别中的应用)2(2)(2,kttjjkj离散小波变换离散小波变换(DWT)dtttfkjWTkjf)()(),(,用于离散小波重构的命令主要有如下几个:用于离散小波重构的命令主要有如下几个:idwt 用于单层小波重构用于单层小波重构 waverec 用于多层小波重构原始信号,要求输入
9、参数用于多层小波重构原始信号,要求输入参数 同小波分解得到结果的格式一致同小波分解得到结果的格式一致 wrcoef 用于重构小波系数至某一层次,要求输入参用于重构小波系数至某一层次,要求输入参 数同小波分解得到结果的格式一致数同小波分解得到结果的格式一致 upcoef 用于重构小波系数至上一层次,要求输入参数同小波分用于重构小波系数至上一层次,要求输入参数同小波分 解得到结果的格式一致解得到结果的格式一致用于得到某一层次的小波系数的命令主要有以下几个:用于得到某一层次的小波系数的命令主要有以下几个:detcoef 求得某一层次的细节系数求得某一层次的细节系数 appcoef 求得某一层次的近似
10、系数求得某一层次的近似系数 upwlev 重构组织小波系数的排列形式重构组织小波系数的排列形式2 小波分析在语音识别中的应用小波分析在语音识别中的应用dwt函数函数2 小波分析在语音识别中的应用小波分析在语音识别中的应用idwt函数函数2 小波分析在语音识别中的应用小波分析在语音识别中的应用dwt2函数函数2 小波分析在语音识别中的应用小波分析在语音识别中的应用提取一维小波变换低频系数(1)Aappcoef(c,l,wname,N)(2)Aappcoef(c,l,wname)(3)Aappcoef(c,l,Lo-R,Hi-R)(4)Aappcoef(c,l,Lo-R,Hi-R,N)该函数是一个
11、一维小波分解函数,用于从 小波分解结构C,L中提取一维信号的低频系数。appcoef函数函数2 小波分析在语音识别中的应用小波分析在语音识别中的应用detcoef函数函数提取一维信号小波变换高频系数 (1)d=detcoef(c,l,N)提取N尺度的高频系数。(2)d=detcoef(c,l),提取最后一尺度的高频系数。2 小波分析在语音识别中的应用小波分析在语音识别中的应用waverec函数函数多尺度一维小波重构(1)x=waverec(c,l,wname)(2)x=waverec(c,l,Lo-R,Hi-R)(3)x waverec(wavedec(x,N,wavename),wavena
12、me)该函数用指定的小波函数或重构滤波器对 小波分解结构(C,L)进行多尺度一维小波重构。2 小波分析在语音识别中的应用小波分析在语音识别中的应用upwlev函数函数单尺度一维小波分解的重构(1)nc,nl,ca=upwlev(c,l,wname)(2)nc,nl,ca=upwlev(c,l,Lo-R,Hi-R)该函数用于对小波分解结构C,L进行单尺度重构,返回上一尺度的分解结构并提取最后一尺度的低频分量。2 小波分析在语音识别中的应用小波分析在语音识别中的应用wrcoef函数函数对一维小波系数进行单支重构(1)x=wrcoef(type,c,l,wname,N)(2)x=wrcoef(typ
13、e,c,l,Lo-R,Hi-R,N)(3)x=wrcoef(type,c,l,wname)(4)x=wrcoef(type,c,l,Lo-R,Hi-R)对一维信号的分解结构C,L用指定的小波函数或重构滤波器进行重构。当type=a时,对信号的低频部分进行重构,此时N可以为0;当type=d时,对信号的高频部分进行重构,此时N为正整数。2 小波分析在语音识别中的应用小波分析在语音识别中的应用upcoef函数函数 功能:功能:一维系数的直接小波重构 格式:格式:(1)y=upcoef(0,x,wname,N)(2)y=upcoef(0,x,wname,N,L)(3)y=upcoef(0,x,Lo-
14、R,Hi-R,N)(4)y=upcoef(0,x,Lo-R,Hi-R,N,L)(5)y=upcoef(0,x,wname)(6)y=upcoef(0,x,Lo-R,Hi-R)2 小波分析在语音识别中的应用小波分析在语音识别中的应用2.1 语音信号的降噪处理语音信号的降噪处理含噪的一维语音信号模型可以表示如下:含噪的一维语音信号模型可以表示如下:s(k)=f(k)+e(k),k=0,1,n-1 s(k)为含噪信号为含噪信号 f(k)为有用信号为有用信号 e(k)为噪声信号为噪声信号(假设假设e(k)是一个高斯白噪是一个高斯白噪,通通常表现为高频信号常表现为高频信号)基于小波变换进行去噪对含噪声信
15、号作小波变换之后,计算相邻尺度间小波计算相邻尺度间小波系数的相关性系数的相关性,根据相关性区别小波系数的类型 对小波系数设置阈值,在众多小波系数中,把绝对值较小的系数置为零,而让绝对值较大的系数保留或收缩,然后对阈值处理后的系数进行小波逆变换,直接进行信号重构,即可达到去噪的目的。2.1 语音信号的降噪处理语音信号的降噪处理小波阈值去噪的主要小波阈值去噪的主要理论依据理论依据信号在小波域内其能量主要集中在有限的几个系数中,而噪声的能量却分布于整个小波域内经小波分解后,信号的小波变换系数要大于噪声的小波变换系数可以找到一个合适的数作为,当小波系数小于该阈值时,认为这时的小波系数主要是由噪声引起的
16、当小波系数大于该阈值时,则认为其主要是由信号引起的。选择一个合适的阈值,对小波系数进行阈值处理,就可以达到去除噪声而保留有用信号的目的2.1 语音信号的降噪处理语音信号的降噪处理2.1 语音信号的降噪处理语音信号的降噪处理降噪过程降噪过程1.一维信号小波分解分解;2.小波分解高频系数阈值量化阈值量化;3.小波逆变换,对一维小波重构重构。S:原始信号:原始信号cA1,cA2,cA3:分解各层的逼近信号:分解各层的逼近信号cD1,cD2,cD3:分解各层的细节信号:分解各层的细节信号如果将如果将cD1,cD2,cD3的分解系数都设置为零,的分解系数都设置为零,而只保留而只保留cA3,而后进行小波重
17、构,得到的信号而后进行小波重构,得到的信号就是消噪之后的信号。就是消噪之后的信号。分解后的各部分重构分解后的各部分重构分解结构图分解结构图消噪前后对比消噪前后对比2.1 语音信号的降噪处理语音信号的降噪处理降噪特性降噪特性1.高频部分影响小波分解的第一层细节;2.低频部分影响小波分解的最深层和最低频层;3.高频系数的幅值随着分解层次的增加而迅速的衰减,且其方差也有同样的变化趋势。根据小波基的性质和具体信号的特征选择合适的基小波。对一般的信号而言,若信噪比信噪比20,则最大分解尺度取3,否则,最大分解尺度取4好。阈值函数 阈值选择规则2.1 语音信号的降噪处理语音信号的降噪处理常用的硬阈值函数和
18、软阈值函数 硬阈值函数硬阈值函数 软阈值函数软阈值函数,|0|j kj kj kj kwwww,()(|),|0|j kj kj kj kj ksign wwwww2.1 语音信号的降噪处理语音信号的降噪处理利用利用Matlab消噪消噪1.用用ddencmp生成信号的生成信号的默认阀值默认阀值,后利用,后利用wdencmp进行消噪;进行消噪;2.用用wthresh函数进行函数进行给定阀值量化处理给定阀值量化处理,比默,比默认阀值可信度高;认阀值可信度高;3.小波分解结构中的高频系数全部置小波分解结构中的高频系数全部置0,强制消强制消噪处理噪处理。2.2 语音信号压缩与重构语音信号压缩与重构 1
19、.信号的小波分解;2.对高频系数进行阀值量化处理;3.对量化后的系数进行小波重构。2.3 2.3 幅度突变信号的检测幅度突变信号的检测传统的功率谱等方法只能给出信号全频尺度特征,而没有办法说明信号发生突变的具体位置。而在信号分析中,突变点(奇异点)往往代表了故障(声音突变)的发生,在时域上则代表了故障(声音突变)发生的具体时间点。因此功率谱对于信号的突变没有时域分析能力。频率突变信号的奇异性检测频率突变信号的奇异性检测2.3 2.3 幅度突变信号的检测幅度突变信号的检测频率突变信号的的小波分解频率突变信号的的小波分解 小波变换具有空间局部化性质,即可以描述信号在不同频率带中不同时刻变换情况,因
20、此可以利用小波来分析信号的奇异性,判断信号中的突变情况。2.3 2.3 幅度突变信号的检测幅度突变信号的检测幅值突变信号的奇异性检测幅值突变信号的奇异性检测2.3 2.3 幅度突变信号的检测幅度突变信号的检测3 语音识别的前端处理语音识别的前端处理3.1 传统的语音去噪流程方法n存在问题存在问题:直接对语音信号进行阈值处理,信号的高频部分置0,造成去噪后信号的失真。3.2 语音信号去噪的语音信号去噪的改进算法改进算法1.语音信号的清浊音分离清浊音分离;2.对清音段和浊音段分别进行不同的阈值处理不同的阈值处理;3.离散小波反变换反变换,获得去噪后的语音信号。清浊音判定方法:清浊音判定方法:3 语
21、音识别的前端处理语音识别的前端处理清音清音在较高的频率较高的频率段上能量比较强浊音浊音的能量主要分布在较低的频率较低的频率上 先进行清浊音分离,后用不同阀值进行处理先进行清浊音分离,后用不同阀值进行处理3.2 语音信号去噪的改进算法语音信号去噪的改进算法3 语音识别的前端处理语音识别的前端处理3.3 改进阀值函数的小波语音去噪改进阀值函数的小波语音去噪 常用的几种阈值函数使用中的缺点:常用的几种阈值函数使用中的缺点:1.硬阀值法,去噪效果不理想,重构产生振荡;2.软阀值法,重构信号存在较大的失真;3.前三种阀值函数,|X|T时都等于0,会导致去噪后的信号产生较大失真。3.3 改进阀值函数的小波
22、语音去噪改进阀值函数的小波语音去噪3.4 二次小波分解全局阈值方法二次小波分解全局阈值方法1.首先对信号进行三层小波分解,三个高频系数和一个低频系数;2.其高频部分由噪声和信号两部分混合组成,对高频部分进行二次小波分解,得到二次分解后的6个高频系数和6个低频系数;3.此时对各高频部分分解后得到高频系数利用全局阈值进行去噪处理,得到处理后的3个高频部分;4.将处理后高频系数和第一次分解的低频系数再经过小波逆变换,得到去噪后的重构信号。采用改进算法的实验结果采用改进算法的实验结果 选用“db6”小波进行三层分解,采用三种方法对混叠语音信号进行去噪处理,得到去噪后的信号信噪比如下。(输入信噪比为8.
23、2547db)4.2基于小波包分解的语音特征提取基于小波包分解的语音特征提取 利用小波树的已分解出来各级系数提取信号特征:1.先对信号进行多尺度小波树分解,分别提取从低频到高频的各个频段成分的信号特征;2.对小波树的各级分解系数重构,提取各频带范围内的信号;3.求各频带信号的总能量;4.构造特征向量。该种方法可使语音信号特征在不同分辨率的不同子空间中显示出来,得到的各个频带内的能量信号比原始信号有更好的类别可分性。5.15.1小波混沌神经网络语音识别小波混沌神经网络语音识别 小波混沌神经网络(wavelet chaotic neural network,wcnn),即将小波分析作为神经网络的前置处理 为神经网络隐含层提供输入特征向量、它具有响应速度快、识别精度高等优点;然后再提供给混沌神经元部分进行识别。5.2面向关键字检索的语音识别面向关键字检索的语音识别是语音识别研究中的一个重要领域,其目的是从连续语音中检测并确认给定的若干个特定关键词。相对连续语音识别的优势:1.资源耗费小;2.速度快;3.抗噪能力强;
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。