1、第第3 3章语音信号的模型章语音信号的模型语音模型化,便于数字处理。语音模型化,便于数字处理。对模型的要求:对模型的要求:精确描述语音产生过程、尽可能地简单,精确描述语音产生过程、尽可能地简单, 便于处理和实现。便于处理和实现。 已提出许多种不同的语音信号模型。已提出许多种不同的语音信号模型。线性模型:线性模型:广泛使用广泛使用级联无损声管级联无损声管模型和模型和共振峰共振峰模型。模型。理论基础:理论基础:发音过程中声道处于运动状态,这种运动与语音信发音过程中声道处于运动状态,这种运动与语音信号相比号相比变化缓慢变化缓慢,故可用,故可用时变时变的的线性系统线性系统来来模拟模拟。更精细分析时,发
2、现语音中也存在较大的非线性现象,更精细分析时,发现语音中也存在较大的非线性现象, 某些应用需考虑这些因素对所研究问题的影响。某些应用需考虑这些因素对所研究问题的影响。非线性模型:非线性模型:有多种,有多种,调频调频- -调幅模型调幅模型受到广泛关注。受到广泛关注。 本章讨论:本章讨论:级联无损声管模型级联无损声管模型、共振峰模型共振峰模型、调频调频- -调幅模型调幅模型第2章数字语音处理基础 第第3 3章语音信号的模型章语音信号的模型3.1 声在声管中的传播特性 物理学的定律是描述声道中声音的物理学的定律是描述声道中声音的产生产生和和传播传播的基础。的基础。 包括:包括:质量守恒质量守恒、动量
3、守恒动量守恒、能量守恒能量守恒的基本定律,的基本定律, 热力学热力学、流体力学流体力学的定律等。的定律等。空气是一种流体空气是一种流体,也是声音赖以传播的介质。,也是声音赖以传播的介质。应用物理原理,可得描述发音系统中空气运动应用物理原理,可得描述发音系统中空气运动偏微分方程组偏微分方程组。精确的方程精确的方程表达表达和和求解求解都是都是极端困难极端困难的,需的,需简化假设条件简化假设条件。因因周密的声学理论周密的声学理论必须考虑以下各种影响:必须考虑以下各种影响: (1)(1)声道形状的声道形状的时变性质时变性质;(2)(2)声道壁的声道壁的热传导热传导和和粘滞摩擦损耗粘滞摩擦损耗; (3)
4、(3)声音在嘴唇处的声音在嘴唇处的辐射辐射;(4)(4)声道壁的声道壁的柔度柔度; (5)(5)鼻腔的鼻腔的耦合耦合; (6)(6)声道中的声道中的激励激励。目前,没有全面考虑各因素影响的声学理论,目前,没有全面考虑各因素影响的声学理论,应用中对这些因素给出应用中对这些因素给出适当的说明适当的说明或者给出或者给出定性的讨论定性的讨论。 第2章数字语音处理基础 3.1 声在声管中的传播特性 图图3.13.1:语音产生过程的最简单的语音产生过程的最简单的物理模型物理模型。 假设:假设:声道被看成是声道被看成是不均匀截面不均匀截面的声管;的声管; 沿管轴传播的声波是沿管轴传播的声波是平面波平面波;
5、在流体中或管壁上不存在在流体中或管壁上不存在热传导热传导和和粘滞损耗粘滞损耗。根据假设及守恒定律,根据假设及守恒定律,Portnoff证明声波满足证明声波满足偏微分方程组偏微分方程组:式中,式中,p, u 为声管内为声管内 x 位置处位置处 t 时刻的时刻的 声压声压和和体积速度体积速度,p=p(x,t),u=u(x,t) ; A 为声管内为声管内 x 位置处位置处 t 时刻的管的时刻的管的横截面面积横截面面积,A=A(x,t) ; 为声管内空气的为声管内空气的密度密度; c为声的为声的传播速度传播速度(空气中声速空气中声速340m/s)。第2章数字语音处理基础 3.1 声在声管中的传播特性
6、图图3.1语音生成过程的物理模型语音生成过程的物理模型 A(x)声门 嘴唇(a) A(x) 0 l x(b)0 l x(c)2( /)1()pu AxtupAAxctt给定声管的边界条件和面积函数后,可求得方程组的给定声管的边界条件和面积函数后,可求得方程组的闭式解闭式解。 解的解的表达式表达式非常非常复杂复杂,但可以,但可以采用数值解采用数值解。应用中,某一特定时刻,应用中,某一特定时刻,面积函数面积函数可看成可看成不随时间变化不随时间变化。可借助于可借助于各种合理各种合理的的近似近似和和简化简化来使方程的求解成为可能。来使方程的求解成为可能。 并由此得到并由此得到语音信号的模型语音信号的模
7、型(后续讨论该问题)。(后续讨论该问题)。声管中声管中声传播特性声传播特性与传输线中与传输线中电流传播特性电流传播特性有很强的有很强的类比关系类比关系。表表3.13.1:声学量声学量与与电学量电学量之间的之间的类比关系。类比关系。 第2章数字语音处理基础 3.1 声在声管中的传播特性 表表3.1声学量与电学量之间物理量的类比声学量与电学量之间物理量的类比声学量声学量电学量电学量声学量声学量电学量电学量压力压力 p电压电压 v特性声阻抗特性声阻抗 Z0= c/A特性电阻抗特性电阻抗 Z0体积速度体积速度 u电流电流 i声激励角频率声激励角频率电激励角频率电激励角频率声感声感 /A电感电感 L单位
8、长度声阻抗粹单位长度声阻抗粹Z=j/A复阻抗复阻抗 Z声容声容A/(c2)电容电容 C单位长度声导纳单位长度声导纳 Y=jA /(c2)复导纳复导纳 Y第第3 3章语音信号的模型章语音信号的模型3.2语音信号的无损声管模型 无损声管模型无损声管模型(行波型模型行波型模型):由多个):由多个不同截面积不同截面积的的无损耗无损耗 管子管子串联而成的系统。是最简单的声道模型。串联而成的系统。是最简单的声道模型。图图3.2:10级的级的无损声管级联模型无损声管级联模型。语音信号的某一语音信号的某一“短时短时”期间,声道可表示为期间,声道可表示为形状稳定形状稳定的的管道管道。该该“短时短时”期间,管截面
9、期间,管截面 A 是是常数常数。偏微分方程以写成:。偏微分方程以写成:若第若第 m 段管子处,段管子处,A(x,t)=Am,u(x,t)=um, p(x,t)=pm,上式可以写成,上式可以写成 第2章数字语音处理基础 3.2语音信号的无损声管模型 图图3.210级无损声管级联级无损声管级联声门声门 嘴唇嘴唇A1l1A2 l2A3l3A4l4A5l5A6l6A7l7A8l8A9l9A10l10101iill2,puuApxAtxct2,;1,2,mmmmmmpuuApxAtxctm解偏微分方程组,得:解偏微分方程组,得: 式中,式中, lm第第 m 节声管的节声管的长度长度; 和和 第第 m 节
10、声管中的节声管中的正向行波正向行波和和反向行波反向行波。在两个不同截面积的声管联接处,在两个不同截面积的声管联接处,行波表达行波表达如如图图3.3。连续条件:连续条件:第第 m 和和 m+1 节声管节声管 联接处的联接处的声压声压和和体积速度连续体积速度连续。设第设第m节声管左端点为坐标节声管左端点为坐标0点,点, 右端点为右端点为lm ,则有,则有 第2章数字语音处理基础 3.2语音信号的无损声管模型 ( , )()()0;1,2,( , )()();mmmmmmmmcxxpx tututAccxlmxxux tututcc11( , )(0, ),1,2,( , )(0, )mmmmmmp
11、ltptmultut() ()mmuu图图3.3两个无损声管之间的节点两个无损声管之间的节点111111( ) () ( ) ()( ) () ( ) ()mmmmmmmmmmmmututututututututlmAmlm+1Am+1结合两式,可进一步求解,见下页重要表达式,后续求解要用到!令令声波声波通过长为通过长为 lm 的第的第 m 节声管节声管需要的时间需要的时间为为 , 由上页两式,得:由上页两式,得:解得:解得: 式中式中km第第m节节点的节节点的反射系数;反射系数; km是是 在节点处在节点处 反射回波反射回波 的的倍数倍数。图图3.4:两级声管的两级声管的流图流图。 第2章数
12、字语音处理基础 3.2语音信号的无损声管模型 11111()()( )( )1,2,()()( )( )mmmmmmmmmmmmmmccututututAAmutututut111( )(1)()( )()()(1)( )mmmmmmmmmmmmmutkutk ututk utkut , (/ )mmmlc111()() ,( 11;1,2,)mmmmmmkAAAAkm 图图3.4两个无损声管节点信号流图点两个无损声管节点信号流图点111 ( ) () ( ) ()mmmmmmutututut 1+ km-km km 1kmmm+1mm+1111 ( ) () ( ) ()mmmmmmutut
13、utut()mmut()mmut3.2.1嘴唇端嘴唇端N 段段无损声管无损声管,声门声门处为处为第一段第一段,嘴唇嘴唇处为处为第第 N 段段。声学理论:声学理论:嘴唇处的嘴唇处的声压声压和和体积速度体积速度间存在间存在正弦稳态关系正弦稳态关系,即,即 式中,式中,ZL嘴唇处的嘴唇处的辐射阻抗辐射阻抗,或,或辐射负载辐射负载。 假定假定ZL()=ZL是实数,令是实数,令N=LN/c,联立上式和,联立上式和8页偏微分方程页偏微分方程 组的解,得:组的解,得: 即:即: 式中,式中,kL嘴唇处的嘴唇处的反射系数反射系数, 嘴唇处的嘴唇处的体积速度体积速度为:为:图图3.5:级联无损声管在级联无损声管
14、在嘴唇处嘴唇处的的流图流图。 第2章数字语音处理基础 3.2语音信号的无损声管模型 ()()()()NNNNLNNNNNcututZututA111()()LNLNLkcAZcAZ()()NNLNNutk ut (, )(1)()NNLNNultkut(,)(,)NNLNNP lZ Ul该式与电学的该式与电学的欧姆定律欧姆定律相对应相对应(声压声压对应对应电压电压,体积速度体积速度对应对应电流电流)图图3.5级联无损声管级联无损声管在嘴唇处的流图在嘴唇处的流图( ) () NNNutut1+ kLkL NN( ) () (, ) NNNNNututult3.2.2声门端声门端声门可以看成是控制
15、送入声道气流的声门可以看成是控制送入声道气流的阻碍阻碍。电模拟:电模拟:声门处存在一个声门处存在一个内阻抗内阻抗(感性感性阻抗),阻抗), 阻抗值阻抗值为声门处为声门处声压声压与与气流体积速度气流体积速度之之比,比, 即:即:ZG=RG+j LG, RG和和LG是是常数常数。图图3.6:声门端的声门端的电模拟图电模拟图。由图得:。由图得: 式中,式中,U1(0,) 声门处的声门处的体积速度体积速度u1(0,t)的的Laplace变换;变换; P1(0,) 声门处的声门处的声压声压p1(0,t)的的Laplace变换;变换; UG () 等效体积速度源等效体积速度源uG(t)的的Laplace变
16、换。变换。第2章数字语音处理基础 3.2语音信号的无损声管模型 11(0,)(0,)( )GGPUUZ图图3.6声门对应等效电路图声门对应等效电路图 I1 ZG IG U1如果如果ZG是实数,令是实数,令m=1, x=0, 则由上页式和则由上页式和 8 页页偏微分方程组的解偏微分方程组的解,有:,有: 解得:解得: 式中式中 kG声门处的声门处的反射系数反射系数,图图3.7:声门端声门端级联无损声管的级联无损声管的流图流图。第2章数字语音处理基础 3.2语音信号的无损声管模型 11111()()GGGkZcAZcA111111( )( )( )( )( )GGcutututututA Z11(
17、 )0.5(1)( )( )GGGutkutk ut图图3.7级联无损声管在声门处的流图级联无损声管在声门处的流图111( ) ( ) ()GutututkG1112Gk111( ) ()utut将将两级声管级联两级声管级联、声门端声门端和和嘴唇端嘴唇端与与声管级联声管级联的结果合成,的结果合成, 可以画出基于声管理论的整个可以画出基于声管理论的整个流图流图。图图3.8:无损声管模型图无损声管模型图。 图图3.8是是无损条件下无损条件下的结果;的结果;若考虑空气与若考虑空气与管壁间的摩擦管壁间的摩擦、穿过管壁的热传导穿过管壁的热传导以及以及管壁振动管壁振动等损耗,也可以解出前述方程式(结果复杂
18、,不再赘述)。等损耗,也可以解出前述方程式(结果复杂,不再赘述)。 管壁振动的影响最大,使低频端管壁振动的影响最大,使低频端谐振频率提高谐振频率提高; 其它两种损耗的影响较少;两者的净影响只是使低端的其它两种损耗的影响较少;两者的净影响只是使低端的 谐振频率谐振频率比刚性无损声管壁模型的情况比刚性无损声管壁模型的情况稍有上移稍有上移。图图3.8无损声管模型图无损声管模型图11122211( )( )()( )()()( )() (t) GNNNNNNututututututututu112212 GGkk11122211( )()( )()()( )() NNNNNututututututut
19、 1+ k1k1 k1 1k1 1+ kN-1kN-1 kN-1 1kN-1 1+ kLkL第2章数字语音处理基础 3.2语音信号的无损声管模型 例:例:图图3.9的的两级无损声管两级无损声管的流图,的流图, 在嘴唇处的在嘴唇处的体积速度体积速度为为 uL(t) = uL(lL,t) , 系统的系统的频率响应频率响应为为 令令 s=j ,代入上式得该系统的,代入上式得该系统的系统函数系统函数为:为:第2章数字语音处理基础 3.2语音信号的无损声管模型 11111()()GGGkZcAZcA121212()1222()110.5(1)(1)(1)( )( )( )1jjjjeeeeGLLaGGL
20、LGkkkUV Uk kk kk k121212()1222()110.5(1)(1)(1)( )1eeeesGLasssGLLGkkkV sk kk kk k图图3.9两级无损声管流图两级无损声管流图111222( )( )()( )() (t) GLutututututu12 GGkk111222( )()( )() utututut 1+ k1k1 k1 1k1 1+ kLkL1212第第3 3章语音信号的模型章语音信号的模型3.3级联无损声管与数字滤波器的关系 工程上常将声道用工程上常将声道用 10 级等长无损声管级等长无损声管的的级联模型级联模型来表征。来表征。 每节声管长度每节声管
21、长度均为均为x,x =c=l/N l 10 级声管级声管总长度总长度, 一节声管中声一节声管中声传播时间传播时间。声门处加声门处加单位冲激序列单位冲激序列uG=(t),冲激沿声管传播,冲激沿声管传播, 在节点处,一部分被在节点处,一部分被反射,反射,另一部分另一部分继续传播继续传播。分析传播过程:分析传播过程: (1) 声波无反射,直接到达嘴唇的声波无反射,直接到达嘴唇的幅度叠加幅度叠加为为0,时延时延为为N, 则嘴唇处的则嘴唇处的单位冲激单位冲激为:为:0(t -N) ; (2) 一次反射的冲激到达嘴唇处多延迟一次反射的冲激到达嘴唇处多延迟2,幅度叠加幅度叠加为为1, 则嘴唇处的则嘴唇处的单
22、位冲激单位冲激为:为:1(t -N -2) ; (3) 某一节两次反射,或某两节各一次反射,某一节两次反射,或某两节各一次反射,延迟延迟为为22, 幅度叠加幅度叠加为为2,则嘴唇处的,则嘴唇处的单位冲激单位冲激为:为:2(t -N -22) 。第2章数字语音处理基础 3.3级联无损声管与数字滤波器的关系依此分析,无损声管级联系统的依此分析,无损声管级联系统的冲激响应冲激响应及及Laplace变换变换为:为: 式中,式中,e-Ns传播传播 N 段管子所需的段管子所需的延迟时间延迟时间, 如果设:如果设: 其其频率响应频率响应为:为:于是:于是:由上式看出,若系统输入是由上式看出,若系统输入是频带
23、有限信号频带有限信号,即,即/T , 且取样周期且取样周期T=2 ,则,则上述系统上述系统和下面的和下面的离散系统离散系统等效:等效: 式中,式中,n 0,zk 1。 即:即:离散时域模型离散时域模型的极点必的极点必在单位圆内在单位圆内,由稳定性所要求。,由稳定性所要求。第2章数字语音处理基础 3.5语音信号的数字模型ekT图图3.15声道谐振在声道谐振在s和和z平面的表示图平面的表示图 j /T 2Fkk 0 2Fk /T s 平面平面 |zk| k Rez 平面平面j2,eeecos2jesin2kkkkTF TkkTTkkzzF TF T图图3.17全极点全极点V(z)的级联式实现的级联
24、式实现G1z-1z-1( )Gun( )LunG2z-1z-1GMz-1z-1222cosz112cosz2cosMMz2Mz21z22z利用利用数字滤波器数字滤波器的各种实现方法可以实现的各种实现方法可以实现声道声道的的时变滤波器。时变滤波器。 时变数字滤波器时变数字滤波器的的系数系数是是随时间缓变随时间缓变,10 20 ms内不变。内不变。 例:例:用用直接形式直接形式来实现,如来实现,如图图3.16。也可以用也可以用二阶系统二阶系统的的级联级联来实现来实现 V(z),即:,即: ,其中,其中, 式中,式中,M 为为 (N+1)/2的的整数部分整数部分。图图3.17:上式的实现上式的实现级
25、联流图级联流图(特点是硬件可时分复用,对参数变化较 敏感,没有并联形式好)。第2章数字语音处理基础 3.5语音信号的数字模型1( )( )MkkV zV z212( )1 2coskkkkkGV zzzzz图图3.16 全极点全极点V(z)直接式实现直接式实现Gz-1a1z-1a2aN1z-1aN( ) ( )GLunun以上讨论了声道的数字模型,以上讨论了声道的数字模型, 下面分别讨论在嘴唇和声门处的下面分别讨论在嘴唇和声门处的数字模型数字模型。嘴唇处的数字模型:嘴唇处的数字模型:根据式根据式 , 嘴唇处的嘴唇处的声压声压、体积速度体积速度与与辐射阻抗辐射阻抗的的关系式关系式及及 z 变换变
26、换为:为: 由于的实部随频率增高而增高,故上式是一种高通滤波运算,由于的实部随频率增高而增高,故上式是一种高通滤波运算, 可以证明嘴唇辐射的影响可表示为:可以证明嘴唇辐射的影响可表示为: 第2章数字语音处理基础 3.5语音信号的数字模型( ,)( ) ( ,)( )( )( )LLLP l Z U l P zR z Uz10( )(1)R zRz(,)(,)NNLNNP lZ Ul声门处激励的数字模型:声门处激励的数字模型:语音分成语音分成清音清音和和浊音浊音,清音由,清音由随机噪声随机噪声激励产生激励产生 浊音由浊音由准周期脉冲串准周期脉冲串激励产生,其周期称为激励产生,其周期称为基音周期基
27、音周期。图图3.18:浊音情况下,浊音情况下,激励信号激励信号的产生示意图。的产生示意图。冲激串发生器输出的冲激串发生器输出的单位冲激序列单位冲激序列(冲激间隔为(冲激间隔为基音周期基音周期)。)。线性线性激励系统函数激励系统函数为为G(z),经,经幅度控制幅度控制后输出为后输出为浊音激励浊音激励。G(z) 的的反变换反变换 g(n) 可以用可以用Rosenberg函数函数近似表示:近似表示: 式中,式中,N1 斜三角波斜三角波上升部分上升部分的时间,约占基音周期的的时间,约占基音周期的50; N2 斜三角波斜三角波下降部分下降部分的时间,约占基音周期的的时间,约占基音周期的35。第2章数字语
28、音处理基础 3.5语音信号的数字模型1111220.5(1cos); 0()( )cos;20;nnNNnNg nNnNNN其它图图3.18浊音信号激励的产生浊音信号激励的产生基音周期基音周期增益控制增益控制Av冲激串发生器冲激串发生器G(z)( )Gu n斜三角波斜三角波的的占时比例占时比例关系与声带开启面积的与时间关系对应。关系与声带开启面积的与时间关系对应。图图3.19:单斜三角波单斜三角波波形波形及及频谱频谱。 是是低通滤波器低通滤波器。 其其 z 变换变换的的全极点(二极点)模型全极点(二极点)模型: 式中,式中,C 是一个是一个常数常数。斜三角波串斜三角波串可看成可看成加权单位脉冲
29、加权单位脉冲 激励激励单斜三角波模型单斜三角波模型的结果。的结果。 Av是是单位脉冲串单位脉冲串的的幅度因子幅度因子; 单位脉冲串的单位脉冲串的z 变换变换为:为: 完整的完整的激励模型激励模型为:为:第2章数字语音处理基础 3.5语音信号的数字模型1 21( )(1)CTG zez1( )1vAE zz11 21( )1(1)vCTAU zzez图图3.19单个斜三角波及其频谱单个斜三角波及其频谱1.00.80.60.40.20 5 10 15 20 t/msg(n) 20 lg G(ej) 30 20 10 01020301 2 3 f /kHz清音情况下,发清音情况下,发塞音塞音或或摩擦
30、音摩擦音,声道被阻形成,声道被阻形成湍流湍流。 激励可模拟成激励可模拟成随机白噪声随机白噪声, 用用均值均值为为0、方差方差为为1,时间时间或或/和和幅值幅值为为白色分布白色分布的序列。的序列。 图图3.20:考虑所有的激励因素,考虑所有的激励因素,语音产生的数字模型语音产生的数字模型。 特点:特点:二元激励二元激励,浊音、清音激励,浊音、清音激励交替进行交替进行。 声道可以用多种滤波器来模拟,声道可以用多种滤波器来模拟, 通常,把通常,把辐射辐射和和声道声道等因素全部结合,表示为等因素全部结合,表示为全极点函数全极点函数:第2章数字语音处理基础 3.5语音信号的数字模型( )( )( )H
31、zV z R z图图3.20语音产生的数学模型语音产生的数学模型基音周期基音周期增益控制增益控制Avam, GPL(n)增益控制增益控制AN冲激串发生器冲激串发生器G(z)白噪声发生器白噪声发生器V(z)R(z)结论:结论: 优点:优点:该模型对大多数语音是一个好模型,该模型对大多数语音是一个好模型, 能合成出能合成出较满意较满意的的语音语音,是分析语音最重要的基础。,是分析语音最重要的基础。 缺点:缺点:二元激励模型有二元激励模型有局限性。局限性。 模型建立模型建立“短时短时”平衡为前提,平衡为前提,不完全符合实际不完全符合实际; 理论上理论上鼻音鼻音和和擦音擦音需需有零点有零点, 浊擦音浊
32、擦音不是简单的浊音和清音的叠加。不是简单的浊音和清音的叠加。 该模型不能给出模拟。该模型不能给出模拟。第2章数字语音处理基础 3.5语音信号的数字模型第第3 3章语音信号的模型章语音信号的模型3.6语音信号的共振峰模型将将声道声道看成为看成为谐振腔谐振腔,共振峰共振峰是该腔体的是该腔体的谐振频率谐振频率。 柯蒂氏器官柯蒂氏器官的的纤毛细胞纤毛细胞按频率感受排列,故按频率感受排列,故共振峰模型共振峰模型有效。有效。实践证明:实践证明:元音元音用前用前 3 个个共振峰共振峰。 辅音辅音或或鼻音鼻音,用到,用到 5 个以上的个以上的共振峰共振峰。应用物理学,应用物理学,易推导出均匀断面声管的易推导出
33、均匀断面声管的共振峰频率共振峰频率。例:例:成人成人声道声道约为约为17.5 cm, 可计算出:可计算出:f1 = 500 Hz,f2 = 1500 Hz,f3 = 2500 Hz。 发发e时声道最接近时声道最接近均匀断面均匀断面,其,其共振峰共振峰最接近上述值。最接近上述值。从语音信号求出从语音信号求出共振峰频率共振峰频率、带宽带宽和和幅度幅度的方法是重要的。的方法是重要的。三种实用的共振峰模型:三种实用的共振峰模型:级联型级联型、并联型并联型、混合型混合型。第2章数字语音处理基础 3.6 语音信号的共振峰模型3.6.1级联型共振峰模型级联型共振峰模型级联型共振峰模型级联型共振峰模型认为声道
34、是一组串联的认为声道是一组串联的二阶谐振器二阶谐振器。 声道声道有多个有多个谐振频率谐振频率和和反谐振频率反谐振频率,可模拟为,可模拟为零极点模型零极点模型。 一般元音一般元音,使用,使用全极点模型全极点模型,其,其传输函数传输函数如下:如下: 式中,式中,N 极点个数极点个数; , G 幅值因子幅值因子; ak 多项式系数多项式系数。 可将传输函数分解为多个可将传输函数分解为多个二阶极点二阶极点的网络的的网络的串联串联,即:,即: 式中,式中, M 是是 (N+1)/2 的整数部分。的整数部分。第2章数字语音处理基础 3.6 语音信号的共振峰模型1( )1NkkkGV za z2212121
35、11 2cos2( )1 (2cos2)1kkkkB TB TMMkiB TB TkikiieFTedV zeFT zezbzc z212e,2ecos21,iiBTBTiiiiiiNcbFTdbcGd dd 第第 k 个个极点极点zk为为 ,T 是是取样周期取样周期,是,是带宽带宽的的 1/2。取上式中的取上式中的某一级某一级,设为:,设为:则其则其幅频特性幅频特性及其及其流图流图如如图图3.21所示。所示。图图3.22:级联型共振峰模型级联型共振峰模型(取(取N =10,则,则M = 5)。 激励模型激励模型和和辐射模型辐射模型参照前述的结果,参照前述的结果,G 是是幅值因子幅值因子。第2
36、章数字语音处理基础 3.6 语音信号的共振峰模型12( )1iiiidV zb zc z图图3.22级联型共振峰模型级联型共振峰模型G激励模型激励模型V1语音V2V3V4V5辐射模型辐射模型图图3.21二阶谐振器二阶谐振器 | Vi(ej) |/dB 20 020401 2 3 4 5 f /kHz二阶谐振器的幅频特性二阶谐振器的幅频特性 1zd b c1z二阶谐振器的流图二阶谐振器的流图 2eekkB TF Tkz3.6.2并联型共振峰模型并联型共振峰模型 非一般元音非一般元音和和大部分辅音大部分辅音,必须考虑,必须考虑零极点模型零极点模型。 零极点模型零极点模型传输函数传输函数 V(z)
37、为:为:(分子与分母无公因子及分母无重根) 后面的等式是后面的等式是并联型共振峰模型并联型共振峰模型,图图3.23是是M = 5时的示例。时的示例。第2章数字语音处理基础 3.6 语音信号的共振峰模型01211( )11RrMrriNikiikkb zAV zB zC za z121( )1MiiiiAV zB zC z图图3.23级联型共振峰模型级联型共振峰模型语音语音A1V1A2V2A3V3A4V4A5V5G激励模型激励模型辐射模型辐射模型3.6.3混合型共振峰模型混合型共振峰模型 级联型简单级联型简单,可描述一般,可描述一般元音元音。级数取决于。级数取决于声道长度声道长度,取,取35级级
38、鼻音鼻音、塞音塞音或或摩擦音摩擦音时,时,级联模型级联模型不能胜任。不能胜任。采用采用并联型并联型可解决其不足。它比级联型复杂些。可解决其不足。它比级联型复杂些。混合型:混合型:级联型级联型与与并联型并联型相相混合混合。一种。一种较完备共振峰模型较完备共振峰模型。图图3.24:混合型共振峰模型混合型共振峰模型。第2章数字语音处理基础 3.6 语音信号的共振峰模型图图3.24混合型共振峰模型混合型共振峰模型语音语音A1V1A2V2A3V3A4V4A5V5AF辐射模型辐射模型随机噪声随机噪声发生器发生器低通低通滤波滤波V2V3V4V5V1Av冲激序列冲激序列发生器发生器低通低通滤波滤波AB音调周期音调周期 浊浊/清开关清开关第第3 3章语音信号的模型章语音信号的模型3.7 语音信号的非线性模型 (略)(略)第2章数字语音处理基础 3.7 语音信号的非线性模型精品课件精品课件!精品课件精品课件!谢 谢!