1、第章同态滤波 第章同态滤波 8.1 引言8.2 同态滤波的基本概念8.3 解相乘同态系统8.4 相乘同态系统的应用8.5 解卷积同态系统8.6 时谱技术8.7 解卷积同态系统的应用第章同态滤波 8.1 引引 言言本章讨论信号的同态处理的基本概念以及对乘积性和卷积性信号进行同态滤波的方法和应用。通过对这两类信号的处理将会看到,正像表征线性系统一样,广义叠加原理可以按同样的途径予以拓展利用。还会看到,乘积和卷积的同态系统的设计最终要归结为一个线性系统的设计问题,也就是说,核心是设法将非线性问题转化为线性问题来处理。第章同态滤波 8.2 同态滤波的基本概念同态滤波的基本概念线性系统的叠加原理可陈述为
2、:若L为系统的变换,即y(n)=Lx(n)(8.2.1)则对任意两个输入x1(n)和x2(n)以及任意标量c,有Lx1(n)+x2(n)=Lx1(n)+Lx2(n)(8.2.2)Lcx(n)=cLx(n)(8.2.3)一般情况下,输入序列、输出序列和标量都可以是复量。当标量c为纯实量时,线性变换L的最一般形式是由四个实线性变换Lrr、Lri、Lir、Lii组合而成的,如图 8.1所示。这里y(n)=yr(n)+jyi(n)x(n)=xr(n)+jxi(n)第章同态滤波 而且有yr(n)=Lrrxr(n)+Lrixi(n)yi(n)=Lirxr(n)+Liixi(n)(8.2.4)它显然满足式(
3、8.2.2)和式(8.2.3)。当c为复量时,为了也能满足式(8.2.2)和式(8.2.3),必须限制(8.2.5)rrrirriiri LLLLLL换句话说,这时的线性系统L由两个独立的实线性系统Lr和Li组成,简单地用运算符号表示为L=Lr+Li (8.2.6)第章同态滤波 图 8.1 输入、输出序列为复量,标量c为实数的线性系统的一般表示形式第章同态滤波 现在推广此原理。令表示输入信号分量的矢量彼此间广义相加(即组合)的一种运算规则(具体如相加、相乘或相互卷积等运算)。用表示输入信号矢量与标量c之间的一种广义乘法运算规则(如乘以c、c次乘法或开方等具体运算)。同样,用和分别表示输出信号矢
4、量空间的广义矢量相加和标乘的运算规则。若系统变换用H表示,那么,把式(8.2.2)、式(8.2.3)推广为如下的广义叠加原理:Hx1(n)x2(n)=Hx1(n)Hx2(n)(8.2.7)和 (8.2.8)()H c x ncH X n第章同态滤波 这样,将输入运算和输出运算规则分别表示为和的形式,且遵从广义叠加原理的系统称为广义的线性系统或同态系统,用方框图表示如图8.2所示。显然,线性系统L仅仅是同态系统在和具体都是相加(+)以及和具体都是相乘()时的一种特例。图 8.2 输入运算为、输出运算为,且系统变换为H的同态系统的表示第章同态滤波 为了把线性矢量空间理论应用于同态系统,输入与输出运
5、算必须满足矢量相加和标乘的代数公式。譬如,其中一个重要的公式就是矢量相加必须是可交换的和可结合的,即是(8.2.9)12211221xnxnxnxnynynynyn和 123123123123xnxnxnxnxnxnynynynynynyn(8.2.10)由图8.2表示的同态系统可以进一步表示为如图 8.3所示的规范形式,它由三个系统级联而成。第章同态滤波 图 8.3 同态系统的规范表示第章同态滤波 第一个系统D的变换特性是(8.2.11)121212DxnxnDxnDxnxnxn(8.2.12)D c x nc Dx ncx n系统L为一般的线性系统,它满足式(8.2.1)式(8.2.3)。
6、具体地说,就是 121212()()(),()()L xnx nL x nL xnynyny nL x nL cx ncL x ncy n最后,系统D1把相加转换为的运算,即为D的逆运算:11112121211DynynDynDynynynDc y ncDy ncy n第章同态滤波 由于系统D由运算和确定,它是这类系统的表征,因此称D是运算为的特征系统。同样,D是运算为的特征系统。进一步看到,输入和输出运算相同的一切同态系统彼此间的差异仅仅在于线性部分,这个结论极为重要。这意味着,特征系统一旦确定,剩下的就仅仅是线性滤波的问题了。譬如,欲从信号 x(n)=x1(n)x2(n)中恢复x1(n),
7、首先要找出一个特征系统D,它把x(n)变换为 1212 Dx nDxnDxnxnxn然后,适当选择和设计线性系统L,只让Dx(n)中x1(n)=Dx1(n)的分量通过。理想情况下:第章同态滤波 11y nx nDx n这样,取D1=D1,在逆特征系统D1中,最后得到输出为y(n)=D1y(n)=D1Dx1(n)=x1(n)第章同态滤波 8.3 解相乘同态系统解相乘同态系统现在考虑一种同态系统,它遵从输入运算为相乘,而为取指数的广义叠加原理,亦即输入信号一般具有 x(n)=x1(n)x2(n)(8.3.1)的形式,适配于这种相乘性信号的特征系统D应具有以下特性:Dx1(n)x2(n)=Dx1(n
8、)+Dx2(n)(8.3.2)在形式上具有此特性的函数运算是取对数。举例来说,若x1(n)和x2(n)为实的正序列,那么,对于任意实际量和,有 lnx1(n)x2(n)=lnx1(n)+lnx2(n)(8.3.3)第章同态滤波 在本节和下节中所涉及的相乘同态系统,只处理实的正信号序列,因此特征系统运算只需满足式(8.3.2)即可,不存在模糊性问题。对于这类有限制的相乘同态系统,如果输入由式(8.3.1)给定,那么,特征系统输出并加至线性滤波器的信号将是(8.3.4)12x nxnxn其中(8.3.5)1122ln,lnx nx nxnxn第章同态滤波 同样,对于这类系统的线性滤波部分的冲激响应
9、也应是实的,并应根据x1(n)和x2(n)的特性以及滤波要求适当选择线性系统。例如,若需分离各分量或对各分量作独立的处理,应具备的前提条件是:x1(n)和x2(n)的频谱不得有严重的重叠,也就是说,只有当一个分量变化快,而另一分量作相对缓慢变化时,相乘性同态滤波才是有效的。下节就来介绍这种滤波的两个实例。第章同态滤波 图 8.4 特征系统为变相乘为相加运算的同态滤波系统第章同态滤波 8.4 相乘同态系统的应用相乘同态系统的应用8.4.1 雷达对杂波干扰的恒虚警处理雷达对杂波干扰的恒虚警处理雷达通常在各种杂波干扰环境下工作,大片杂波沿径向距离分布的范围比雷达距离分辨单元大得多,杂波视频可近似地看
10、做是由两个分量相乘组合而成的,即x(n)=A(n)c(n)(8.4.1)第章同态滤波 由于因子A(n)的影响,杂波视频序列成为非平稳的随机序列,这对雷达信号的检测极为不利。因为杂波干扰增强,会引起雷达自动检测系统过高的虚警率。典型的数值结果表明,若杂波干扰电平增大23 dB,则虚警概率要增大34个数量级,造成雷达误判更多的杂波为目标回波,以致引起终端处理设备过载,这显然是不希望的。所以,在作判决之前,必须对x(n)作归一化处理,或者确切地叫做恒虚警处理,把x(n)处理成和A(n)无关的平稳随机序列。第章同态滤波 图 8.5(a)是把图 8.4具体化的同态滤波器,用来完成一种简单的恒虚警处理。由
11、于A(n)和c(n)都是非零的实序列,特征系统D的运算是对信号包络取对数,因此,特征系统实际上是一个对数检波器,其输出为(8.4.2)ln()ln()ln()x nx nA nc n一个实际可供采用的高通滤波器如图8.5(b)所示,其中,每个z1的分支传输代表一个采样间隔,等于相邻距离分辨元的时间间隔。从输入到B点的传输构成一个N点长的FIR低通滤波器,其数学函数为1B0()()NnHZh n z第章同态滤波 图 8.5 雷达作恒虚警处理的同态滤波第章同态滤波 h(n)为低通滤波器的低通冲激响应加权系数,当为均匀加权,即h(n)=1/N时,低通滤波器的频率响应为 1jj2B1 sin(/2)(
12、)esin(/2)NNHeN另一方面,从输入至A点的传输为全通的延时支路,为对称起见,不妨取N为奇数,A为低通滤波的全部延时的中点,这样,从输入至A点传输的频率响应为1jj2A(e)eNH高通滤波器的频率响应为H(ej)=HA(ej)HB(ej),即(8.4.3)1jj2sin2(e)e1sin/2NNHN第章同态滤波 事实上,若把A点输出作为对数检波器输出的杂波采样,那么,B点的低通滤波输出是A点采用自身前后(N1)/2点杂波采样的加权和,对于均匀加权,h(n)=1/N,它等于前后总共N个采样点的算术平均,表示为11B001100111/1/0011()()ln()11 ln()ln()ln
13、()ln()ln()ln()NNxxNNxxNNNNxxyxx xx xNNA nc nNNA XC XA Xc x式中第章同态滤波 11/011/0()()()()NNxNNxA nA nc xC n(8.4.4)分别是A(n)和c(n)的第N个样元的几何平均值,于是高通滤波器输出为1()()()ln()ln()ln()211()()22 lnln()()ABNy nynynx nA nc nNNA nc nA nC n可以认为在N个样元内A(n)的变化不显著,近似有(8.4.5)1()()2NA nA n第章同态滤波 这时,基本被滤除为零,于是,高通滤波器的输出近似为1()2ln()Nc
14、nA n(8.4.6)1()2()ln()Nc ny nc n在逆特征系统中经过取指数运算后,得到同态滤波输出为(8.4.7)()1()2()eln()y nNc ny nc n第章同态滤波 8.4.2 图像的同态处理图像的同态处理众所周知,当光源照射在物体上时,由于物体各个不同部分的不同反射,对视觉感光面或其他感光面形成了图像,如果感光面是理想的,则图像的形成是一种相乘过程的模式,即光源的照度图乘以物体的反射图产生了图像的亮度图。用fi(u,v)和fr(u,v)分别表示两维的照度图和反射图,其中u和v为连续的空间变量,则亮度图可以表示为f(u,v)=fi(u,v)fr(u,v)(8.4.8)
15、由于照度图和图像的亮度图仅仅反映了非相干光能的分布图形,所以f(u,v)和fi(u,v)总是正的实函数,而fr(u,v)仅仅是对光能的反射图,必然为小于1的正数,即有 第章同态滤波 0fr(u,v)1 (8.4.9)0f(u,v)fi(u,v)(8.4.10)总之图像可以表示为两个分量的乘积,而每个分量为正实量。由此看来,图像的结构理想地适于用乘法同态系统来处理。为了进行图像的数字处理,必须对一幅有限空间的图像作周期性采样,以获得一个二维的序列x(m,n)作为处理对象,即x(m,n)=f(mu,nv)(8.4.11)其中,采样间隔u和v要选择得足够小,以免产生显著的频谱混叠。根据式(8.4.8
16、),可以将式(8.4.11)写成x(m,n)=xi(m,n)xr(m,n)(8.4.12)第章同态滤波 离散的图像同态处理系统仍有图 8.4的规范形式,由于处理的函数都是正的实量,特征运算只需取实对数,因此不会遇到复对数的虚部的模糊性麻烦。特征系统的输出是(8.4.13),ln,ln,ln,ln,irirx m nx m nx m nxm nx m nxm n,irx mnxmnxmn由于线性系统的性质,显然有(8.4.14),iry mnymnymn其中yi(m,n)和yr(m,n)分别是处理后的照度和反射强度函数。最后,同态滤波输出为第章同态滤波 (8.4.15)iririr,exp,ex
17、p,exp,y mnymnymnymnymnymnymn虽然照度变化慢,但就整个画面而言,其变化却可能很大,使得图像信号具有很宽的动态范围,这就给在通信线路上传送图像或者在诸如感光胶片上存储图像带来麻烦,于是图像处理的一个重要方面就是通过对照度分量的单独处理,进行动态范围的压缩,以避免再传输或存储适应期的非线性失真。图像处理的另一重要方面是提高对比度,就是使图像中物体的边缘轮廓清晰。由于这些边缘轮廓主要对应着反射分量的急剧变化,因此,为了改变图像的对比度,需要独立处理反射分量。第章同态滤波 既然照度图和照射强度函数大致对应在频谱的低频分量,而反射图和反射强度函数大致对应在频谱的高频分量地带,因
18、此,为了同时压缩动态范围和提高对比度,应当选择线性系统,使其二维幅频特性在低频域为低增益i,而在高频域为高增益r,大致呈现二维的圆对称频率特性。通过原点的任意一横截面的幅频响应如图 8.6所示。在理想情况下,这种滤波器对照射分量的增益为i,对反射分量的增益为r,于是iriiiirrrr(,)(,)ln(,)(,)(,)ln(,)y m nx m nx m ny m nx m nx m n由式(8.4.15)得irir(,)(,)(,)y m nx m nx m n(8.4.16)第章同态滤波 显然,若选择i1,以提高对比度。图 8.6 圆对称频率特性的一个横截面(这种特性用在图像处理系统的 线
19、性部分,以提高对比度和压缩动态范围)第章同态滤波 8.5 解卷积同态系统解卷积同态系统以用同态滤波系统来处理。8.5.1 规范系统规范系统考虑一个是由直线卷积和组成的序列,即1212()()()()()kx nx nx nx k x nk不难证明,直线(离散)卷积满足矢量相加的各代数法则,因此可以归类为同态系统,标乘以整数a相当于x(n)与自身重复卷积a次,并可推广到a为非整数和负数的一般情况。在图 8.7中示出了解卷积同态滤波器的规范形式。第章同态滤波 图 8.7 以卷积为输入和输出运算的同态滤波器的规范形式第章同态滤波 按照式(8.2.11)和式(8.2.12),特征系统D*有如下特性:(
20、8.5.1)(8.5.2)121212()()()()()()D x nx nD x nD x nx nx n=()()()D cx ncDx ncx n第章同态滤波 8.5.2 特征系统特征系统D的数学表示的数学表示特征系统的数学表示的关键在于x(n)=x1(n)*x2(n)的Z变换是 X(z)=X1(z)X2(z)这一事实。亦即Z变换运算Zx(n)可以看成是以卷积作为输入运算和以相乘作为输出运算的同态变换,可用图 8.8来表示。采用了Z变换之后,卷积性组合变成了乘性组合,接着便可用一个相乘同态系统来处理。这样,若信号用其Z变换来表示,则图 8.7的规范形式就可用图8.9表示,它实质上是在复
21、频域(或频域)上的相乘同态系统。既然在正常情况下函数是复的,故此处必须使用复对数。第章同态滤波 图 8.8 把Z变换看做从卷积到相乘的同态变换第章同态滤波 图 8.9 用Z变换表示信号同态滤波的规范形式第章同态滤波 当信号仍用时域上的序列而不用其Z变换时,可在形式上用图 8.10表示其特征系统D*。值得指出的是,z和z1不仅是卷积和相乘矢量空间之间的同态变换,它们也都是通常意义下的线性变换。图 8.10 特征系统D*的表示第章同态滤波 从图 8.10的计算流程看,有12()ln()ln()ln()X zX zx zxz进一步做Z逆变换运算,特征系统D*给出(8.5.3)12()()()x nx
22、 nx n11()ln()XzXz22()ln()XzXz1()x n2()x n 和分别为和的逆Z变换。由此看到,特征系统D*的作用是同态系统的输入端实现时域上的由卷积至相加运算的同态变换,以便和后面的线性系统匹配。第章同态滤波 8.5.3 线性系统线性系统线性系统L用来完成同态系统的滤波作用。理论上,任何遵从通常意义下的加法的叠加原理的系统都可用在图 8.7所示的规范系统中。线性系统的选择要视信号的复时谱的特性及滤波处理要求而定。实际上,包含在信号的复时域内的各个分量往往有显著的差异它们沿时间轴(n)的分布是不完全重叠的。这样,就为线性系统提供了有效滤波的可能性。第章同态滤波 如果信号用其
23、Z变换或傅氏变换表示,那么,正像图 8.9那样,卷积同态系统将转换为乘积同态系统。但是,这和图 8.4的区别仅仅在于它的线性系统不是在离散时域而是在连续域(或离散频域)作周期性卷积运算的,换句话说,仅仅是时域和频域的作用进行了交换。另一方面,在图 8.7所示的规范系统中,线性系统L用于完成复时谱x(n)在时域n上的加权。令l(n)表示其加权函数,那么,线性系统的输出序列y(n)应是(8.5.4)12()()()x nx nx n对上式两边取Z变换,用L(z)表示l(n)的Z变换,根据复卷积定理有(8.5.5)jj()j1(e)e(e)d2wwYLX第章同态滤波 通常限定x(n)、x(n)、y(
24、n)、y(n)是实的稳定序列,实际情况也能满足这一要求。因此,l(n)也应是实序列,通常也应是稳定的,这意味着L(z)的收敛域包括单位圆,L(ej)的实部和虚部分别是的偶函数和奇函数。几种典型的线性非频变系统的l(n)曲线如图 8.11所示,它们分别具有“短通”、“长通”和“缺口”型复时谱滤波特性。第章同态滤波 图 8.11 三种典型的复时谱滤波器特性第章同态滤波 8.5.4 逆特征系统D*1逆特征系统完成特征系统D*的逆运算,如图8.12所示。根据定义,有*1*()()DD x nx n图 8.12 特征系统D*的表示第章同态滤波 由于认定x(n)和x(n)是稳定的,因此y(n)和y(n)也
25、必然是稳定的序列。这样,Y(z)和Y(z)的收敛域必定包括单位圆,从而有11()()d2 ny nc Y z zz其中,c为单位圆。另外有()exp()Y zY z复指数不存在模糊性问题,若Y(z)在单位圆上为解析的,则expY(z)亦然。第章同态滤波 8.5.5 举例分析举例分析考虑有一个复合信号序列x(n),它包括两个相加分量:主波s(n)和一个由于多径反射产生的延时回波s(nn0),为衰减系数,是一实数,n0为延时。如图 8.13(a)所示,由于s(n)=s(n)*(n)s(nn0)=s(n)*(nn0)于是 x(n)=s(n)+s(nn0)=s(n)*(n)+(nn0)或者x(n)=s
26、(n)*p(n)(8.5.6)p(n)=(n)+(nn0)(8.5.7)第章同态滤波 表明复合信号x(n)是主波s(n)与冲激响应p(n)的卷积。设主波为一因果性、实的指数衰减序列:0,0 nnS zS zann它仍然是一个因果性、实的衰减序列,其衰减速度为原序列的n倍。对于干扰回声,其冲激响应p(n)的Z变换及变换的复对数为00011()1()ln()ln1 =(1)nnkknkkP zzP zP zzZk 同样,可以写出其复时谱为第章同态滤波 1010,0()(1)(),0kkknP nnknnk它在n=kn0处呈现正、负相间的尖峰,见图 8.13(c)。第章同态滤波 图 8.13 移去回
27、声干扰的解卷积同态滤波系统第章同态滤波 8.6 时谱技术时谱技术8.6.1 复时谱的定义复时谱的定义序列x(n)的复时谱x(n)仍是一个在时域上的离散序列,它定义为x(n)的Z变换的复对数的逆变换,即(8.6.1)1111()ln()ln()ln ()d2jncx nX zZ x nZ x nzz在实际应用中,输入信号序列x(n)往往是实的,而且也希望它的复时谱是实的,此外,为了便于用FFT做复时谱运算,必须限定积分回线c为单位圆。于是,这些限定归纳如下:(1)x(n)和x(n)是实的、稳定的;(2)X(z)和lnX(z)在单位圆上收敛;(3)lnX(z)必须在包括单位圆在内的某个环形域内是解
28、析的,而x(n)正是对应着lnX(z)在该域上的逆Z变换而唯一存在的。第章同态滤波 8.6.2 功时谱和相时谱功时谱和相时谱时谱(Cepstrum)是在时谱技术领域内初期出现的术语,为了和复时谱区分,后人又称其为功(率)时谱(Power Cepstrum)。一个序列的功时谱定义为该序列Z变换的幅度平方的对数的逆Z变换的平方,即(8.6.2)212pc()(ln()xnZX z由于ln|X(z)|为X(z)的实部,它的逆Z变换是x(n)的偶分量xe(n),亦即c(n),即11ln()()()()2ZX zc nx nxn于是,立刻得到功时谱和复时谱的关系:(8.6.3)22pc()()()4()
29、xnx nxncn第章同态滤波 功时谱分析技术比复时谱技术简单,因为它不需计算谱的相位,不存在多值性问题。它同样可用于作多径回声检测和延时估值,但是由于丧失了相位信息,所以不能用来恢复波形。序列的相(位)时谱(Phaze Cepstrum)可以形式地定义为序列的Z变换的相位(复对数的虚部)的二倍的逆Z变换的平方。由于复对数的虚部等于复对数减去复对数的实部,即jImlnX(z)=lnX(z)ln|X(z)|所以相时谱的定义式可以写成(8.6.4)12()(2 jImln()LxnZX z或(8.6.5)12()(2ln()2ln()LxnZX zX z第章同态滤波 另一方面,由于jlm lnX(
30、z)是复时谱x(n)的虚部的Z变换,即101jImln()()()()2ZX zx nx nxn于是,立即可以写出相时谱和复时谱的关系式(8.6.6)2()()()Lxnx nxn理论上,相时谱也可以用作回声检测和延时估值,但是实际上很少用,这是因为它和复时谱技术一样,都需要考虑和解决相位伸展,而由于附加的噪音,线性相位项以及复谱的缺口等因素的影响,都会造成相位伸展的计算误差。尽管如此,在估价噪音对信号相位的影响的问题上,采用相时谱技术是可取的。第章同态滤波 8.7 解卷积同态系统的应用解卷积同态系统的应用8.7.1 解混响解混响在式(8.5.6)中已经看到,包含一个主波s(n)和一个延时回声
31、波s(nn0)的混响波可以写成卷积的形式:x(n)=s(n)*p(n)(8.7.1)其中p(n)=(n)+(nn0)(8.7.2)是混响环境的冲激响应,其复对数谱为0jj(e)ln(1e)nP所对应的复时谱分量为(8.7.3)1010,01,0kkknp nnknnk第章同态滤波 在更为一般的情况下,混响波包含多个多径回声分量,这时,p(n)可以写成(8.7.4)1()()Mkkkp nnnn 相应的复对数谱是jj1(e)ln 1eMkkkP如果这些回声分量是等间隔的,即nk=kn0,那么,复时谱的形状就和单个回声的情况相似。然而,对于非等间隔的回声,x(n)所包含的尖峰发生的时刻是原始延时的
32、复杂函数。但是在p(n)为最小相位的特殊情况下,p(n)=0,n0。进一步有p(n)=0,nn1)时(8.7.5)11,0,1,2Mkknl n l图 8.14(a)记录了连续四段410 ms的语音,图(b)是图(a)的主波和一个50 ms延时的回声合成的混响波,经过特征系统的运算求得图(b)的复时谱如图(c)所示。显见,主波的复时谱分量集中在n0附近区域,而在n=50 ms,100 ms,150 ms,处出现的尖峰对应着混响波中冲激响应的复时谱分量。这样,用类似图(d)的梳状缺口滤波器移去这些尖峰,再通过逆特征系统运算,得到的输出波形如图(e)所示。对比图(e)和图(a),看到回声的混响被解
33、除,原始的语音主波波形得到恢复。第章同态滤波 图 8.14 用同态滤波移取回声干扰第章同态滤波 式(8.5.6)和式(8.7.4)也适用于描述地震信号模型。发生地震时,能量脉冲沿地球传播,在地壳的地层间的边界处发生反射,p(n)是一系统不规则的冲激脉冲,它包含了地壳结构的信息,而地震主波s(n)取决于激励扰动和在传播中发生色散的性质。由于主波和一系列回声在时间上的重叠掩饰了p(n)的结构,故需要分离这两个分量。用图 8.15所示的同态解卷积的综合范例便能完成这一任务。信号p(n)、s(n)和x(n)分别示于图(a)、图(b)、图(c);复时谱x(n)示于图(d)。这里采用了指数加权,=0.98
34、5,图(e)和图(f)表示经过复时谱滤波分别保留了x(n)的长时和短时部分后恢复的p(n)和s(n)的波形,即对p(n)和s(n)的估计波形,从p(n)可以了解地壳的结构,从s(n)可以估计沿传播途径的衰减和色散特性。第章同态滤波 图 8.15 地震信号的同态解卷积第章同态滤波 图 8.16表明某次地震波的真实记录以及同态解卷积后估计地震主波的结果。图 8.16 地震信号同态解卷积实例第章同态滤波 8.7.2 语音参量估值语音参量估值气流激励声道产生语音。声道的一端是喉门,另一端是唇。在它们保持固定构形的期间,声道可被塑型为一个线性非时变系统,它的输出是声道的冲激响应与激励波形的卷积。语音由三
35、种基本方法产生:(1)由声带的振动发生准周期性气流脉冲激励声道产生浊音;(2)声道某一部分紧闭,留有窄小间隙,强迫空气流过狭口以产生紊流,因此产生噪音状激励的摩擦音;(3)先是完全紧闭声道的某一部分,鼓足气压,然后猛然释放气流送气,由此产生爆破音。第章同态滤波 这三种声源就像是一个宽带激励源作用在声道上,声道可以看做是一个缓慢时变的滤波器,结果是将其频率响应和激励相乘。声道的特征是自然频率,即声道频率响应的共振点。如果认为激励源和声道的形状相对无关,则图 8.17是一个合理的模型。在此时域离散模型中认为语音波形的采样是一个近似有声道传输特性的时变数字滤波器的输出。由于在连续语音中,声道形状的变
36、化相当慢,可以合理地认为在10 ms量级的时间内。该数字滤波器的特性固定,这样数字滤波器可以用一个IIR滤波器的冲激响应或频率响应或一组系数表示。第章同态滤波 图 8.17 语音形成的模型第章同态滤波 对于浊音(鼻音除外),数字滤波器的系统函数包含一个声道分量,其传输函数是(8.7.6)1*11()1(1)(1)kpkkkAV zcc zc z其中,ck对应于声道的自然频率,还包括另一个考虑到声门脉冲为有限长而不是冲激脉冲的分量,其传输函数为(8.7.7)0111()(1)(1)lmmkkkkG zBa zb z于是,在图 8.17中,数字滤波器的系统函数是Hv(z)=G(z)V(z)(8.7
37、.8)第章同态滤波 该滤波器受到一串冲激脉冲的激励,冲激脉冲的间隔相当于浊音的基本周期音调周期。对于清音,声波传播理论指出,声道传输既有极点也有零点,这时的合理模型是(8.7.9)1*111*11(1)(1)()(1)(1)mkkkupkkkAd zd zHzc zc z如果认为在一段时间区间内上述模型合适,那么同态解卷积可用来估值语音模型的参量。这时,一短段语音可以看成是一个卷积:s(n)=p(n)*g(n)*v(n),0nL1第章同态滤波 为了减少区间始端和末端数据“突变”的影响,采用一个加权窗孔w(n),于是同态系统的输入是 x(n)=s(n)(n)通常(n)要比g(n)*v(n)变化慢
38、,近似有 x(n)p(n)*g(n)*v(n)(8.7.10)其中p(n)=w(n)p(n)(8.7.11)下面来检查对应着每一个分量的复时谱分量。p(n)为一串均匀间隔n0的单位冲击脉冲:(8.7.12)100()()Mkp nnkn第章同态滤波 因此(8.7.13)1000()()()Mkpnknnkn定义一个序列:0()nk(8.7.14)00(),0,1,1()0,nknkMkk为其它则p(n)的Z变换是(8.7.15)000100()()()()Mn knnnnkpzpn zknzWz 是的Z变换。于是,p(n)的复时谱是0()nWz0()nwn(8.7.16)0000(),0,2,
39、()0,nnWnnnpnn其它第章同态滤波 v(n)是最小相位序列,其复时谱v(n)等于(8.7.17)*0,0()ln,01(),0knnknv nAnccnn取ck=|ck|ejk,则有(8.7.18)1()2cos(),0npkkkcv nnnn至于声门脉冲g(n),它是有限长序列,一般是非最小相位型,因此可以表示为一个因果最小相位序列和一个逆因果最小相位超前序列的卷积,即minmin()()()g ngngn第章同态滤波 于是,g(n)对复时谱x(n)的贡献分量是minmin(),0()(),0gnng ngnn从前面的讨论中可以预料,g(n)将会集中在n=0附近区域。通常,复时谱分量
40、v(n)和g(n)集中在n=0附近,衰减得相当快。当n0足够大时(在采样频率为10 kHz时,通常40n0150),声道和声门分量的复对数频谱变化缓慢,而音调分量的复对数频谱变化迅速。这可以用图 8.18说明。第章同态滤波 图 8.18 海明加权的语音波形及其复时谱第章同态滤波 若要分离语音波形的各个分量,应对复时谱作短通滤波以获得v(n)*g(n),作长通滤波以获得p(n)分量。图 8.19所示为一实例。其中图(a)表明了一段元音波形,在用海明窗加权后算得如图(b)所示的复时谱,复时谱为一长通滤波器所加权滤波,即与复时谱相乘的加权函数为0,40()1,40nl nn然后经过逆特征系统处理,得
41、到如图(c)所示的结果输出。它是对音调p(n)的估值。另一方面,为了恢复v(n)*g(n),复时谱乘以相反的加权函数l(n):1,40()0,40nl nn第章同态滤波 这时逆特征函数系D*1的输出如图(d)所示,它是v(n)*g(n)分量的估值。进一步把图(b)恢复成一串等幅冲激脉冲,它作为音调脉冲与图(d)的波形作卷积运算,综合成图(e)所示的语音波形。图(e)和图(a)相对照,二者应当趋于一致,事实上也正是如此。第章同态滤波 图 8.19 语音波形分量的分离图例第章同态滤波 在语音分析的某些场合下,人们关心的只是估值语音参量而不是恢复其中某一分量的波形。举例来说,有时只需判别具体的语音段
42、是浊音还是清音,若是浊音,就估值音调周期或谱的包络:ln|V(ej)G(ej)|若是清音,就估值频谱ln|Hu(ej)|在这些情况下,由于不需要恢复波形,可以利用功时谱的概念代替复时谱。因为复时谱偶分量是11()()()ln()2c nx nxnZX z而功率谱和复时谱的关系由式(8.6.6)给出:第章同态滤波 于是,处理xpc(n)的问题就等效为处理c(n)的问题,从而获得对信号分量的谱的包络复频特性的估值。可以预料,c(n)的短时(n=0附近)部分对应着ln|X(ej)|的慢变化分量,它取决于声道的构形。对于浊音,p(n)的偶分量必然会在和p(n)相同的位置上出现周期性尖峰,这一切可用图8
43、.20加以说明。2pc()4()xncn第章同态滤波 图 8.20 语音的同态分析第章同态滤波 8.7.3 同态预测同态预测同态预测是把复时谱分析和线性预测很好地结合在一起的信号处理技术。下面先对线性预测作一简要介绍。所谓线性预测,是指把信号看成是某个激励输入(典型的如具有均匀谱的单位冲激或白噪音)通过某个线性系统的结果,信号的现时刻值可由一系列过去值及假想的输入激励的过去和现时刻值所决定,因而是可预测的,为此必须找出系统的参量模型。最适宜做线性预测分析的是所谓的全极模型,如图 8.21所示。第章同态滤波 图 8.21 信号的全极模型和线性预测第章同态滤波 全极型信号是有限的p个过去值和某个输
44、入激励u(n)的线性组合:1()()()pkkx na x nkGu n 其中G为增益因子。系统的转移函数具有p阶级点的形式:(8.7.20)(8.7.19)1()1pkkkGH za z问题在于:给定信号值x(n),用何种方式确定预测系数ak和增益G。实际上,输入u(n)往往是未知的,信号x(n)只能用自身过去的p个采样的线性加权和来预测为(8.7.21)1()()pkkx na x nk 第章同态滤波 预测误差等于 1()()()()()pkke nx nx nx na x nk通常根据最小均方误差准则,即使 为最小值来确定ak。对于确定信号或平稳随机信号,若取 n,那么,ak由下面的p个
45、线性方程求出:2()minnEen(8.7.22)1()(),1pkka R ikR iip 其中()()(1)nR ix n x n第章同态滤波 是x(n)的自相关函数。式(8.7.22)表明,p个ak的值(k=1,2,p)唯一地决定于p+1个R(i)的值(0ip)。换句话说,对于这样一些信号,如果它们的前p+1个自相关值相同(R(0)相同意味着能量相同),那么,它们就有相同的预测系数,因而具有同一个参量模型。另外,从计算的观点看,一个因果性、稳定的全极滤波器(因而是最小相位型的)是必要的。事实上,自相关函数的正定性保证了H(z)的分子多项式(逆滤波)1()1pkkkA za z 第章同态滤
46、波 复时谱和线性预测的结合具体有如下三个方面:(1)混合相位信号的分解。混合相位信号是最小和最大相位型信号的卷积。最小相位分量的复时谱是因果性的,在复时端为零;最大相位分量的复时谱为逆因果序列,在正时轴上为零。这样,用复时谱同态滤波可以完全分离这两个分量,然后作线性预测。(2)复时谱预测。线性加权的复时谱nx(n)的Z变换是0011111111d()dln()dd 1111 iimpmpkkkkkkkkkkkkX zX zzzzzc zc zb zd za zc zb zd z(8.7.23)第章同态滤波(3)用同态解卷积和逆滤波作极-零分析,如图8.22所示。对极-零模型的信号也可作线性预测,但只能估出极点,这时根据预测结果可设计逆滤波器A(z),借以得到全模型的剩余信号。但是在进一步作全零分析时,信号应有正确的时间起点且不得有线性相位分量,而同态解卷积把信号分解为最小和最大相位序列恰能满足此条件。这样,先作同态解卷积,再作线性预测和逆滤波,便可达到极-零分析的目的。第章同态滤波 图 8.22同态预测极-零模型分析(左边为时域波形或混响波,右边为对应的对数幅度谱)