1、优秀课件,精彩无限!1第四章 短时傅立叶分析短时傅立叶变换的定义短时傅立叶变换的某些性质短时傅立叶变换的线性滤波实现短时傅立叶谱的取样语音的短时合成技术短时分析合成数字滤波器组的设计用快速傅立叶变换进行短时傅立叶分析优秀课件,精彩无限!24.1 短时傅立叶变换-概述优秀课件,精彩无限!34.2.1 短时傅立叶变换-定义o 定义:短时傅立叶变换也叫短时谱(加窗的方式)o 短时谱的特点:1)时变性:既是角频率的函数又是时间n的函数2)周期性:是关于的周期函数,周期为2mmjjnemnwmxeX)()()(短时傅立叶变换主要用于语音分析合成系统,由其逆变换可以精确地恢复语音波形;优秀课件,精彩无限!
2、4o 短时傅里叶变换是窗选语音信号的标准傅里叶变换。下短时傅里叶变换是窗选语音信号的标准傅里叶变换。下标标n区别于标准的傅里叶变换。区别于标准的傅里叶变换。w(n-m)是窗口函数序是窗口函数序列。不同的窗口函数序列,将得到不同的傅里叶变换的列。不同的窗口函数序列,将得到不同的傅里叶变换的结果。结果。o 短时傅里叶变换有两个自变量:短时傅里叶变换有两个自变量:n和和,所以它既是关,所以它既是关于时间于时间n的离散函数,又是关于角频率的离散函数,又是关于角频率的连续函数。的连续函数。o 与离散傅里叶变换和连续傅里叶变换的关系一样,若令与离散傅里叶变换和连续傅里叶变换的关系一样,若令2k/N,则得离
3、散的短时傅里叶变换,则得离散的短时傅里叶变换,它实际上是它实际上是在频域的取样。在频域的取样。10)()()()(22NkemnwmxkXeXNmkjmnNkjn4.2.1 短时傅立叶变换-定义优秀课件,精彩无限!5o 这两个公式都有两种解释:n 当当n固定不变时,它们是序列固定不变时,它们是序列w(n-m)x(m)(-m)的标准傅里叶变换或标准的离散傅的标准傅里叶变换或标准的离散傅里叶变换。此时与标准傅里叶变换具有相同的性质,里叶变换。此时与标准傅里叶变换具有相同的性质,而而Xn(k)与标准的离散傅里叶变换具有相同的特性。与标准的离散傅里叶变换具有相同的特性。n 当当或或k固定时,和固定时,
4、和Xn(k)看做是时间看做是时间n的函数。的函数。它们是信号序列和窗口函数序列的卷积,此时窗口它们是信号序列和窗口函数序列的卷积,此时窗口的作用相当于一个滤波器的作用相当于一个滤波器。4.2.1 短时傅立叶变换-定义优秀课件,精彩无限!64.2.1 短时傅立叶变换-定义o 频率分辨率f、取样周期T、加窗宽度N三者关系:o 窗形状对短时傅立叶变换的影响 矩形窗主瓣窄,衰减慢;汉明窗主瓣宽,衰减快;o 窗宽对短时频谱的影响 窗宽长频率分辨率高,能看到频谱快变化;窗宽短频率分辨率低,看不到频谱的快变化;1fNT 优秀课件,精彩无限!74.2.2 短时傅立叶变换-标准傅里叶变换的解释o 短时傅里叶变换
5、可写为o 当n取不同值时窗w(n-m)沿着x(m)序列滑动,所以w(n-m)是一个“滑动的”窗口。o 由于窗口是有限长度的,满足绝对可和条件,所以这个变换是存在的。与序列的傅里叶变换相同,短时傅里叶变换随着作周期变化,周期为2。mjmjnemnwmxeX)()()(优秀课件,精彩无限!84.2.2 短时傅立叶变换-标准傅里叶变换的解释优秀课件,精彩无限!9o 根据功率谱定义,可以写出短时功率谱与短时傅里叶变换之间的关系o 式中*表示复共轭运算。同时功率谱是短时自相关函数 的傅里叶变换。o 下面将短时傅里叶变换写为另一种形式。设信号序列和窗口序列的标准傅里叶变换为 均存在。当n取固定值时,w(n
6、-m)的傅里叶变换为 2*|)(|)()()(jnjnjnjneXeXeXeS)()()()()(kmxmknwmxmnwkRmnmjmjemxeX)()(mjmjemweW)()()()(jnjmjmeWeemnw4.2.2 短时傅立叶变换-标准傅里叶变换的解释优秀课件,精彩无限!104.2.2 短时傅立叶变换-标准傅里叶变换的解释o 根据傅里叶变换的频域卷积定理,有()1()()()21()()2jjj njnj njjXeX eeW eeW eX ed)(*)()(jnjjjneWeeXeXdeXeWeeXjjnjjn)()(21)()(优秀课件,精彩无限!11o 用波形乘以窗函数,不仅
7、为了在窗口边缘两端不引起急剧变化,使波形缓慢降为零,而且还相当于对信号谱与窗函数的傅里叶变换进行卷积。o 为此窗函数应具有如下特性:窗函数应具有如下特性:n 频率分辨率高,即主瓣狭窄、尖锐;(矩形窗)(矩形窗)n 通过卷积,在其他频率成分产生的频谱泄漏少,即旁瓣衰减大。(海明窗)(海明窗)n这两个要求实际上相互矛盾,不能同时满足。o 窗口宽度N、取样周期T和频率分辨率f之间存在下列关系f1/NT o 可见:n窗口宽度频率分辨率 时间分辨率n窗口宽度频率分辨率 时间分辨率,因而二者是矛盾的。4.2.2 短时傅立叶变换-标准傅里叶变换的解释优秀课件,精彩无限!124.2.2 短时傅立叶变换-标准傅
8、里叶变换的解释2/)1(10)2/sin()2/sin()(NjNnnjjeNeeWotherwiseNnnw,010,1)(优秀课件,精彩无限!13o 第一个零点位置为第一个零点位置为2/N,显然它与窗口宽度成反比。,显然它与窗口宽度成反比。n矩形窗矩形窗,虽然频率分辨率很高,但由于第一旁瓣的衰减只有13.2dB,所以不适合用于频谱成分动态范围很宽的语音分析中。n海明窗海明窗在频率范围中的分辨率较高,而且由于旁瓣的衰减大于42dB,具有频谱泄漏少的优点,频谱中高频分量弱、波动小,因而得到较平滑的谱。n汉宁窗汉宁窗是高次旁瓣低,第一旁瓣衰减只有30dB。o 对语音波形乘以海明窗,压缩了接近窗两
9、端的部分波形,等效于用作分析的区间缩短40%左右,因此,频率分辨率下降40%左右。所以,即使在基音周期性明显的浊音频谱分析中,乘以合适的窗函数,也能抑制基音周期与分析区间的相对相位关系的变动影响,从而得到稳定的频谱。因为乘以窗函数将导致分帧区间缩短,所以为跟踪随时间变化的频谱,要求一部分区间重复移动。4.2.2 短时傅立叶变换-标准傅里叶变换的解释优秀课件,精彩无限!144.2.2 短时傅立叶变换-标准傅里叶变换的解释优秀课件,精彩无限!15o其中图(a)是海明窗的窗选信号,图(b)是其对数功率谱;图(c)是矩形窗下的窗选信号,图(d)是其对数功率谱。o从图(a)可以明显看出时间波形的周期性,
10、此周期性同样在图(b)中表现出来。图中基频及其谐波在频谱中表现为等频率间隔的窄峰。图(b)中的频谱大约在300400Hz附近有较强的第一共振峰,而约在2000Hz附近有一个对应于第二、三共振峰的宽峰。此外,还能在3 800Hz附近看到第四个共振峰。最后,由于声门脉冲谱的高频衰减特性,频谱在高频部分表现出下降的趋势。给出了N500时(取样率10 kHz,窗持续时间50 ms)时直角窗及海明窗下浊音语音的频谱。4.2.2 短时傅立叶变换-标准傅里叶变换的解释优秀课件,精彩无限!16o将图(b)和图(d)比较可看出它们在基音谐波、共振峰结构以及频谱粗略形状上的相似性,同样也能看到其频谱之间的差别。o
11、最明显的是图(d)中基音谐波尖锐度增加,这主要是由于矩形窗频率分辨率较高。o另一差别是矩形窗较高的旁瓣产生了一个类似于噪声的频谱。这是由于相邻谐波的旁瓣在谐波间隔内的相互作用(有时加强有时抵消),因而在谐波间产生了随机变化。这种相邻谐波间不希望有的“泄漏”抵消了其主瓣较窄的优点,o因此在语音频谱分析中极少采用矩形窗。给出了N500时(取样率10 kHz,窗持续时间50 ms)时直角窗及海明窗下浊音语音的频谱。4.2.2 短时傅立叶变换-标准傅里叶变换的解释优秀课件,精彩无限!17o图4-3给出了N50的比较结果(取样率与图4-2中相同,因而窗口持续时间为5ms)。o由于窗口很短,因而时间序列(
12、图(a)和(c)及信号频谱(图(b)和(d)均不能反映信号的周期性。o与图4-2相反,图4-3只大约在400、1 400及2 200Hz频率上有少量较宽的峰值。它们与窗内语音段的前三个共振峰相对应。比较图4-3(b)及(d)的频谱后,再次表明矩形窗可以得到较高的频率分辨率。4.2.2 短时傅立叶变换-标准傅里叶变换的解释优秀课件,精彩无限!18o 结论结论:n 窗口宽度与短时傅里叶变换特性之间的关系窗口宽度与短时傅里叶变换特性之间的关系o 用窄窗可得到好的时间分辨率用窄窗可得到好的时间分辨率o 用宽窗可以得到好的频率分辨率。用宽窗可以得到好的频率分辨率。o 但由于采用窗的目的是要限制分析的时间
13、以但由于采用窗的目的是要限制分析的时间以使其中波形的特性没有显著变化,因而要折使其中波形的特性没有显著变化,因而要折衷考虑。衷考虑。4.2.2 短时傅立叶变换-标准傅里叶变换的解释优秀课件,精彩无限!19o w(n)-一个滤波器的单位函数响应o -该滤波器的输出o x(n)-滤波器的输入o 过程:调制+滤波4.2.3 短时傅立叶变换-滤波器的解释一mmjjnmnwemxeX)()()()(jneX图4-4 短时傅里叶变换滤波器解释的第一种形式(a)复数运算优秀课件,精彩无限!204.2.3 短时傅立叶变换-滤波器的解释一mnmnnnjnmmjjnmnmwmxbmnmwmxajbaeXemxmn
14、weX)(sin)()()(cos)()()()()()()()(用线性滤波实现短时傅立叶变换的第一种形式优秀课件,精彩无限!214.2.3 短时傅立叶变换-滤波器的解释二)()(|)(|)()(nnjjnjnjbaeeXeXn图4-4 短时傅里叶变换滤波器解释的第一种形式(b)只有实数运算优秀课件,精彩无限!22 w(n)()jnXej ne()()kjX e()jX e()kjnx n e()x n()x n()()()()kkjjjnX eX eW e w(nw(n)是窄带低通滤波器是窄带低通滤波器k假设假设 将将x(nx(n)的频谱向左搬的频谱向左搬移了移了 ,或等效将,或等效将 频率
15、频率上的频谱搬移到了零频率上的频谱搬移到了零频率处。因此为使输出端有:处。因此为使输出端有:k()()kkjjnXeX ew(nw(n)是窄带低通滤波器是窄带低通滤波器k优秀课件,精彩无限!23k()jX e()jW e()()kjX e()()kkjjnXeX e优秀课件,精彩无限!24()()()()()()()()()*()jjmnmjnmmjnjmjwmjnmXew nm x m ew mx nm eex nm w m ex nw n ee令令mnm 令令mm()jnXej ne()x n()jnw n e2.2.实数运算实现短时谱的线性滤波表示实数运算实现短时谱的线性滤波表示窄带带通
16、滤波器窄带带通滤波器()jnw n e()()jW e()w n()jW e优秀课件,精彩无限!25()nacosn sinn()nb()x m()cosw mm()sinw mm()na()nbcosn 实数运算实现短时谱的线性滤波表示实数运算实现短时谱的线性滤波表示2222|()|()()()()jnnnnnX eabab优秀课件,精彩无限!26o 为窄带低通滤波器。第一种形式为低通滤波器;o 由于第二种形式中的滤波器单位函数响应为 ,所以它为带通滤波器。4.2.3 短时傅立叶变换-滤波器的解释)(jeW)(njenw优秀课件,精彩无限!27o 如果将w(n)的滤波运算除外,短时傅里叶变换
17、实际上是对信号的幅度调制。n第一种形式是在输入端进行调制,x(n)乘以 相当于将x(n)的频谱从移到零频处;而w(n)(直角窗或海明窗等)为窄带低通滤波器。n后一种形式是在输出端进行调制,此时先对信号进行带通滤波,滤波器的单位函数响应为w(n),而调制后输出的是中心频率为的短时谱。4.2.3 短时傅立叶变换-滤波器的解释2/1222/122)()(|)(|)(|)()(|)(|nnjnnjjnnnjnbaeXeeXbaeXnjenje优秀课件,精彩无限!28o 恢复出x(n)的过程称为短时傅里叶反变换,是由短时谱合成语音信号的问题o 由于 是n和的二维函数,因而必须对 在所涉及的两个变量,即时
18、域及频域内进行取样,取样率的选取应保证 不产生混叠失真,从而能够恢复原始语音信号x(n)。4.3 短时傅立叶变换的取样率)(jneX)(jneX)(jneX)(jneX优秀课件,精彩无限!29o 当当为固定值时为固定值时,是一个单位函数响应为w(n)的低通滤波器的输出。设低通滤波器的带宽为BHz,则 具有与窗相同的带宽。根据取样定理,的取样率至少为2B才不致混叠。o 低通滤波器的带宽由w(n)的傅里叶变换 的第一个零点位置01决定,因而B值取决于窗的形状与长度。4.3 短时傅立叶变换的取样率-时间取样率)(jneX)(jneX)(jneX)(jeW优秀课件,精彩无限!30o 正弦序列的表达式为
19、正弦序列的表达式为 n 幅值幅值A、初相、初相的含义与模拟正弦信号相同的含义与模拟正弦信号相同n 正弦序列的数字角频率正弦序列的数字角频率0的含义与一般模拟信号的含义与一般模拟信号模拟角频率模拟角频率0的概念不同。的概念不同。n 离散信号定义的时间为离散信号定义的时间为kT,显然有,显然有0=0 T,模拟角频率模拟角频率0的单位是的单位是rad/s,n 数字角频数字角频0的单位为的单位为rad/s s=rad。0表示表示相邻两个样值间弧度的变化量。相邻两个样值间弧度的变化量。4.3 短时傅立叶变换的取样率-时间取样率)sin()(0kAkf优秀课件,精彩无限!31o 以直角窗和海明窗为例,其第
20、一个零点位置分别为 2N和4No 数字角频率与模拟频率F之间的关系为2FT2Ffs(其中T是信号取样周期,fs是取样率),因而用模拟频率表示的 的带宽为4.3 短时傅立叶变换的取样率-时间取样率)(jeW优秀课件,精彩无限!32(2)()()jjnnXeXe()()jjmnnmXexme 每帧每帧 中语音信号个数为窗长中语音信号个数为窗长N N()nx m2,0,1,1()()kjjnnk kLLNLXeXe()nx m4.3 短时傅立叶变换的取样率-频率取样率优秀课件,精彩无限!334.3 短时傅立叶变换的取样率-总取样率优秀课件,精彩无限!344.3 短时傅立叶变换的取样率-总取样率优秀课
21、件,精彩无限!354.4语音信号的短时综合语音信号的短时综合-滤波器组求和法滤波器组求和法()()kjnX ex m 离散短时傅立叶反变换离散短时傅立叶反变换22,0,1,12()()()()()(,)kkjkjjNnnnk kNNkmjNmX eX eX ex m w n m eX n k 离散短时傅立叶变换离散短时傅立叶变换 离散短时傅立叶反变换离散短时傅立叶反变换1()()2(0)jjnnx nXeedw22101()()(0)NjkjknNNnky nXeeNw在什么条件下由在什么条件下由y(n)y(n)x(n)x(n)优秀课件,精彩无限!36一、滤波器组相加法一、滤波器组相加法()j
22、nXej ne()x n()jnw n e窄带带通滤波器窄带带通滤波器k假设假设()()kkjjnXeX e优秀课件,精彩无限!370()jnXe0jne()x n0()jnw n e1()jnXe1jne1()jnw n e1()NjnXe1Njne1()Njnw n e0()h n1()h n1()Nhn用带通滤波器组进行短时傅立叶分析用带通滤波器组进行短时傅立叶分析N N个中心频率处于个中心频率处于 的滤波器组成的滤波器组成的滤波器组的滤波器组2,(0,1,1)k kNN优秀课件,精彩无限!38221100221021()0210210(0)()()()()()()()()*()()*(
23、)()(kkNNjkjknjjnNNnnkkNjmkjknNNkmNjk n mNmkNjknNkNjknNkNwy nXeeXeex m w nm eex mw nm ex nw n ex nw ney nx n)210()NjknNkreNnrN()()(0)()rw nnrNwn优秀课件,精彩无限!390()jnXe0jne()x n0()jnw n e1()jnXe1jne1()jnw n e1()NjnXe1Njne1()Njnw n e0()h n1()h n1()Nhn0jne1jne1Njne(0)()Nwy n221100(0)()()()kkNNjkjknjjnNNnnkk
24、Nwy nXeeXee2.频域条件频域条件优秀课件,精彩无限!40()x n0()jnw n e1()jnw n e1()Njnw n e0()h n1()h n1()Nhn(0)()Nwy n0()y n1()y n1()Nyn()h n()x n(0)()Nwy n10()()Nkkh nhn11()00()()()(0)kNNjjjkkkH eHeW eNw(0)()()*()()(0)()Nwy nx nh nh nNwn优秀课件,精彩无限!4111()00()()()(0)kNNjjjkkkH eHeW eNw 2N4N6N2(1)NN0 0()jwW e(0)Nw优秀课件,精彩无限
25、!422,0,1,1()()kjjk kNNW eW e 由于由于 是宽度为是宽度为N N的有限时宽序列,而的有限时宽序列,而 的频率取样在的频率取样在 为为N N个。个。()w n()jW e0 22101()()kNjknjNkw nW eeN根据根据 的周期性,故:的周期性,故:()jW e()kjW e()()kjW e 1()01(0)()kNjkwW eN1()0()()(0)()(0)()kNjjkH eW eNwh nNwn()()*()()*(0)()(0)()y nx nh nx nNwnNwx n优秀课件,精彩无限!434.4 语音信号的短时综合-快速傅里叶变换求和法优秀
26、课件,精彩无限!444.4 语音信号的短时综合-快速傅里叶变换求和法优秀课件,精彩无限!454.4 语音信号的短时综合-快速傅里叶变换求和法优秀课件,精彩无限!464.4 语音信号的短时综合-快速傅里叶变换求和法优秀课件,精彩无限!474.4 语音信号的短时综合-快速傅里叶变换求和法优秀课件,精彩无限!48o 语音的时域分析和频域分析是语音分析的两种重要方法。n这两种方法均有局限性:n时域分析对语音信号的频率特性没有直观的了解;n频域特性中又没有语音信号随时间的变化关系。o 时间依赖于傅里叶分析的显示图形称为语谱图。n语谱图中显示了大量的与语音的语句特性有关的信息,它综合了频谱图和时域波形的优
27、点,明显地显示出语音频谱随时间的变化情况。4.5 语谱图优秀课件,精彩无限!49o语谱图实际上是一种动态的频谱。n语谱图的纵轴为频率,横轴为时间。任一给定频率成分在给定时刻的强弱用点的黑白度来表示,频谱值大则记录得浓黑一些,反之则浅淡一些。o用语谱图分析语音又称为语谱分析,记录语谱图的仪器就是语谱仪。n语谱仪实际上是使一个带通滤滤器的中心频率发生连续变化,来进行语音的频率分析。n带通滤波器有两种带宽:窄带为45 Hz,宽带为300 Hz。窄带语谱图有良好的频率分辨率及较差的时间分辨率;而宽带语谱图具有良好的时间分辨率及较差的频率分辨率。n窄带语谱图中的时间座标方向表示的是基音及其各次谐波;而宽
28、带语谱图给出语音的共振峰频率及清辅音的能量汇集区;这里,共振峰呈现为黑色的条纹。4.5 语谱图优秀课件,精彩无限!50o 所有元音的特征都是强度变化的规则的垂直条纹。n条纹的起点相当于声门脉冲的起点,条纹之间的距离表示基音周期。n条纹越密表示基音频率越高,例如“Ten”中的音;而基音周期在“the”字中e音时达到最大。4.5 语谱图优秀课件,精彩无限!51o声道的共振峰表示基音脉冲的某些频率成分被加强,这在语谱图上呈现为条纹区更宽更黑。n摩擦音如、呈现不规则的条纹,主要在2.5 kHz以上;这些条纹表示存在宽带噪声。“suburbs”开始的s音明显表示它有最大的能量和最高的频率成分,而结尾部分的的能量和频率仅次于s。4.5 语谱图优秀课件,精彩无限!52o 可用测量语谱图的方法来确定语音参数,例如共振峰频率及基频。o 语谱图的实际应用是用于确认出说话人的本性。语谱图上不同的黑白程度形成不同的纹路,称之为“声纹”,它因人而异。可利用声纹鉴别不同的讲话人。4.5 语谱图优秀课件,精彩无限!53作业o 加窗傅里叶变换:分别对加矩形窗和海明窗的信号做傅里叶变换(matlab程序,窗宽变换三次)o 用praat对语音信号进行分析o 用高通及低通滤波器对语音信号进行滤波,并分析输出信号与原信号的区别