第4章矢量量化课件.ppt_163文库

资源描述

1、2/7/20231第四章第四章语音信号的矢量量化语音信号的矢量量化4.1 概述概述4.2 矢量量化的基本原理矢量量化的基本原理4.3 失真测度失真测度4.4 最佳矢量量化器和码本的设计最佳矢量量化器和码本的设计4.5 降低复杂度的矢量量化系统降低复杂度的矢量量化系统4.6 语音参数的矢量量化语音参数的矢量量化4.7 人工神经网络与人工神经网络与VQ4.8 遗传矢量量化遗传矢量量化2/7/202324.1 概述量化分为两大类量化分为两大类：一类是标量量化，另一类：一类是标量量化，另一类是矢量量化。是矢量量化。标量量化标量量化:用若干个离散的数字值来表示每用若干个离散的数字值来表示每一个幅度具有

2、连续取值一个幅度具有连续取值(模拟值模拟值)的离散时域的离散时域信号信号(采样信号采样信号)。2/7/20233矢量量化的定义矢量量化的定义：矢量量化：矢量量化(Vector Quantization)是将若干个取样信号分是将若干个取样信号分成一组，即构成一个矢量，然后对此矢成一组，即构成一个矢量，然后对此矢量一次进行量化。量一次进行量化。将某一范围内的矢量将某一范围内的矢量归为某一类，即所谓的矢量量化归为某一类，即所谓的矢量量化2/7/20234 矢量量化研究的基础是信息论的一个分支：矢量量化研究的基础是信息论的一个分支：“率率畸变畸变理论理论”，其中有两项理论研究成果对于矢量量化算法的发，

3、其中有两项理论研究成果对于矢量量化算法的发展起关键作用。展起关键作用。第一，该理论指出，对于一定的量化速率第一，该理论指出，对于一定的量化速率R(以每个采样信号以每个采样信号平均所用的量化比持数衡量，用比特采样表示平均所用的量化比持数衡量，用比特采样表示)，量化，量化畸变畸变D(以量化信号与原信号之间的误差均方值和原信号以量化信号与原信号之间的误差均方值和原信号均方值之比来衡量均方值之比来衡量)是一定的。是一定的。第二，无论对于何种信息源，即使是无记忆的信息源第二，无论对于何种信息源，即使是无记忆的信息源(即各即各个采样信号之间相互统计独立的情况个采样信号之间相互统计独立的情况)，矢量量化总是

4、优，矢量量化总是优于标量量化，且矢量维数越大优度越高。于标量量化，且矢量维数越大优度越高。2/7/20235矢量量化的应用矢量量化的应用：进入进入80年代以后，矢量量化年代以后，矢量量化技术引入语音处理领域，使之又有长足的进步。技术引入语音处理领域，使之又有长足的进步。目前这项技术已经用于语音波形编码，线性预测目前这项技术已经用于语音波形编码，线性预测编码、编码、语音识别与合成、图像压缩等语音识别与合成、图像压缩等。矢量量化的研究目的：矢量量化的研究目的：针对待定的信息源和矢量针对待定的信息源和矢量维数，找到一种最优的矢量量化器，它能够在维数，找到一种最优的矢量量化器，它能够在R一定时给出最低

5、的畸变。一定时给出最低的畸变。2/7/20236上图的两维矢量空间里，存在上图的两维矢量空间里，存在6类矢量，每一类都有类矢量，每一类都有一个中心，一个中心，称为室心称为室心，每一室心对应一个码，每一室心对应一个码字矢量字矢量。从量上来表征第从量上来表征第i类矢量。类矢量。集合集合称为码本。称为码本。xyV1V2V3V4V5V6V11,yx22,yx图图4.1iiYX,iViV iV什么是矢量量化什么是矢量量化(VQ)2/7/20237任意一个矢量任意一个矢量V应该归为哪一类，要看它是应该归为哪一类，要看它是“靠近靠近”哪一类矢量，或者说它离哪一个室心最哪一类矢量，或者说它离哪一个室心最

6、“近近”。例如上图中虚线画出的矢量例如上图中虚线画出的矢量V最靠近最靠近V1，则将其规，则将其规定为定为V1类，并用类，并用V1表示表示V，或者说，或者说V被量化为被量化为V1。这样作可以把本来无限多的矢量只用有限个码字矢这样作可以把本来无限多的矢量只用有限个码字矢量来表示量来表示(此处为此处为6个个)。假如码本中的码字矢量是。假如码本中的码字矢量是有序的，则被量化的矢量可用码字序号来表示。因有序的，则被量化的矢量可用码字序号来表示。因此，可以大大压缩信息量。此，可以大大压缩信息量。2/7/202384.2 4.2 矢量量化的基本原理矢量量化的基本原理矢量量化的过程是矢量量化的过程是：将语音

7、信号波形的：将语音信号波形的A个样点个样点的每一帧，或有的每一帧，或有k个参数的每一参数帧，构成个参数的每一参数帧，构成k维空间中的一个矢量，然后对这个矢量进行量化。维空间中的一个矢量，然后对这个矢量进行量化。标量量化和矢量量化的区别标量量化和矢量量化的区别：在标量量化时，在：在标量量化时，在一维的零至无穷大值之间设置若干个量化阶梯，一维的零至无穷大值之间设置若干个量化阶梯，当某输入信号的幅度值落在某相邻的两个量化阶当某输入信号的幅度值落在某相邻的两个量化阶梯之间时，就被量化为两阶梯的中心值。而在矢梯之间时，就被量化为两阶梯的中心值。而在矢量量化时，则将量量化时，则将A维无限空间划分为维无限空

8、间划分为M个区域边个区域边界，然后将输入矢量与这些边界进行比较，并被界，然后将输入矢量与这些边界进行比较，并被量化为量化为“距离距离”最小的区域边界的中心矢量值。最小的区域边界的中心矢量值。2/7/20239下面以K=2为例进行说明。2/7/202310相关概念相关概念：若要对一个矢量：若要对一个矢量X进行量化，首先要选择一进行量化，首先要选择一个合适的个合适的失真测度失真测度，而后用最小失真原理，分别计算用，而后用最小失真原理，分别计算用量化矢量量化矢量Yi替代替代x所带来的失真。其中最小失真值所对所带来的失真。其中最小失真值所对应的那个量化矢量，就是矢量应的那个量化矢量，就是矢量X的的重构

9、矢量重构矢量(或称或称恢复矢恢复矢量量)。通常把所有。通常把所有M个量化矢量构成的集合个量化矢量构成的集合Yi称为称为码码书书或或码本码本(Codebook)。把码书中的每个量化矢量。把码书中的每个量化矢量Yi(i=1，2，M)称为称为码字码字或或码矢码矢。不同的划分或。不同的划分或不同的量化矢量选取就可以构成不同的不同的量化矢量选取就可以构成不同的矢量量化器矢量量化器。2/7/202311矢量量化系统的组成：iXmin(,)ijdX YminjjY0,1,1jMminjY输入矢量计算最小距离找到相应的角标信道或存储器从码本中找出维重构矢量码本minjminjk失真测度公式jY0,1,1jMj

10、Y码本矢量量化系统的组成框图2/7/202312矢量量化的特点：矢量量化的特点：矢量量化的两个问题矢量量化的两个问题：有高度保密的优良性能；用于传输时，其传输速率有高度保密的优良性能；用于传输时，其传输速率可以进一步降低；稳定性能好。可以进一步降低；稳定性能好。如何划分如何划分M个区域边界个区域边界。这个过程称为这个过程称为“训练训练”或建立码书，方法是：或建立码书，方法是：将大量的欲处理的信号的波形帧矢量或参数帧矢量将大量的欲处理的信号的波形帧矢量或参数帧矢量进行统计划分，进一步确定这些划分边界的中心矢进行统计划分，进一步确定这些划分边界的中心矢量值来得到码书。量值来得到码书。如何确定两矢量

11、在进行比较时的测度如何确定两矢量在进行比较时的测度。这个测度就是两矢量之间的距离，或以其中某这个测度就是两矢量之间的距离，或以其中某一矢量为基准时的失真度。它描述了当输入矢量用一矢量为基准时的失真度。它描述了当输入矢量用码书所对应的矢量来表征时所应付出的代价。码书所对应的矢量来表征时所应付出的代价。2/7/202313选择了失真测度以后，就可以进行矢量量化器的设计了。矢量量化器最佳设计的两个条件是：1)对给定的码本 ,MYM(为码本尺寸），在矢量空间X中，找出所有码本矢量的最佳区域边界(1,2,)iS iM使平均失真最小。1.2)对给定的区域边界iS，找出最佳码本矢量(1,2,)ikY iM使

12、平均失真最小，也就是得到码本MY。2/7/202314矢量量化器的性能指标：矢量量化器的性能指标：码书大小码书大小M M、平均信噪比。、平均信噪比。矢量量化器的设计：矢量量化器的设计：平均信噪比：平均信噪比：定义为定义为方括方括号中的分子是一秒内信号矢量的平均能量，而分母号中的分子是一秒内信号矢量的平均能量，而分母是一秒内输入信号矢量与码书矢量之间的平均失真是一秒内输入信号矢量与码书矢量之间的平均失真(即量化噪声即量化噪声)。从大量信号样本中训练出好的码书，从实际效果出从大量信号样本中训练出好的码书，从实际效果出发寻找到好的失真测度定义公式，设计出最佳的矢发寻找到好的失真测度定义公式，设计出

13、最佳的矢量量化系统，以便用最少的搜索和计算失真的运算量量化系统，以便用最少的搜索和计算失真的运算量，来实现最大可能的平均信噪比。量，来实现最大可能的平均信噪比。2/7/2023154.3 失真测度失真的定义：失真的定义：失真测度必须具备的特性：失真测度必须具备的特性：将输入信号矢量用码书的重构矢量来表征时的将输入信号矢量用码书的重构矢量来表征时的误差或所付出的代价。误差或所付出的代价。必须在主观评价上有意义，即小的失真应该对应必须在主观评价上有意义，即小的失真应该对应于好的主观语音质量。于好的主观语音质量。必须是易于处理的，即在数学上易于实现，这样必须是易于处理的，即在数学上易于实现，这样可

14、以用于实际的矢量量化器的设计。可以用于实际的矢量量化器的设计。平均失真存在并且可以计算。平均失真存在并且可以计算。2/7/202316失真测度的方法：均方误差均方误差(即欧氏距离即欧氏距离)、加权的均方误差、加权的均方误差、ItakuraSaito（板仓（板仓-斋藤）斋藤）距离，似然比失距离，似然比失真测度等。真测度等。2/7/2023174.3.1 欧氏距离均方误差设输入信号的某个设输入信号的某个k维矢量维矢量X，与码书中某个，与码书中某个k维维矢量矢量Y进行比较，进行比较，xi、yi分别表示分别表示X和和Y的元素的元素(1ik)，则定义均方误差为欧氏距离，即有，则定义均方误差为欧氏距离，

15、即有 2/7/202318几种其他常用的欧氏距离几种其他常用的欧氏距离：2/7/2023194.3.2 线性预测失真测度直接用由线性预测系数所描述的信号模型的功直接用由线性预测系数所描述的信号模型的功率谱来进行比较，采用板仓率谱来进行比较，采用板仓斋藤斋藤(ItakuraSaito)距离，简称距离，简称IS距离。距离。但是，这两种失真测度也有其局限性，它们都但是，这两种失真测度也有其局限性，它们都仅仅比较了两矢量的功率谱，而没有考虑其能量信仅仅比较了两矢量的功率谱，而没有考虑其能量信息。息。2/7/2023204.3.3 识别失真测度 2/7/2023214 4.4最佳矢量量化器和码本的设计

16、最佳矢量量化器和码本的设计4.4.1 .4.1 矢量量化器最佳设计的两个条件矢量量化器最佳设计的两个条件定义定义：所谓最佳设计，就是使失真最小。：所谓最佳设计，就是使失真最小。由于码书就是在这个设计过程中产生的，由于码书就是在这个设计过程中产生的，所以这也就是码书的设计过程。所以这也就是码书的设计过程。重要问题重要问题：划分量化区间和确定量化矢量。：划分量化区间和确定量化矢量。2/7/2023221最佳划分最佳划分对给定的码书对给定的码书yM=Y1,Y2,.,YM（M为码书的为码书的尺寸），找出所有码书矢量的最佳区域边界尺寸），找出所有码书矢量的最佳区域边界Si(i=1,2,.,M)，以使

17、平均失真最小，即寻找最佳划，以使平均失真最小，即寻找最佳划分。由于码书已给定，因此可以用最近邻近准则分。由于码书已给定，因此可以用最近邻近准则NNR(Nearest Neighbor Rule)得到最佳划分。得到最佳划分。这个条件实际上是叙述了最佳矢量量化器的设这个条件实际上是叙述了最佳矢量量化器的设计。由于给定码书共有计。由于给定码书共有M个码字，所以可以把矢个码字，所以可以把矢量空间分成量空间分成M个区间个区间Si(i=1,2,.,M)。这些。这些Si称为胞称为胞腔。腔。2/7/202323下图给出了下图给出了K=2的最佳划分示意图。的最佳划分示意图。2/7/2023242最佳码书对于给

18、定的区域边界对于给定的区域边界Si，找出最佳码书矢量，找出最佳码书矢量，使码书的平均失真最小，也就是得到码书使码书的平均失真最小，也就是得到码书yM。这里，。这里，使平均失真最小，码字使平均失真最小，码字Yi必须为给定的必须为给定的Si(i=1,2,.,M)的形心。形心就是该区域空间的几何中心。这些形的形心。形心就是该区域空间的几何中心。这些形心就组成了最佳码书中的码字。这个条件实际上叙心就组成了最佳码书中的码字。这个条件实际上叙述了码书的设计方法。述了码书的设计方法。2/7/2023254.4.2 LBG算法 2/7/2023264.4.3 初始码书的生成 1随机选取法随机选取法定义定义：从

19、训练序列中随机地选取：从训练序列中随机地选取M M个矢量作为初个矢量作为初始码字，从而构成初始码书，就是随机选取法。始码字，从而构成初始码书，就是随机选取法。优点优点：不用初始化计算，从而可大大减少计算：不用初始化计算，从而可大大减少计算时间时间缺点缺点：可能会选到一些非典型的矢量作为码字，：可能会选到一些非典型的矢量作为码字，即被选中的码字在训练序列中的分布不均匀。这即被选中的码字在训练序列中的分布不均匀。这样码字就没有代表性，导致码书中有限个码字得样码字就没有代表性，导致码书中有限个码字得不到充分利用，使矢量量化器的性能变差。不到充分利用，使矢量量化器的性能变差。这种这种方法带有一定的方法

20、带有一定的“盲目性盲目性”。2/7/2023272分裂法方法原理方法原理：先认为码书尺寸为先认为码书尺寸为M=1，即初始码书中只包含，即初始码书中只包含一个码字。计算所有训练序列的形心，将此形心作为第一个码字。计算所有训练序列的形心，将此形心作为第一个码字（一个码字（i=0）。然后，将它分裂为）。然后，将它分裂为此时此时码书中包含有两个元素，一个是码书中包含有两个元素，一个是i=0，另一个是，另一个是i=1；并按并按M=2用训练序列对它设计出用训练序列对它设计出M=2的码书。接着，的码书。接着，再分别将此码书的两个码字一分为二，这时码书中就有再分别将此码书的两个码字一分为二，这时码书中就有

21、了了4个码字。这个过程重复下去，经过个码字。这个过程重复下去，经过log2M次设计，次设计，就得到所要求的有就得到所要求的有M个码字的初始码书。个码字的初始码书。特点特点：初始码书性能较好，以此码书设计的矢量量化：初始码书性能较好，以此码书设计的矢量量化器性能也较好；但是随着码书中码字的增加，计算量也器性能也较好；但是随着码书中码字的增加，计算量也迅速增加。迅速增加。)1()2(MMYY2/7/2023283乘积码书法这种码书初始化的方法，是用若干个低维数的这种码书初始化的方法，是用若干个低维数的码书作为乘积码，求得所需的高维数的码书。比如码书作为乘积码，求得所需的高维数的码书。比如说，要设

22、计一个高维数的码书，可简单地用说，要设计一个高维数的码书，可简单地用2个低维个低维数的码书作乘积来获得。即维数为数的码书作乘积来获得。即维数为k1，大小为，大小为M1的的码书乘以维数为码书乘以维数为k-k1，大小为，大小为M2的码书，得到一个的码书，得到一个k维码书，其大小为维码书，其大小为M=M1M2。2/7/2023294 4.5 降低复杂度的矢量量化系统降低复杂度的矢量量化系统方法分类方法分类：无记忆的矢量量化、有记忆无记忆的矢量量化、有记忆的矢量量化器。的矢量量化器。4.5.1 4.5.1 无记忆的矢量量化系统无记忆的矢量量化系统1 1树形搜索的矢量量化系统树形搜索的矢量量化系统分

23、类：二叉树、多叉树。分类：二叉树、多叉树。2/7/202330如图：码本尺寸如图：码本尺寸M=8的二叉树，它的码本中共包含的二叉树，它的码本中共包含有有14个码字。输入信号矢量为个码字。输入信号矢量为X，先与，先与Y0与与Yl比较，比较，计算出失真计算出失真d(X，Y0)和和d(X，Y1)。如果后者较小，。如果后者较小，则走下面支路，同时送则走下面支路，同时送“1”输出。类似地，如果最输出。类似地，如果最后到达后到达Yl0l，则送出的输出角标就是，则送出的输出角标就是101。这个过程。这个过程也就是矢量量化的过程。也就是矢量量化的过程。2/7/202331优点优点：可以减少运算量。：可以减少运

24、算量。缺点缺点：存储容量增大且性能会有所降低。：存储容量增大且性能会有所降低。2/7/2023322多级矢量量化系统 2/7/2023332/7/2023344.5.2 有记忆的矢量量化系统概念概念：有记忆的矢量量化在量化每一个输入矢量时，：有记忆的矢量量化在量化每一个输入矢量时，不仅与此矢量本身有关，而且也与其前面的矢量有不仅与此矢量本身有关，而且也与其前面的矢量有关。也就在量化时，它通过关。也就在量化时，它通过“记忆记忆”，利用了过去，利用了过去输入矢量的信息，利用了矢量与矢量之间的相关性，输入矢量的信息，利用了矢量与矢量之间的相关性，从而提高了矢量量化的性能。从而提高了矢量量化的性能。

25、优点优点：在语音编码中，引入记忆后，还可利用音长：在语音编码中，引入记忆后，还可利用音长、短时的非平稳统计特性，清音、浊音和无声区域、短时的非平稳统计特性，清音、浊音和无声区域的特性，短时频谱特性等信息。意味着在相同维数的特性，短时频谱特性等信息。意味着在相同维数条件下大大提高了矢量量化系统的性能。条件下大大提高了矢量量化系统的性能。2/7/202335预测矢量量化（预测矢量量化（Predictive VQ），自适应矢量量化），自适应矢量量化（Adaptive VQ）,APVQ是它们的结合。下图是是它们的结合。下图是APVQ的系统框图。的系统框图。2/7/2023364.6 语音参数的矢量量化

26、语音参数矢量量化的定义语音参数矢量量化的定义：将语音信号经过分析，：将语音信号经过分析，得到各种参数，然后再将这些按帧或按段分析所得得到各种参数，然后再将这些按帧或按段分析所得的参数组构成矢量，进行矢量量化。的参数组构成矢量，进行矢量量化。语音参数的矢量量化：是在生成码本的基础上，语音参数的矢量量化：是在生成码本的基础上，对作为矢量的语音参数序列进行编码的过程。对作为矢量的语音参数序列进行编码的过程。这个定义含有两个过程：这个定义含有两个过程：n先要生成码本，这是将语音参数序列作为矢量空间分先要生成码本，这是将语音参数序列作为矢量空间分类的形成码本的过程；类的形成码本的过程；n将语音参数序列

27、作为矢量，参照码本归类的过程；将语音参数序列作为矢量，参照码本归类的过程；2/7/202337举例分析矢量量化前，每秒矢量量化前，每秒44.4帧，用帧，用54bit量化量化(其中，十个其中，十个线性预测系数用线性预测系数用41 bit，基音周期用，基音周期用6bit，增益参数，增益参数5bit，清浊音判决用清浊音判决用1 bit，同步用，同步用1bit)。而在。而在VQ LPC声码器声码器中，线性预测系数是中，线性预测系数是Ai，基音周期是，基音周期是Bi，增益参数，增益参数Gi和浊清音识别参数和浊清音识别参数Vi。2/7/202338VQ LPC声码器特点声码器特点：对线性预测系数采用了：

28、对线性预测系数采用了矢量量化，而其余参数均采用差值标量量化。矢量量化，而其余参数均采用差值标量量化。编码速率明显地比原来的编码速率明显地比原来的LPC声码器低。声码器低。语音编码的目的语音编码的目的：力求用尽可能低的编码速率，：力求用尽可能低的编码速率，以传输尽可能高的语音质量以传输尽可能高的语音质量(尽可能地减小重尽可能地减小重建信号与原始信号之间的失真建信号与原始信号之间的失真)，而希望设备，而希望设备简单，成本尽可能低。简单，成本尽可能低。2/7/202339 采用与能量和增益无关的对数似然比失真测度采用与能量和增益无关的对数似然比失真测度作为作为VQ的距离测度。的距离测度。码书尺寸为码

29、书尺寸为1 024，即用，即用10bit来表示其角标。码来表示其角标。码书的产生是用书的产生是用10个人个人(其中其中7人为男子，人为男子，3人为女子人为女子)的的大约大约30分钟的随机对话的声音来进行训练产生的。分钟的随机对话的声音来进行训练产生的。并将训练序列分为浊音和清音两类。因此，对应的并将训练序列分为浊音和清音两类。因此，对应的码书也分为浊音码书和清音码书两类，都用码书也分为浊音码书和清音码书两类，都用LBG算算法训练。法训练。VQ LPC声码器的设计方法2/7/202340 由于采用了矢量量化，所以由于采用了矢量量化，所以VQ LPC声码器编码声码器编码速率明显降低了。在这种声码器

30、中，仅对线性预测速率明显降低了。在这种声码器中，仅对线性预测系数采用了矢量量化，对其他参数均采用差值标量系数采用了矢量量化，对其他参数均采用差值标量量化。这种混合编码方式是解决矢量量化系统复杂量化。这种混合编码方式是解决矢量量化系统复杂度过高的一个方法。度过高的一个方法。意义：2/7/2023414.7 人工神经网络与VQ人工神经网络的一项非常重要的功能是通过学习实现对于输入矢量的分类。即每输入一个矢量，人工神经网络输出一个该矢量所属类别的标号，从这一点看它与VQ的功能是十分相近的。人工神经网络与普通VQ不同而独具特色之处在于：（1）它是由大量神经元构成的并行分布处理系统来实现的，因此较之普通

31、VQ的串行搜索而言，它可以用并行搜索方法由输入矢量求得其输出标号。因此，它的运行速度比前者高得多。（2）人工神经网络依托于这套并行分布处理机构，可以建起高效的学习算法(与VQ码本的建立算法相对应，也可称之为训练算法)。2/7/202342学习算法可以分成无监督和有监督两大类。无监督学习算法又称为自组织学习算法，它对输人矢量所做的类别划分，无需依赖于外界事先已建立的对这些矢量类别的约定，从这点看自组织学习算法与普通VQ码本建立算法十分相似。有监督的学习算法则需在学习之前就建立训练矢量集合中各个矢量所属类别的约定，通过学习使神经网络能够完成这种约定；并且推而广之及于所有末参加训练的输人矢量。这样有

32、监督学习算法可以直接或间接地用于完成各种模式识别任务。（3）对于普通VQ，各个输出标号之间不存在空间关系上的关联(拓朴关系)。而对于像Kohonen自组织特征映射人工神经网络等类型的网络，各个输出之间存在空间拓扑关联。这对于进一步利用这些输出是很有价值的。2/7/202343有三种人工神经网络与这一章讨论的VQ有密切关系，它们是：(1)前向多层人工神经网络(采用有监督学习算法)；(2)ART(自适应谐振理论)人工神经网络(采用自组织学习算法)；(3)TKohonen自组织待征映射人工神经网络(自组织和有监督学习算法都被采用)。2/7/2023444.7.1 Kohon

33、en神经网络简介在对人类的神经系统及脑的研究中，人们发现：人脑的某些区域对某种信息或感觉敏感，如人脑的某一部分对视知觉的处理特别有效，而另一部分则对听知觉的处理特别有效。这种情况使人们对大脑的作用的整体性与局部性特征有所认识。对大脑的研究表明，大脑是由大量协同作用的神经元群体组成的。大脑的神经网络是一个十分复杂的反馈系统，在这个系统中含有各种反馈作用，有整体反馈，局部反馈；另外，还有化学交互作用。在大脑处理信息的过程中，聚类是其极其重要的功能。大脑通过聚类过程从而识别外界信号，并产生自组织过程。2/7/202345具有二维网格的自组织特征映射网络模型2/7/202346自组织特征映射神经网络学

34、习算法的步骤如下：采用随机扰动法生成一组初始权值:式中N为输入节点数，它对应着输入矢量的维数；M为输出节点的个数，同时将M个输出节点排列成二维阵列，每一个节点表示一个聚类中心。MjNiWij,2,1,2,1,(2)每次输入一个N维的训练矢量，采用欧几里德距离测度，计算各输入节点到每一输出节点j的距离：21)()(ttxdijNiij，Mj,2,1 2/7/202347(3)选择最佳匹配的输出节点。即选出最小对应的输出节点。(4)调整相邻近节点的权值：式中j是包含在内的与相邻的输出节点。(t)是一个大于0而小于1的增益函数，其值是随迭代次数逐渐递减的。以节点为中心的邻近区域的大小（以邻域

35、函数来表示）也是随迭代次数逐渐缩小的。jd*j*j(1)()()()()ijijiijW tW tt x tW t*j2/7/202348(5)其它神经元的权值保持不变，即：(6)如果已经达到预定的迭代次数，停止迭代，否则转向(2)继续迭代，或象矢量量化那样根据相对失真值观察收敛的情况，决定是否结束。)()1(tWtWijij2/7/2023494.7.2 二进树码本形成算法在二进树码本形成算法在kohonen神经网络中神经网络中的应用的应用2/7/2023502/7/2023512/7/2023522/7/2023532/7/2023544.8 遗传矢量量化（遗传矢量量化（GAVQ）算法）算

36、法求取VQ码本的传统的方法是LBG算法。但该算法是一种局部优化算法，得到的码本质量往往不高。本节采用的遗传矢量量化算法(Genetic Algorithms Vector Quantization，GAVQ)，是一种全局优化算法，将遗传算法的全局优化特性和VQ建模技术巧妙地结合起来，通过科学的编码方案及对初始群体中的VQ码本进行有效的遗传操作从而搜索出训练矢量空间中的全局优化VQ码本。2/7/2023554.8.1 遗传算法遗传算法遗传算法（Genetic Algorithm-GA）由美国J.Holland教授提出的，是模拟生物在自然环境中的遗传和进化过程而形成的一种自适应全局优化概率搜索算

37、法。它模拟物种从低级到高级的演化过程，从一个称之为群体的随机初始解的集合开始，采用优胜劣汰，适者生存的自然法则，通过对群体施加遗传操作实现群体内个体结构重组的迭代过程，每一次迭代获得一组解答，每个解答由一个适应度函数来评估，这一过程不断重复，直到达到某种形式上的收敛。2/7/202356遗传算法尤其适用于处理传统搜索方法难以解决的复杂和非线性问题，可以广泛用于组合优化、机器学习、自适应控制和人工生命等领域。而且，遗传算法作为一种新的全局优化搜索方法，具有简单通用、鲁棒性强、适于并行处理和应用广泛的优点，近些年得到了迅速的发展，已广泛用于最优控制、图像编码、发现博弈策略等许多实际问题的求解。它比

38、盲目的搜索效率高得多，又比专门针对特定问题的算法通用性强，是一种与问题无关的求解模式。2/7/202357遗传算法包括三个基本操作：选择、交叉和变异。1)选择选择运算又称为繁殖、再生或复制运算，用于生物界优胜劣汰的自然选择。它从第代种群中选择出优良的某些染色体，放入匹配池(缓冲区，match pool)，为染色体交叉和变异运算产生新种群做准备。适应度越高的染色体被选择的可能性越大，遗传基因在下一代种群中的分布就越广，其子孙在下一代出现的数量就越多。选择的方法有多种，较常用的是赌轮盘选择法，应用该方法个体被选中并遗传到下一代群体中的概率与该个体的适应度大小成正比。2/7/2023582)交叉将群

39、体内的各个个体随机搭配成对，对每一个个体，以某个概率交换它们之间的部分染色体，这样可以创造出新的个体。3)变异变异运算模拟生物在自然的遗传环境中由于各种偶然因素引起的基因突变，它以某一概率随机地改变遗传基因(表示染色体的符号串的某一位)的值。它随机地将染色体的某一个基因由1变成0，或由0变成1。若只有选择和交叉，而没有变异操作，则无法在初始基因组合以外的空间进行搜索，使进化过程在早期就陷入局部解而中止进化，从而使解的质量受到限制。通过变异操作，可确保种群中遗传基因类型的多样性，以便搜索能在尽可能大的空间中进行，避免丢失有用的遗传信息而陷入局部解，获得质量较高的优化解。2/7/202359遗传算

40、法的步骤如下：第1步：初始化。设置进化代数计数器，设置最大进化代数，随机产生初始种群，个体数目一定，每个个体表示为染色体的基因编码；第2步：个体评价。计算群体中个体的适应度，并判断是否符合优化准则，若符合，输出最佳个体及其代表的最优解，结束计算，否则转向第3步；第3步：选择运算。依据适应度选择再生个体，适应度高的个体被选中的概率高，适应度低的个体可能被淘汰；2/7/202360第4步：交叉运算。按照一定的交叉概率和交叉方法，生成新的个体；第5步：变异运算。按照一定的变异概率和变异方法，生成新的个体；第6步：终止条件判断。若，则，转到第2步；若，则以进化过程中所得到的具有最大适应度的个体作为最优

41、解输出，终止计算。2/7/2023614.8.2 遗传矢量量化遗传矢量量化其原理如下图所示：训练语音矢量集编码和初始码本生成初始码本下代码本选择评价交叉变异码本输出基于遗传算法的矢量量化器框图2/7/202362遗传算法不能直接处理解空间中的解数据，必须通过编码将它们表示成遗传空间的基因型串结构数据。能否将GA应用于VQ码本的优化设计的关键在于能否将VQ码本的数据结构映射成能用GA进行处理的染色体结构。然后利用特定问题解空间的先验知识来缩小遗传算法的搜索空间，选择一种简便有效的编码方案。2/7/202363具体做法是：让遗传空间的染色体的每一个基因直接对应VQ码本中的每一个码字矢量。这样染色体

42、的长度（即基因个数）就等于码本的大小，这样一个VQ码本就对应一个个体。遗传算法直接对码本群体中的不同码本进行选择、交叉、变异等遗传操作。GAVQ算法中的每个个体均为VQ码本，因此：个体的适应度函数可以定义为训练矢量序列对该个体(即码本)的平均量化失真的倒数，即：2/7/2023641011min(,)MNjY Yjfd XYN为了能够对遗传操作的过程进行动态调节，并防止算法出现未成熟收敛，还可以对适应度函数进行动态定标。可以采用幂定标的方式，定标后的适应度函数为：,int(1/100)iffit式中，t为遗传操作的代数，int()为取整函数。2/7/202365由于遗传算法的全局优化特性，因而如何选择初始码字不会影响优化结果，所以，初始码本集中的各个码本可以随机地产生，但采用适当的非随机方法产生初始集可以缩短遗传算法的优化时间。可以采用的方法是进行多次随机初始码字的标准LBG迭代，所得结果可作为初始码本。同时当LBG算法产生的个体数量未达到群体规模时，用交叉的方法产生新的个体来补足。

展开阅读全文