1、1病理语音的特征及其提取与优化病理语音的特征及其提取与优化2汇报内容病理语音特征效果分析研究病理语音特征效果分析研究4引言引言1病理语音特征极其提取方法病理语音特征极其提取方法2基于分层递阶可视化的特征选择与融合方法基于分层递阶可视化的特征选择与融合方法3结论结论53汇报内容病理语音特征效果分析研究病理语音特征效果分析研究4引言引言1病理语音特征极其提取方法病理语音特征极其提取方法2基于分层递阶可视化的特征选择与融合方法基于分层递阶可视化的特征选择与融合方法3结论结论54引言引言n通过病理语音来诊断发音器官的病变,不仅是医学工作者积极探索的诊治方法,也是语音研究工作者的努力方向。n但由于发声系
2、统的复杂性,基于声学参数的病理语音检测仍然没有取得良好的效果,现在仍然不能仅凭一个或几个特征参数经过识别给出诊断结果。5汇报内容病理语音特征效果分析研究病理语音特征效果分析研究4引言引言1病理语音特征极其提取方法病理语音特征极其提取方法2基于分层递阶可视化的特征选择与融合方法基于分层递阶可视化的特征选择与融合方法3结论结论52.1 基础声学特征集BAFS提取n基频n声音质量特征n当发声器官发生病变时,将会引起语音的声学性质变化,空气动力学特性异常,影响声音质量n频谱相关特征n声道形状变化及发声运动之间相关性的2.1 基础声学特征集BAFS提取分类分类特征特征维数维数韵律特征韵律特征基频基频15
3、声音质量特征声音质量特征基频微扰基频微扰15振幅微扰振幅微扰15谐噪比谐噪比15基于频谱的相关特征基于频谱的相关特征频带能量频带能量260谱质心谱质心10频谱熵频谱熵10谱通量谱通量10谱偏态谱偏态10谱峰态谱峰态10频谱斜率频谱斜率10频谱衰减点频谱衰减点402.2 MSCC特征提取n离散S变换2(-)01()nkTNiNknXx kT eNTN22222-1(-)()0,0mmiNjnNmnm nS jTXeenNTNT;-101,00NmmS jTXnNNT;一帧语音信号S变换能量谱带通滤波DCTMSCC2.3 基于非线性的病理语音特征提取本文提取病理语音的非线性特征,作为基于线性分析的
4、声学特征的补充。本文提取的是最大李雅普诺夫指数、近似熵、Lempel-Ziv复杂度三种非线性特征。为了更好的反映病理语音的非线性特性,需要足够长的数据,故本文采用帧长为50ms,帧移为帧长的一半,提取三种特征,并得到其统计值(平均值、方差、偏态和峰态),共得到12维特征。10汇报内容病理语音特征效果分析研究病理语音特征效果分析研究4引言引言1病理语音特征极其提取方法病理语音特征极其提取方法2基于分层递阶可视化的特征选择与融合方法基于分层递阶可视化的特征选择与融合方法3结论结论53.1 基于雷达图的特征融合n雷达图雷达图的三角形重心雷达图的相邻m 变量重心111222cos(1)*)sin(1)
5、*)()()33mmijijjjimrjwrjwabs3.2 F-Score 特征排序212,11()1()1jljiijinljjikijkjxxFxxn3.3 特征优化过程14汇报内容病理语音特征效果分析研究病理语音特征效果分析研究4引言引言1病理语音特征极其提取方法病理语音特征极其提取方法2基于分层递阶可视化的特征选择与融合方法基于分层递阶可视化的特征选择与融合方法3结论结论54.1 语料nNCSC语料:INTERSPEECH 2012 speaker trait,荷兰头颈肿瘤手术癌症研究所NCSC训练集训练集开发开发集集清晰384341不清晰5174054.2 评价指标NCSCNCSC
6、预测正样本预测正样本预测负样本预测负样本实际正样本实际正样本True Positive True Positive(TPTP)False False Negative(Negative(FNFN)实际负样本实际负样本False False Positive(Positive(FPFP)True True Negative(Negative(TNTN)()TPsensitivityTPFNTNspecificityTNFPTPTNTPAccuraFNFcPTNyReTPcallTPFP4.3 实验NCSC上的实验结果表特征sensitivityspecificityUAAccuracyNLNF(
7、12维)55.3%61.0%58.1%57.9%MSCC(84维)67.1%62.1%64.6%63.6%BAFS(430维)63.7%57.7%60.7%60.9%NCSC上NF和VIS-Features的实验结果表特征sensitivityspecificityUAAccuracyNLNF+MSCC+BAFS(526维)82.7%65.1%73.9%74.6%VIS-Features(96维)84.4%65.6%75.1%75.9%18汇报内容病理语音特征效果分析研究病理语音特征效果分析研究4引言引言1病理语音特征极其提取方法病理语音特征极其提取方法2基于分层递阶可视化的特征选择与融合方法基于分层递阶可视化的特征选择与融合方法3结论结论5195 结论n本文从特征提取入手,针对病理语音信号的突变特征,从三个方面构建了一个新的特征集,并提出可视化的降维技术。n在NCSC数据库上取得了84.4%的识别率。跟以往研究结果相比,本文提出的方法在识别率上有很大提高,证明了该方法的有效性,可以为病理语音的临床应用提供重要的理论基础。