1、第第5 5章章 医学图像分类医学图像分类 医学图像分类(Classification)与分割(Segmentation)二者具有相近含义,有时很难严格区分。 本书把它们作为两个独立的章节介绍是考虑到“分割”一词更强调几何形态方面的操作,而分类往往还给出明确的解剖标识。 因此,第4章的内容偏重在图像几何形态处理的算子和算法,第5章则介绍一些面向医学应用的实用算法。在以下的叙述中,我们并不刻意对“分割”与“分类”加以区分,因为大多数文献对二者也是经常混用的。只是在强调解剖标识时才使用“分类”一词。MR图像中人脑组织灰度分布 从MRI各解剖区域的划分情况来看,同一解剖结构所对应的灰度值并不唯一, 而
2、是在一定的区间内呈正态分布,灰、白质间,灰质、脑脊液间的灰度分布曲线都有部分交叉,因而利用简单的设定灰度阈值的方法显然不可能准确的划分不同结构 。5.1单谱MR图像分割 如果只有一幅MR图像,可将图像的原始灰度值与该图像的某一个特征参量构成二维特征空间进行聚类分析,实现对人体组织分类的目的。 对单谱图像进行自动分类识别时借助图像特征提取的方法,从原始图像中提取不同纹理特征作为特征参量。 基于纹理相似度的区域分割方法的一般原理为: 从图像原始数据出发, 计算出其纹理的二阶统计参数分量图像, 并与原始灰度图像构成多维特征空间进行分类及计算相关隶属概率。基于双参数的聚类分类第1步: 选取各类组织的初
3、始聚类中心 (gi0,hi0), (i =1,,N);第2步:对图像的每一像素点求出其在二维特征空间中与各聚类中心的欧氏距离, 选择它们中最小者, 把该像素点标记到这类中。这样将原始像素点划分为N组对应于不同解剖结构的区域。第3步: 重新计算各聚类中心;第四步: 若符合收敛条件,则输出标记像素集合,否则返回第2步。 基于图像灰度与纹理参数的脑组织分类纹理参数图分类结果基于像素分类概率的迭代分类 由于计算机断层成像存在部分体积效应的特点,而且初始聚类图像也不能把不同的区域清楚地划分开,尤其边界处像素的归属难以确定,只能采用连续的“隶属度函数值”表示。利用松弛迭代法可以得到像素关于各类别隶属概率的
4、图像。Peleg松弛迭代分类算法)()|()()|()|()(0pxppxpxppiiii)()(),(),(,pppriiii),()()()(,iinjniniirpps)()()(,niiniiniissq)(81)(,1niiniqp第1步:根据Bayes准则对各类组织计算初始概率, (n=0) 第2步:计算相容系数(邻域)第3步:重新计算各像素的类别概率pin() 第4步:n=n+1,重复第3步,直至收敛条件满足。 通常,图像的每一项特征参数只描述了它在某一方面的特征, 因而将几种特征参数组合起来考虑,构成多维特征空间进行聚类分析可能达到较好的分类效果。 除了对二维空间中区域划分外,
5、还可以将几个参数以1:1:1:1的权重分别组合构成三维、四维、五维特征空间, 仍然按照以上方法进行图像的聚类分析。5.2 多谱图像分析 多谱图像这个词最初来源于卫星遥感技术。卫星对地面上同一区域采用不同波长的光,拍摄多幅图像,利用地面上的不同物质对不同波长光选择性吸收的原理来探测地表情况、地下矿藏等。 医学上的多谱图像是指在同一时间获取的同一个人相同解剖结构的Pd,T1,T2加权象,各个加权象能从不同方面描述不同组织的物理特性以及生物特性。 通过人工选定初始点,计算各种组织的均值,形成初始聚类中心,例如对人脑的几种重要生物组织:灰质(Grey matter),白质(White matter),
6、皮层(Cortex),脑脊液(CSF) 以及图像背景(Background)分类。在聚类分析中采用K近邻法,对选定图像的像素逐点进行分析。每次迭代过程对聚类中心进行校正,直到各类中心保持稳定为止。 从多幅图像得到的信息显然多于单幅图像,其分类的结果自然会优于单幅图像的分类结果。 例如,可以将人脑MR图像(T1、T2和Pd)两两组合,分别构成二维空间,或将三幅图像一起分析(三幅图像的加权比例为1:1:1),或用不同加权比对三幅图像一起分析(三幅图像的加权比例为WPd:WT1:WT2)。Pd,T1和T2不同加权距离公式如下式所示:2)(2222)(1112)()()()(kTdTTkTTTkpdp
7、dpdkMGwMGwMGwD其中 Dk表示像素与第k类聚类中心的距离,(k=1,2,.,5) ;GPd,GT1,GT2是分别从三幅加权象中读取的该像素空间位置的灰度值; MPd(k),MT1(k),MT2(k)是三幅加权象中五种组织的均值;WPd,WT1,WT2 是每幅图像的权重。 原始的多谱MR图像,从左向右依次分别为Pd,T1和T2加权象T1和T2加权象的多谱分类结果:与参考分类图相比较:CSF 和灰质的误分辨较多,特别是脑室区的灰质分辨较差。对白质和皮层的分辨基本可以满意。BCGWX050001000015000200002500030000BCGWX参考分类图T1-T2分类图T1-T2
8、多谱分类图,右图是分类结果与参考分类图的比较B:背景;C:脑脊液;G:灰质;W:白质;X:皮层BCGWX050001000015000200002500030000BCGWX参考分类图加权Pd-T1-T2分类图加权的Pd-T1-T2分类图,右图是分类结果与参考分类图的比较B:背景;C:脑脊液;G:灰质;W:白质;X:皮层Pd-T1-T2多谱分类图效果明显优于上面两幅加权象生成的分类图结果,已经与参考分类图相当接近。表5.1给出五种组合的多谱图像分类方法分类结果与参考图的分类结果的定量比较。可以看出,因为图像背景和皮层的灰度取值范围相对较为单一,故除个别分类方法外,多数分类方法结果相差不大;而对
9、于灰度取值范围比较复杂的灰质,白质和脑脊液CSF,几种分类结果差别则较大。表5.1 五种组织在各分类图中所占像素数与总像素数的百分比 5.3 神经网络分类 5.3.1 KOHONEN 模型 Kohonen 模型是一种简单的神经网络,像C-均值算法一样,也同样具有能够识别聚类中心、自组织分类的能力。 首先,讨论没有侧反馈的情况。先介绍Kohonen 模型的网络结构。 这是一种MAXNET 方案,得到最大激励的神经元netj成为获胜神经元。Kohonen 网络结构包含两层神经元:输入层和 Kohonen 层。两层神经元之间完全互相连接。即每个输入层神经元到每个输出层神经元都有一个前馈(Feed-f
10、orward )连接。下面是一维的Kohonen 神经网络结构:首先,假设输入是归一化的 (即 )。 Kohonen 层的输入 (即整个网络的输出层) 可从下式计算:iniijjxwI1获胜神经元就是具有最大Ij 的输出层神经元。采取赢者通吃的方案,该获胜神经元的输出是+1. kohonen 层其它神经元什么也不输出。上面方程式实际上是神经元权向量与输入向量之点积。 因此,也可以看作该神经网络选择获胜神经元的方法是,获胜神经元的权向量与输入向量之间夹角小于其它神经元与输入向量之间的夹角。1x另一种选择获胜神经元的方法是:找出与输入向量具有最小欧式模( Euclidean Norm )距离 (即
11、 ) 的权向量的所对应那个神经元,就是获胜神经元。对于单位向量来说,这两种方法是等价的。即会选择同一个神经元。使用欧式距离的好处是它不要求权向量或者输入向量的归一化。Kohonen 网络训练( Train )是按竞争(无监督)形式学习的。Competitive (Unsupervised) Learning. 当输入向量一加到网络上,Kohonen 层的神经元就开始竞争。网络按上述方法选择获胜神经元。神经元权向量按下式进行:)(oldijioldijnewijwxww其中, 是学习参数,或叫增益。xwdii5.3.2 带有侧反馈的Kohonen网络至此,我们介绍的Kohonen网络虽然能够进行
12、分类, 但在输出层对这些聚类中心的几何位置没有任何考虑。 Kohonen网络的自组织能力 (SOFM) 要求更复杂一点的侧反馈来实现。例如,在输出格点结构中,彼此靠得很近的神经元之间应该具有更为相似的属性。它们之间的相互影响应当体现在网络的空间结构上。要实现这样的功能,在网络输出层神经元之间建立侧方向的反馈联接。左下图是带有侧反馈的一维网络结构,右下图是带有侧反馈的二维网络结构。侧反馈的大小和类型(激活或抑制)体现在联接侧反馈的权系数上。权系数是网络格点中神经元之间几何距离的函数。 如何确定这些权系数才能获得预期的效果呢?让我们效仿生物系统的神经元的相互作用关系。考虑视皮层内神经元间的属性几何
13、映射关系,视皮层的短程侧反馈能够提供我们所需要的网络模型。下面的方程式通常称作墨西哥草帽函数 Mexican Hat Function, 可以用于侧反馈模型。2224222rerh左图是墨西哥草帽函数 。作为神经元之间距离的函数,它可以明显地分成几个区域。在小于R0的区域,侧反馈是激活方式;在 R0 与 R1 之间,侧反馈是抑制方式。在R1之外,则是弱激活区。在有侧反馈情况下, Kohonen模型输出层中第 j 个神经元的总输入可以表示为 : njycInetkjKKkkjjjj, 2 , 1,其中, K 是侧反馈作用的最大区域。Ij 由下面公式给出: ipijijxwI1第 j 个神经元的输
14、出和输入是非线性关系。如非线性函数是(), 则有 Yj = (netj)。的选取应满足约束关系: yj 0, 其中, 是任意常数。侧反馈 是通过权系数cjk实现的。这些层内部权系数是固定不变的。即它们不是通过学习或训练过程得到的,而是按照墨西哥草帽函数公式得出。它体现邻近神经元激活、远处神经元抑制作用。Most frequently由于墨西哥草帽函数计算较复杂,在很多情况下用一些简单函数近似。 上图就是一个例子。 公式(8)的求解通常是通过一个迭代的过程使输出层神经元随时间变化逐渐达到平衡状态。迭代的过程通过下面公式实现:(10),1,2,)(1)(,NjnycInykjKKkkjjjj其中,
15、 n 代表离散时间步数, 是控制收敛过程的常数。5.3.3 Kohonen自组织特征图Kohonen SOFM 利用 Kohonen 模型结构和Kohonen 学习机制。自组织特征图是对带有侧反馈的Kohonen 模型的增强, SOFM 将n维输入空间映射到一个一维或二维神经元格点,该输出空间具有有意义的拓扑结构。仍用 x表示输入向量: Tpxxxx,21对应输出层神经元j的权向量 wj 可以写作: NjwwwwTjpjjj, 2 , 1,21获胜单元的确定权向量 wj 与输入向量 x 匹配最佳的输出神经元。前面已经介绍,有两种方法可以完成这个任务。一个是选择得到最大激活的输出层神经元:xwI
16、Tjjnjxwxwifkxijk, 2 , 1)(在SOFM中,还要对侧反馈方式进一步说明。令i(x)(n)表示获胜单元周围邻域。 i(x)(n) 是离散时间(迭代步数)的函数。但这不意味侧反馈的大小随着网络训练过程而改变,只是说网络的学习(训练)的范围。较大的邻域表示学习是在更大的全局范围内进行的。一般,在开始时选择较大的邻域,在学习过程中逐渐减小邻域。或者选择权向量与输入向量间欧式距离最小的输出层神经元作为获胜神经元。如果用 i(x) 表示获胜神经元的索引号, 该方法可以表示为:输出神经元拓扑结构典型地用方型格点邻域关系表示。邻域半径为零时仅包括获胜神经元本身。半径1时,有8个近邻神经元,
17、等等。可以将邻域函数应用到学习过程:otherwisenwnjnwxnnwnwjxijjj)()()()()() 1()(引入邻域函数后,学习过程更加合理。在一定范围邻域中受激活的神经元包含相似的突触权向量。另一种邻域结构是六角型格点结构:Neighborhoods on a hexagonal lattice. KOHONEN 自组织特征图算法Step 1. 初始化: 令权向量, wj(0) 初始值为任意随机数。数值小些,可能好些。 初始化学习速率 (0) 和邻域函数值 Aj(x)(0)。一般开始时,宜选大些。 Step 2. 对样本中每个输入向量, 执行 steps 2a, 2b 和 2c
18、。 Step 2a. 将感知刺激向量, x 施加在网络输入层。 Step 2b. 相似性匹配: 选择权向量与x最匹配的神经元为获胜神经元。使用欧式模准则,获胜神经元的索引号为:njxwxwifkxijk,1,2,)(Step 2c. 学习, 对激活区范围内神经元调整权系数。otherwisenwnjnwxnnwnwjxijjj)()()()()(1)()(Step 3. 更新学习速率, (n): 学习速率线性减小有助于得到满意结果。Step 4. 减小邻域函数 j(x)(n). Step 5. 检验停止条件: 特征图无明显改变时,迭代终止。否则转向Step 2. KOHONEN 自组织特征图算
19、法(续)5.3.4 BP神经网络算法原理:前向多层网络的反向传播学习算法,简称BP算法(Back Propagation)。它是有指导的训练,训练的过程是一个不断调整网络权值的过程。它分为两个过程:前向传播和反向传播过程。I层J层K层网络结构:算法基本思想 根据样本的期望输出与实际输出之间的平方误差,利用梯度下降法,从输出层开始,逐层修正权系数。网络学习:每个修正周期分两个阶段:前向传播阶段反向传播阶段前向传播阶段输入样本:第J层节点输入: 第J层节点的输出: 其中h是隐层节点数 , f为非线性函数: 第k层节点输入: 第k层节点输出: 其中, c为输出节点数 Tnxxxx),.,(2, 1)
20、 1 (1111iinniijijxxy)2(, 2 , 1)( hjyfjj1)1 ()(xexf)3(1111hhjjkjkZ)4(, 2 , 1)(ckZfOkk反向传播阶段假设输入样本:期望输出:经前向传播,网络实际输出为 定义平方误差E为BP算法以E为准则函数,采用梯度下降法求解使准则函数达到最小值时的权系数。由于有误差,说明网络权系数不合适,应该进行修正。Tnxxxx),.,(2, 1),.,(2, 1cdddd ),.,(2, 1coooo )5()(2112ckkkodE)6(kjkkkjkjkjkjkjZZEE式中,是步长, E与Wkj没有直接关系。由公式(3)得到11hjj
21、jkjkjkjkZ由公式(4)得)7()(jkjkkjZE 式中由公式(5)得公式(6)可改写为kkkkkZooEZE)(kkkodoE)( kkkzfZo)8()( )(kkkkzfod 隐含层权系数修正:)9()(jijjjijjjijjjijijijijiyyyEyyEE由公式(1)得ijijy又有)10(jjjjjyEyE由公式(2)得)11()( jjjyfy由公式(5)得)12()( )()()(21(11121ckkjkkjkkckkjkkkckkkckkjjzfodzzoododE将公式(11)、(12)代入(10)得)13()( 1ckkjkjjyf采用单极型Sigmoid函
22、数作激励函数:)14()1 ()(1)()111 (11)1 ()( 2jjjjyyyyjyfyfeeeeyfjjjj类似有:)15()1 ()( kkkoozf将公式(15)代入(8)得将公式(14)代入(13)得)16()1 ()(kkkkkoood)17()1 (1ckkjkjjj总结输出层节点权系数修正公式:jkkjkj)1 ()(kkkkkOOOd)(jjyfijjijickkjkjjj1)1 (iix k=1,2,c j=1,2,.,h+1 j=1,2,h i=1,2,n+1 , k=1,2,c j=1,2,h+1隐含层节点权系数修正公式:可见,修正隐含层权系数wji时,需要上一层
23、算出k及上一层修正后的权系数wkj,即由输出层向输入层逐层反推的学习算法。程序流程图识别(分类) 将待识别的模式x送入网络输入层,根据训练阶段得到的权系数进行计算。先求隐含层输出,再求输出层输出:kmkxthencmkmkooif, 2 , 1,0, 1讨论1因Sigmoid激励函数 0f(x)1, 所以期望变量分量dk不宜设为1或0,可以选择0.1和0.9。2学习速率要选择恰当的值。如果学习速率较小,学习速度比较慢,而若学习速率过大则会引引起网络出现振荡,不能收敛。因此。在开始时选大些,可以使学习速度加快,在临近最佳点时要小些。3BP算法属于非线性优化问题,不可避免会遇到局部极值问题。解决方
24、法包括:(1)给权值加小的扰动;(2)重新初始化权系数;(3)适当增加噪声。4权系数初始值不宜取相同的值,可以用随机函数确定。5节点数的选择:输入层节点数 = 模式特征分量个数,输出层节点数 = 分类数,隐含层节点数:取决问题,隐含层可以是1或2层 隐含节点个数不可太多,否则可能对训练样本造成“过拟合”,实际应用效果差。5.4 马尔可夫随机场与期望值最大化方法 似然(Likelihood): p(y|x), x:类别; y: 特征向量 用统计学方法对图像分割,最初采用最大似然法,受噪声等因素影响,分割结果经常会出现一些小的孔洞。引入最大后验概率准则(Maximum A Posteriori,
25、MAP)后,这个问题才得到解决。 MAP将最大似然问题转化为类概率 p(x)与类条件概率p(y|x)乘积最大的问题。 在计算类概率 p(x)时,利用到马尔可夫随机场与吉布斯分布的等效性; 类条件概率p(y|x)的计算则涉及像素强度分布及模型参数拟合问题。 )/()(maxargxypxpxx5.4.1有限混合模型用表示模型参数:有限混合模型(Finite Mixture Model)假定两个组态x和y是成对独立的,它们的联合概率分布为|;Llll);()|,()|,(iixiSixiSiiyfxypyxpMR图像中脑组织的灰度分布 多种脑组织灰度分布的综合包络就构成有限混合模型。该模型数学形式
26、简单,并已广泛应用于许多模式识别问题之中。但模型仅考虑统计信息,而不包含任何空间信息。应用在图像分割中,这意味仅根据图像的直方图进行分类。相同的直方图可以对应各种不同的图像强度空间分布。因此,仅用有限混合模型做图像分类是不完全的,必须考虑图像像素间的近邻关系。马尔可夫随机场理论提供了这方面的解决办法。5.4.2 马尔可夫随机场为了定义图上的马尔可夫随机场(Markov Random Fields, MRF),首先给出图的概念。设S=s1,s2,sn是R2中的点集,G表示连接S中任意两点所组成线段的集合,则称S,G为图。二维格点上的像素矩阵X就是一个图。若图像X的任何像素的分布满足以下两个条件(
27、1) (2)其中,x为X的一个实现,则称X为关于G的马尔可夫随机场,简记做MRF。, 0)(XxxP) , ( ,|(),() , ( ,|(, , , , ,ijjijijijijijijijiNjixXxXPjijixXxXP5.4.3 Gibbs分布与MRF 利用马尔可夫随机场理论,将图像灰度按空间变化的信息描述为随机场。直方图仅有灰度统计信息,MRF却包含空间邻域信息。)(exp()(1xUZxP)()(xVxUCccMRF可以等效地用Gibbs分布描述:其中,Z是归一化常数,U(x)是能量函数,其表达式为xxUZ)(exp(C:基团(Clique) Vc(x):基团势能基团反映目标(
28、Object)图像的联通关系。二维图像中可能的基团构型:各基团对应的权系数:kjcAxVjjc, 2 , 1)()(jjxjxcAiij01)(MjcBxVjjc, 2 , 1)()(jotherwisexxxcBniiij11)(21每个基团对应的势能Vc(x)的估计方法如下:若基团c只包含一个像素,则其中j代表基团c所属的组织,是待定系数, 若基团c由两个或两个以上的像素:M是所有由两个或两个以上的像素构成的基团类型总数,是待定系数, 和 都是由基团中像素对应的分类结果决定 )(cAj)(cBjjj)(ixVCicixVxV)()(TMtypeCiMtypeCikicBcBcAcAcAx
29、)(,),(),(,),(),()(1121TMk,2121TiixxV)()(jiijTjixxxpxpxx)()(ln)()()(ixp)(jxpixjx)()()()(ijijxNxNxpxpbAx 系数和是未知的。MLL模型提供了一种估计这些系数的简便方法。是所有包含像素i的组块对应势能之和:令待定系数向量为则有可推出与分别是与出现的概率,其比值可以由下式计算:可以求解待定系数向量。5.4.4 MRF-MAP分类 lxi)2)(exp(21);()|(222llilliiiyygxyp)log(2)(exp(21)|()|(22iiixxxiSiiSiiyxypxyP假设像素强度yi服
30、从高斯分布。对于分类其中, 是组织类型基于关于y的条件独立假设,联合类的条件概率为)|(exp(1)|(xyUZxyPSixxxiiSiiiiiyxyUxyU)log(2)()|()|(22)2/()2(NZ)|()|(logyxUyxPcxUxyUyxU)()|()|()()|(minargxUxyUxXx改写为其中似然能归一化常数项:其中,后验能量c是一个常数。最大后验概率(MAP)估计等价于后验能量函数最小化:5.4.5 用期望值最大化方法拟合模型),(jjj在MRF-MAP式中,U(y/x)的计算涉及各组织类型高斯分布参数 的确定问题。Expectation Maximization,
31、EM算法EM 算法是 Dempster,Laind,Rubin 于 1977 年提出的求参数极大似然估计的一种方法,它可以从非完整数据集中对参数进行 MLE 估计。这种方法可以广泛地应用于处理缺损数据,截尾数据,带有讨厌数据等所谓的不完全数据(Incomplete Data)。密度函数p(x/), 是模型参数,已知数据集 =x1,x2, ., xN, N 为样本数。则有)|()|()|(N1iLxpPi)|(Lmaxarg*最大似然估计就是寻求满足下式的参数:通常,为计算方便,求解最大似然对数:)|(L log maxarg*若是高斯分布,就可直接通过求导数,并令其为0, 计算参数 和 。)0
32、()|,(log),|(,| )|,(log)|()()()(yxpyxpyyxPQXxttt)|()(tQ)|(maxarg)()1(ttQ)()1(ttE步骤:estimate the expected valuesM步骤:re-estimate parametersEM算法的具体步骤是:开始 给参数赋初值E-step 计算条件期望值M-step 最大化得到新的参数估计值赋值 转向E-step在一定合理条件下,EM算法收敛于最大似然估计。EM算法,它也可被看作为一个逐次逼近算法:事先并不知道模型的参数,可以随机的选择一套参数或者事先粗略地给定某个初始参数 ,确定出对应于这组参数的最可能的状
33、态,计算每个训练样本的可能结果的概率,在当前的状态下再由样本对参数修正,重新估计参数 ,并在新的参数下重新确定模型的状态,这样,通过多次的迭代,循环直至某个收敛条件满足为止,就可以使得模型的参数逐渐逼近真实参数。)0(人脑MR图像中组织分类的例子 人脑MR图像中像素与其临域的关系可以用马尔可夫随机场(MRF)来描述。在很多情况下组织的灰度分布呈高斯分布。整幅图像的直方图可以看作各组织分布的迭加。例如,对人脑MR图像可以看作白质(WM)、灰质(GM)、脑脊液(CSF)、脑脊液与灰质混合区(CG)及灰质与白质混合区(GW)五种成分组成。首先绘制图像的直方图,对这五种成分组成(均按高斯分布)拟合求出
34、各类组织灰度的均值和方差2。五种组织的初始参数选取首先计算整幅图像像素强度的均值0和标准差0。再将这五种成分的均值参数分别取做WM:GW:GM:CG:CSF:所有组织的标准差参数均取做 。k1,k2和k3均为常数,凭经验选取。然后用c-均值聚类方法对图像全部像素分类初始化。010k020k010k021)(kk 01k03k5.5 医学图像分割技术的评估 对医学图像分析结果,包括对组织分类结果的评估一直是件很困难的事情。一般来说,不存在什么金标准(Gold Standard)。5.5.1 专家目测 不同人的同一组织和器官的解剖结构的形态、体积和空间位置存在较大差异。 更困难的是很多类组织,例如
35、脑灰质和白质之间本来就无明显分界。 尽管主观因素较多,对人体组织的分类结果还是由解剖学专家或有经验的医生作最终认定。一般,由专家在图像上手绘的边界被认为是真实组织边界,用于评估计算机分类算法的性能。 当然,这并不意味人体组织的分类只能由专家去作。因为,一个计算机分类程序一经验证有效,就可以放心可靠地用于分类了。5.5.2 Jaccard系数与Dice 系数|),(212121SSSSSSJ|2),(D212121SSSSSSJaccard 相似性测度 (Similarity Index,SI).Dice相似性系数定义Jaccard系数与Dice 系数是两个常用的相似性度量。如果将S1和S2看作
36、像素的集合,例如S1是参考图像和S2是分割结果,这两个系数就可以用来对图像分割的结果定量评估。其它一些性能评价参数, 灵敏度 = TP/(TP+FN) 特异性 = TN/(FP+TN) 总体性能 = (TP+TN)/(TP+FP+TN+FN) 误分率 = (FP+FN)/(TP+FP+TN+FN) 假阳性率 = FP/(TP+FN) 假阴性率 = FN/(TP+FN)S1S2 5.5.3 体模(Phantom)验证 体模又有硬件体模和软件体模之分。后者是计算机图像合成结果。体模法用已知的图像信息验证新分类算法的精度。由于体模都比较简单,与实际临床图像差异较大,因此只能对分类方法作初步的评估。
37、例如用添充氧化铁颗粒的琼脂胶做成的简单几何形状的硬件体模经MR成像后可用于对分类算法的测试。 (a) 三维体模 (b) 带有热点的二维体模 Hoffman硬件脑体模Hoffman体模较为复杂,能够产生接近真实解剖结构的MR图像。这种体模的好处是可以在各种实际成像环境广泛使用,性能已知而且稳定。缺点是,由于太稳定了,很难对其形状和材料作些变动。而软件体模(计算机化解剖图谱)在这方面具有很大优越性。 Hoffman硬件脑体模生成的SPECT图像这个硬件体模由64 x 64 的CdZnTe 阵列构成。内部填充110 mCi 的 Tc-99m ,成像3分钟,图像总计数19M次。5.5.4 图像分割验证
38、数据集 1. BrainWeb 对人脑MR图像自动分割,并进行正确的人脑组织分类显然具有重要的临床意义。蒙特利尔神经所(Montreal Neurological Institute, MNI) 的Evans教授等人研制了一个功能很强的仿真人脑数据库,称做BrainWeb。他们对同一个受试者在立体定向空间进行27次扫描(T1加权、梯度回响获取,TR/TE/FA=18ms/10ms/30),选取采样子集并做平均。最后得到一个高分辨(像素尺寸mmmm mm )、低噪声,包括全脑的三维 MR图像数据集。像素总数为181217181 个。 由于该数据集的高信噪比特性,图像中脑解剖组织十分清晰。再由神经
39、解剖专家对产生的图像各类组织逐个像素检查、分类并对组织边缘手工修正。最终形成具有10种组织概率分类的三维 MR图像数据集。该数据集还考虑了部分体积效应(Partial Volume Effect), 生成的仿真脑图像可以添加1%,3%,5%,7%,或9%的白噪声和20%,40%的不均匀场,用来测试在不同噪声和不均匀场的情况下分割算法的强健性。BrainWeb在国际上受到广泛的注意,除被用来产生逼真的MR和PET仿真器外,许多研究人脑组织分类算法的学者也都将其作为参考进行比对。2. IBSR Internet Brain Segmentation Repository(IBSR)的网络脑分割数据库是由Massachusetts General Hospital的形态特征分析(Morphometrics Analysis)中心提供的。 (a) MR原图 (b) 带梯度的体模图像 (c) 带梯度和噪声的体模图像 IBSR数据集特点是手工引导分割,提供20个正常被试的MR图像及其分割结果。MR图像是T1加权三维冠状扫描像。图像大小为256x65x256,像素尺寸:1x3x1mm3, 轮廓线分割是训练有素的专家采用半自动分割技术用数小时时间完成的。尽管如此,分割的结果也不能说是100%绝对准确,但仍不失为对一些自动分割算法定量比较的好方法。