1、 第三章第三章 正态分布与医学参考值范围正态分布与医学参考值范围卡尔卡尔弗里德里希弗里德里希高斯高斯(C.F.Gauss,1777-1855)正态分布(正态分布(normal distribution)又称为高斯分布。首先由德国数又称为高斯分布。首先由德国数学家和天文学家德学家和天文学家德莫阿弗尔提莫阿弗尔提出,高斯虽然发现稍晚,但他迅出,高斯虽然发现稍晚,但他迅速将正态分布应用于天文学,并速将正态分布应用于天文学,并对其性质作了进一步的研究,使对其性质作了进一步的研究,使正态分布的应用价值广为人知。正态分布的应用价值广为人知。一、正态曲线一、正态曲线某地正常成年男子红细胞数的分布情况某地正常
2、成年男子红细胞数的分布情况图图3-2图图3-1图图2-1二、正态分布的特征二、正态分布的特征连续型随机变量连续型随机变量X服从正态分布,记为服从正态分布,记为X2(,)N 概率分布函数概率分布函数2121()2XXF Xedx2121()2Xf Xe概率密度函数概率密度函数正态分布是单峰分布,以正态分布是单峰分布,以 为中心左右完全对称为中心左右完全对称X正态曲线在正态曲线在 处有拐点,呈现为钟型处有拐点,呈现为钟型X正态分布由两个参数正态分布由两个参数 和和 决定决定正态曲线下的面积分布有一定的规律正态曲线下的面积分布有一定的规律 是位置参数,决定着正态曲线在是位置参数,决定着正态曲线在X轴
3、上的位置轴上的位置是形状参数,决定着正态曲线的分布形状是形状参数,决定着正态曲线的分布形状Normal distribution图图3-4图图3-3Normal distribution图图3-5图图3-6Normal distribution三、标准正态分布三、标准正态分布Xz =0、=1的正态分布即为标准正态分布的正态分布即为标准正态分布2212zze 2212zzzedzStandard normal distribution图图3-7Standard normal distribution 1221P zzzzz 在区间(在区间()上的概率(曲线下的面积)上的概率(曲线下的面积)12,
4、z zz当当 和和 未知时,可以利用样本均数未知时,可以利用样本均数 和标准差和标准差 计算计算XSzXXzSStandard normal distribution例例3-1 若若X ,试计算,试计算X 取值在区间取值在区间 上的概率。上的概率。),(2N1.96111.961.96Xz 221.961.96Xz1.961.961.961.9611.961.96 1 21.961 2 0.0250.95Pz Standard normal distribution例例3-2 已知某地已知某地140名正常成年男子红细胞计数近似名正常成年男子红细胞计数近似服从正态分布,服从正态分布,=4.781
5、012/L,=0.381012/L。该地正常成年男子红细胞计数在该地正常成年男子红细胞计数在4.01012/L以下以下者占该地正常成年男子总数的百分比;者占该地正常成年男子总数的百分比;XS4.04.782.050.38XXzS 查附表查附表1 ,表明该地成年男子红,表明该地成年男子红细胞计数低于细胞计数低于 4102/L 者约占该地正常成年男子总者约占该地正常成年男子总数的数的2.02%(2.05)0.0202Standard normal distribution 11.892.051 0.02940.02020.9504 红细胞计数在红细胞计数在4.01012/L5.51012/L者占该
6、地者占该地正常成年男子总数的百分比正常成年男子总数的百分比4.00 4.785.50 4.78(4.005.50)()0.380.38XPXP=(2.051.89)Pz表明红细胞计数在表明红细胞计数在 4.01012/L 5.51012/L者约占者约占该地正常成年男子总数的该地正常成年男子总数的95.04%。Standard normal distribution一、医学参考值范围的概念一、医学参考值范围的概念医学参考值范围医学参考值范围,指指“正常正常”人的解剖、生理、生人的解剖、生理、生化指标等数据大多数个体值的波动范围。化指标等数据大多数个体值的波动范围。确切含义是,从选择的参照总体中获
7、得的所有个体确切含义是,从选择的参照总体中获得的所有个体观察值,用统计学方法建立百分位数界限,由此得观察值,用统计学方法建立百分位数界限,由此得到个体观察值的波动区间。通常情况使用的是到个体观察值的波动区间。通常情况使用的是95%参考值范围。参考值范围。1.基于临床实践,从个体角度,基于临床实践,从个体角度,作为临床上判定正常与异常的作为临床上判定正常与异常的参考标准,即用于划分界限或参考标准,即用于划分界限或分类。分类。2.基于预防医学实践,从人群角基于预防医学实践,从人群角度,可用来评价儿童的发育水度,可用来评价儿童的发育水平,如制订不同年龄、性别儿平,如制订不同年龄、性别儿童某项发育指标
8、的等级标准。童某项发育指标的等级标准。确定医学参考值范围的意义确定医学参考值范围的意义确定确定95%参考值范围示意图参考值范围示意图Medical reference range二、制订医学参考值范围的注意事项二、制订医学参考值范围的注意事项1.确定同质的参照总体确定同质的参照总体一般选择一般选择“正常正常”人,主要是排除了对研究指标人,主要是排除了对研究指标有影响的疾病或有关因素的同质人群。有影响的疾病或有关因素的同质人群。2.选择足够例数的参照样本选择足够例数的参照样本 通常情况下,确定参考值范围需要大样本,如果通常情况下,确定参考值范围需要大样本,如果例数过少,确定的参考值范围往往不够准
9、确。例数过少,确定的参考值范围往往不够准确。3.控制检测误差控制检测误差为保证原始数据可靠,检测过程中要严格控制随为保证原始数据可靠,检测过程中要严格控制随机误差,避免系统误差和过失误差。机误差,避免系统误差和过失误差。4.选择单、双侧界值选择单、双侧界值依据专业知识确定,研究指标无论过高或过低均依据专业知识确定,研究指标无论过高或过低均属异常,采用双侧界值;有些指标仅过大或者过属异常,采用双侧界值;有些指标仅过大或者过小为异常,采用单侧界值。小为异常,采用单侧界值。白细胞数参考值范围白细胞数参考值范围血铅参考值范围血铅参考值范围肺活量参考值范围肺活量参考值范围Medical referenc
10、e range6.选择计算参考值范围的方法选择计算参考值范围的方法根据资料的分布类型,样本含量的多少和研究目根据资料的分布类型,样本含量的多少和研究目的等,选用适当的方法确定参考值范围。的等,选用适当的方法确定参考值范围。5.选择适当的百分数范围选择适当的百分数范围结合专业知识,根据研究目的、研究指标的性质、结合专业知识,根据研究目的、研究指标的性质、数据分布特征等情况综合考虑。百分数据分布特征等情况综合考虑。百分数数范围范围的不同的不同将导致不同的假阳性率和假阴性率。将导致不同的假阳性率和假阴性率。Medical reference range三、医学参考值范围的计算方法三、医学参考值范围的
11、计算方法百分位数法适合于任何分布类型的资料,在实际中百分位数法适合于任何分布类型的资料,在实际中最为常用。由于参考值范围所涉及的常常是波动较最为常用。由于参考值范围所涉及的常常是波动较大的两端数据,使用百分位数法必须要有较大的样大的两端数据,使用百分位数法必须要有较大的样本含量,否则结果不稳定。本含量,否则结果不稳定。正态分布法要求资料服从或近似服从正态分布,优正态分布法要求资料服从或近似服从正态分布,优点是结果比较稳定,在样本含量不是很大的情况下点是结果比较稳定,在样本含量不是很大的情况下仍然能够进行处理;若偏态分布资料经变量变换能仍然能够进行处理;若偏态分布资料经变量变换能转换为正态分布或
12、近似正态分布,仍可用正态分布转换为正态分布或近似正态分布,仍可用正态分布法。法。Medical reference range例例3-3 已知某地已知某地140名正常成年男子红细胞计数近似名正常成年男子红细胞计数近似服从正态分布,服从正态分布,=4.781012/L,=0.381012/L,估计该地正常成年男子红细胞计数估计该地正常成年男子红细胞计数95%参考值范围。参考值范围。XS近似正态分布资料可按正态分布法处理,因红细胞近似正态分布资料可按正态分布法处理,因红细胞计数值过大或过小均为异常,故应估计双侧计数值过大或过小均为异常,故应估计双侧95%参参考值范围:考值范围:0.05 24.78
13、1.960.384.04,5.52XzS 即该地正常成年男子红细胞计数的即该地正常成年男子红细胞计数的95%参考值范围参考值范围为为4.041012/L5.521012/L。Medical reference range例例3-4 某年某地测得某年某地测得 100 名正常成年人的血铅含量名正常成年人的血铅含量值值(g/dl),试确定该地正常成年人血铅含量的,试确定该地正常成年人血铅含量的95%参考值范围。参考值范围。根据经验已知正常成年人的血铅含量近似对数正根据经验已知正常成年人的血铅含量近似对数正态分布,因此首先对原始数据作对数变换,经正态分布,因此首先对原始数据作对数变换,经正态性检验可知
14、对数值服从正态分布(态性检验可知对数值服从正态分布(P0.50),),故编制对数值频数表,再利用正态分布法求故编制对数值频数表,再利用正态分布法求95%参考值范围。参考值范围。Medical reference range对数组段对数组段 频数频数累计频数累计频数0.6 4 40.7 2 60.8 5 110.9 9 201.0 12 321.1 15 471.2 18 651.3 14 791.4 12 911.5 5 961.6 3 99 1.71.8 1 100合计合计100 4 4 5 5 6 6 7 7 7 7 7 8 8 8 8 8 8 8 9 910101010101010101
15、11111121313131313131313131314141415151616161616161616171717171718181818192020202021212222222324242525262626272728282930303131323232333541445051表表3-2 某年某地某年某地100名正常成年人血铅含量(名正常成年人血铅含量(g/dl)对数值频数表对数值频数表 依据表依据表3-2,设,设X为对数组段的组中值,为对数组段的组中值,则对数值的均数和,则对数值的均数和 标准差为:标准差为:100n120fX 2149.73fX 1201.2100fXXn(g/dl
16、)222()149.73 120/1001100 1fXfXnSn0.2406S(g/dl)Medical reference range因为血铅含量仅过大异常,故参考值范围应为单因为血铅含量仅过大异常,故参考值范围应为单侧,求单侧侧,求单侧95%上限值:上限值:即该地正常成年人血铅含量即该地正常成年人血铅含量95%参考值范围为小参考值范围为小于于39.3173g/dl。11lg(1.64)lg(1.21.64 0.2406)39.3173XS(g/dl)Medical reference range26写在最后写在最后成功的基础在于好的学习习惯成功的基础在于好的学习习惯The foundation of success lies in good habits谢谢大家荣幸这一路,与你同行ItS An Honor To Walk With You All The Way讲师:XXXXXX XX年XX月XX日