1、温医环境公卫学院黄陈平温医环境公卫学院黄陈平一、正态分布的概念及特征一、正态分布的概念及特征 1.正态分布的图形正态分布的图形 2.正态分布的特征正态分布的特征 3.标准正态分布标准正态分布 4.正态分布曲线下面积分布规律正态分布曲线下面积分布规律二、正态分布的应用二、正态分布的应用 1.估计变量值的频数分布估计变量值的频数分布 2.制定参考值范围制定参考值范围 3.质量控制质量控制 4.统计处理方法的基础统计处理方法的基础小结小结表表9-1 某地某地140名正常成年男性血清尿素氮浓度名正常成年男性血清尿素氮浓度(mmol/L)6.005.283.905.304.203.905.605.664
2、.104.004.503.774.344.304.225.305.133.794.805.204.702.945.904.502.105.605.902.854.904.225.633.214.663.005.963.453.504.233.903.884.244.534.882.483.403.263.213.602.734.154.604.354.965.615.875.014.335.744.873.963.003.933.155.003.443.502.854.874.603.404.793.026.234.982.895.826.305.205.403.002.804.434.505
3、.526.404.865.904.703.474.664.785.702.264.103.705.403.704.374.206.104.805.105.552.975.113.263.046.015.074.225.395.344.473.585.264.544.073.833.976.054.022.692.525.216.554.284.455.154.455.373.803.734.492.442.763.333.016.433.552.63图图9-1 140名健康成年男性血清尿素氮浓度频数分布图名健康成年男性血清尿素氮浓度频数分布图 1 1、正态分布的图形、正态分布的图形 Nfxfx
4、x xfxxf Nfxfxxf xf Nfxfxxfx xf Nfxfxxfxx xf Nfxfxxfxx xf Nfxfxxfxx xf Nfxfxxf Nfxfxxf xf Nfxfxxfx xf Nfxfxxfx xf Nfxfxxfxx xf Nfxfxxfxx xf Nfxfxxfxx xf Nfxfxxf频数频数变量值变量值概率密度函数概率密度函数正态分布的概率密度函数正态分布的概率密度函数f(x)为:为:由上式可见,正态分布的图形由由上式可见,正态分布的图形由 和和 所所决定,即决定,即N(,2)xeXfX ,)/(22121正态曲线下的面积正态曲线下的面积F(x)的的计算计算:
5、xdxeXFxX ,)/(221211)在横轴上方,均数处最高,为单峰分布)在横轴上方,均数处最高,为单峰分布2)以均数为中心,左右对称)以均数为中心,左右对称3)有两个参数,)有两个参数,和和 4)正态曲线下面积分布有一定规律)正态曲线下面积分布有一定规律2 2、正态分布的特征、正态分布的特征图图9-5 不同不同、下正态分布概率密度函数的图形下正态分布概率密度函数的图形正态分布的图形由正态分布的图形由 和和 所决定,即所决定,即N(,2)对上式进行对上式进行 u 代换,即:代换,即:可使一般的正态分布转换为标准正态分布(可使一般的正态分布转换为标准正态分布(u 分布),分布),此时此时 N(
6、0,1)。3、标准正态分布、标准正态分布x=0=1xu问题:问题:为什么一般的正态分布要转换成标准正为什么一般的正态分布要转换成标准正态分布?态分布?表中曲线下面积为表中曲线下面积为-u 的面积;即的面积;即 P(u)P2999-8 4、正态曲线下的面积分布规律、正态曲线下的面积分布规律表表9-6 正态分布和标准正态分布曲线下面积分布规律正态分布和标准正态分布曲线下面积分布规律若若n100,则,则可用可用 代替,代替,用用 s 代替。代替。x图图9-6 正态分布和标准正态分布的曲线下面积分布规律正态分布和标准正态分布的曲线下面积分布规律 x -2.58 -1.96 -1 0 +1 +1.96
7、+2.58 u-2.58 -1.96 -1 +1 +1.96 +2.58 x95%95%v正态曲线下某一区间的面积占总面积的百分数有何正态曲线下某一区间的面积占总面积的百分数有何意义?意义?即该区间的例数占总例数的百分数(频数分布),即该区间的例数占总例数的百分数(频数分布),或观察值落在该区间的概率,或观察值落在该区间的概率,或从此总体随机抽得该区间观察值的概率。或从此总体随机抽得该区间观察值的概率。常用常用 u 值表值表 参考值范围参考值范围%单单 侧侧 双双 侧侧 80 0.842 1.282 90 1.282 1.645 95 1.645 1.960 99 2.326 2.578 图图
8、9-6 正态分布和标准正态分布的曲线下面积分布规律正态分布和标准正态分布的曲线下面积分布规律 二、正态分布的应用二、正态分布的应用(一)(一)估计变量值的频数分布估计变量值的频数分布(二)(二)制定参考值范围制定参考值范围(三)(三)质量控制质量控制(四)统计处理方法的基础(四)统计处理方法的基础例例 某地用随机抽样方法检查了某地用随机抽样方法检查了140名成年男名成年男子的红细胞数子的红细胞数(1012/L),检测结果如下表:检测结果如下表:4.765.265.615.954.464.574.315.184.924.274.774.885.004.734.475.344.704.814.93
9、5.044.405.274.635.505.244.974.714.444.945.054.784.524.635.515.244.984.334.834.565.444.794.914.264.384.874.995.604.464.955.074.805.304.654.774.505.375.495.224.585.074.814.543.824.014.894.625.124.854.595.084.824.93(一)(一)估计变量值的频数分布估计变量值的频数分布某地某地 140 名正常成年男子红细胞数的实际分布与理论分布名正常成年男子红细胞数的实际分布与理论分布 实实 际际 分分 布
10、布 X S RBC 范围范围 人数人数 百分数百分数%理论分布理论分布%X 1S 4.395.15 95 67.86 68.27 X 1.96S 4.035.51 132 94.29 95.00 X 2.58S 3.795.75 138 98.57 99.00 若若上例上例均数为均数为4.78(1012/L),标准差为,标准差为0.38(1012/L),问低于问低于41012/L的人占总人数的比例有多少?的人占总人数的比例有多少?020200520523807844.uP .u )(查表得:SxxP299 表表9-8 标准正态分布曲线下的面积,注意标准正态分布曲线下的面积,注意 P(u)例:对
11、使用过甘草的许多重要处方进行分析,例:对使用过甘草的许多重要处方进行分析,若已知每次的甘草用量若已知每次的甘草用量X(单位:克)服从正态分布,单位:克)服从正态分布,=8=8,=2=2。现任抽一张含甘草的处方,求甘草的用现任抽一张含甘草的处方,求甘草的用量在量在5 51010克范围内的概率。克范围内的概率。P=P(u2)P(u1)=P(1)P(-1.5)=0.7745128105.128521uu(二)(二)参考值范围的估计参考值范围的估计参考值的意义参考值的意义制定参考值范围的基本步骤制定参考值范围的基本步骤参考值范围的估计方法参考值范围的估计方法1.1.参考值的意义参考值的意义医学参考值医
12、学参考值(medical reference value)指指绝大多数正常人的生理、生化指标常数,也称正常值。绝大多数正常人的生理、生化指标常数,也称正常值。由于存在个体差异,正常人某项指标测定值并非常数而是由于存在个体差异,正常人某项指标测定值并非常数而是在一定范围内波动,故采用参考值范围作为判断某项指标是否在一定范围内波动,故采用参考值范围作为判断某项指标是否正常的依据。正常的依据。1)随机抽得足够数量()随机抽得足够数量(n100)符合条件的符合条件的观察对象;观察对象;2)控制测量误差;)控制测量误差;3)合理合并或分组;)合理合并或分组;4)确定单侧或双侧)确定单侧或双侧 白细胞计数
13、?白细胞计数?肺活量?肺活量?血铅浓度?血铅浓度?5)选定适当的百分界限;)选定适当的百分界限;如如80%、90%、95%和和99%,常用为,常用为95%。6)选定适当的计算方法。)选定适当的计算方法。2.2.制定参考值范围的基本步骤制定参考值范围的基本步骤3.3.参考值范围的估计方法参考值范围的估计方法 1、正态分布法正态分布法 若取若取95%界限,界限,双侧:双侧:X 1.96S 单侧:若高不正常,则单侧:若高不正常,则 X-1.645S 2、百分位数法百分位数法 若取若取95%界限,界限,双侧:双侧:P2.5 P97.5 单侧:若高不正常,则单侧:若高不正常,则 P5表表9-1 某地某地
14、140名正常成年男性血清尿素氮浓度名正常成年男性血清尿素氮浓度(mmol/L)6.005.283.905.304.203.905.605.664.104.004.503.774.344.304.225.305.133.794.805.204.702.945.904.502.105.605.902.854.904.225.633.214.663.005.963.453.504.233.903.884.244.534.882.483.403.263.213.602.734.154.604.354.965.615.875.014.335.744.873.963.003.933.155.003.443
15、.502.854.874.603.404.793.026.234.982.895.826.305.205.403.002.804.434.505.526.404.865.904.703.474.664.785.702.264.103.705.403.704.374.206.104.805.105.552.975.113.263.046.015.074.225.395.344.473.585.264.544.073.833.976.054.022.692.525.216.554.284.455.154.455.373.803.734.492.442.763.333.016.433.552.63例
16、例9-1 求双侧求双侧95%的参考值范围。的参考值范围。07.1 ,41.4sxmmol/L).516 ,231(07.196.141.496.1sx 参考值范围应用时注意:参考值范围应用时注意:人数人数上限值上限值(95%)NormalPatient假阴性假阴性假阳性假阳性(三)质量控制(三)质量控制 实验中的检测误差一般服从正态分布,为实验中的检测误差一般服从正态分布,为了控制实验中的检测误差,常以了控制实验中的检测误差,常以 作为上、作为上、下警戒值,以下警戒值,以 作为上、下控制值。作为上、下控制值。(四)正态分布是很多统计方法的基础(四)正态分布是很多统计方法的基础 多种统计方法均要
17、求分析的指标服从正态分布或近多种统计方法均要求分析的指标服从正态分布或近似正态分布。对于非正态分布资料,应先作变量转换,似正态分布。对于非正态分布资料,应先作变量转换,使转换后的资料服从或近似服从正态分布,然后就可按使转换后的资料服从或近似服从正态分布,然后就可按正态分布的方法进行统计处理。正态分布的方法进行统计处理。Sx2Sx3课堂总结提问课堂总结提问正态分布有何特征?正态分布有何特征?何谓标准正态分布?有何意义?何谓标准正态分布?有何意义?简述正态分布曲线下面积规律。简述正态分布曲线下面积规律。简述参考值范围指定的步骤和方法。简述参考值范围指定的步骤和方法。随机抽样调查某市男孩出生体重得数
18、据如下:体 重(kg)人 数 2.0-1 2.2-2 2.4-5 2.6-10 2.8-12 3.0-24 3.2-23 3.4-22 3.6-17 3.8-7 4.0-3 4.2-2 4.4-4.6 1 问问:(1)理论上理论上95%男孩男孩出生体重在什么范围出生体重在什么范围?(2)某男孩出生体某男孩出生体重为重为4.51kg,如何评价如何评价?(1)(2.43,4.14)(2)超重超重 某市某市19741974年为了解该地居民发汞的基础水平年为了解该地居民发汞的基础水平,随机抽样随机抽样检测该地无汞作业接触史的健康居民检测该地无汞作业接触史的健康居民238238人的发汞含量如下人的发汞含
19、量如下:发汞值 1.5 3.5 5.5 7.5 9.5 11.5 13.5 15.5 17.5 19.5(umol/kg)人 数 20 66 60 48 18 16 6 1 0 3 如何制定该地健康居民的发汞参考值范围?如在以后工作中测如何制定该地健康居民的发汞参考值范围?如在以后工作中测得某人发汞值为得某人发汞值为17.817.8 mol/kg,mol/kg,如何判断?如何判断?12.5 mol/kgmol/kg不正常不正常THE END362.6359.7285.9300.2333.6334.0288.8338.5341.9344.6337.5298.3364.2367.1338.1316
20、.9332.7324.0282.6369.8398.7338.7308.9392.1368.7352.6378.2346.1278.6318.3323.2322.6382.1322.6309.6352.0372.5399.8335.6341.1371.0355.9362.7368.1332.4405.6328.8358.8371.0387.5413.6348.7392.7401.0313.6366.8387.2319.7329.4352.0372.5399.8335.6341.1371.0355.9362.7368.1332.4405.6328.8358.8362.6359.7285.9300
21、.2333.6334.0288.8338.5341.9344.6337.5298.3364.2367.1338.1316.9332.7324.0282.6369.8398.7338.7308.9392.1368.7352.6378.2346.1278.6318.3323.2322.6382.1322.6309.6352.0376.2388.4344.6308.6347.0428.7369.1311.4376.3349.4289.2366.8371.0387.5413.6348.7392.7401.0313.6366.8387.2319.7329.4357.5372.5399.8335.6341
22、.1371.0355.9362.7368.1332.4405.6328.8357.5387.5342.3366.7387.6332.7329.4表表9-1 2002年某市年某市150名正常成年男子的尿酸浓度(名正常成年男子的尿酸浓度(mol/Lmol/L)2002年某市正常成年男子尿酸浓度的频数表年某市正常成年男子尿酸浓度的频数表尿酸浓度尿酸浓度(mol/Lmol/L)频数频数270 22859300113152233024345273602037515390114058420435 1051015202530尿酸浓度(尿酸浓度(mol/Lmol/L)频数频数(人)(人)图图9-1 2002年某市年某市20岁岁-29岁正常成年男子的尿酸浓度的频数分布岁正常成年男子的尿酸浓度的频数分布270 300 330 360 390 420对于连续型随机变量对于连续型随机变量 ,设,设 为任意实数,为任意实数,且且 ,若,若 存在,存在,则称它为则称它为 在点在点 的概率密度,记为的概率密度,记为 ,即,即 概率密度的定义概率密度的定义简单来说,就是在简单来说,就是在x附近增加单位随机变量的概率增加值。附近增加单位随机变量的概率增加值。THE END