1、正态分布及其应用 Normal distribution and its applications 统计学中最重要的理论分布之一 魏永越 2 正态分布(Normal distribution) 法国概率论学者狄莫弗 德国数学家Gauss 最早用于物理学、天文学 Gaussian distribution 魏永越 3 魏永越 4 为什么如此摆放奖品为什么如此摆放奖品? 平时平时,我们很少有人会去关心小球下我们很少有人会去关心小球下 落位置的规律性落位置的规律性,人们可能不相信它是人们可能不相信它是 有规律的有规律的。 高尔顿钉板试验高尔顿钉板试验 正态分布的背景一个街头赌博游戏 魏永越 5 O
2、x -8 -7 -6 -5 -4 -3 -2 -1 1 2 3 4 5 6 7 8 这条曲线就是我们将要介绍的这条曲线就是我们将要介绍的正态分布正态分布曲线。曲线。 正态分布的背景高尔顿钉板试验 魏永越 6 124 132 140 148 156 164 0 0.10 0.20 0.30 0.40 频 率 图 某市120名12岁男童身高(cm)的频数分布 魏永越 7 组 段 频 数 频 率 124 1 0.0083 128 2 0.0167 132 10 0.0833 136 22 0.1834 140 37 0.3083 144 26 0.2167 148 15 0.1250 152 4 0
3、.0333 156 2 0.0167 160164 1 0.0083 合合 计计 120 1.0000 极差=160.9-125.9=35 分10组,组距=极差/10=35/10=3.5,组距取 4 下界 124 ,上界164 魏永越 8 身高的分布 (a) (b) (d) (c) 魏永越 9 正态分布的概率密度函数 如果随机变量X的概率密度函数 则称X服从正态分布,记作XN(,2),其中, 为分布的均数, 为分布的标准差。 X f Xe 2 2 () 2 1 () 2 (- X +) 魏永越 10 正态分布图示 x 0 .1 .2 .3 .4 f(x) 魏永越 11 方差相等、均数不等的正态
4、分布图示 3 1 2 魏永越 12 均数相等、方差不等的正态分布图示 2 1 3 魏永越 13 正态分布的特征 正态分布有两个参数(parameter),即位置 参数(均数)和变异度参数(标准差)。 高峰在均数处; 均数两侧完全对称。 正态曲线下的面积分布有一定的规律。 魏永越 14 正态曲线下的面积规律 X轴与正态曲线所夹面积恒等于1 。 对称区域面积相等。 S(-,-X) S(X,)S(-,-X) 魏永越 15 正态曲线下的面积规律 对称区域面积相等。 S(-x1, -x2) -x1 -x2 x2 x1 S(x1,x2)=S(-x2,-x1) 魏永越 16 正态曲线下的面积规律 -4 -3
5、 -2 -1 0 1 2 3 4 -3 -2 - + +2 +3 S(- , -3 )=0.0013 S(- , -2 )=0.0228 S(- , -1 )=0.1587 S(- , )=0.5 S(- , +3 )=0.9987 S(- , +2 )=0.9772 S(- , +1 )=0.6587 S(- , )=1 魏永越 17 正态曲线下的面积规律 -4 -3 -2 -1 0 1 2 3 4 -3 -2 - + +2 +3 1-S( -3 , +3 )=0.0026 1-S( -2 , +2 )=0.0456 1-S( - , + )=0.3174 魏永越 18 正态曲线下的面积规律
6、 -4 -3 -2 -1 0 1 2 3 4 -3 -2 - + +2 +3 S(- , -3 )=0.0013 S(- , -2 )=0.0228 S(- , -1 )=0.1587 S(- , )=0.5 S(- , +3 )=0.9987 S(- , +2 )=0.9772 S(- , +1 )=0.6587 S(- , )=1 魏永越 19 正态曲线下的面积规律 -1.64 +1.64 5% 5% 90% 魏永越 20 正态曲线下的面积规律 -1.96 +1.96 2.5% 2.5% 95% 魏永越 21 正态曲线下的面积规律 -2.58 +2.58 0.5% 0.5% 99% 魏永越
7、 22 正态曲线下的面积规律 正态曲线下面积总和为1; 正态曲线关于均数对称;对称的区域内面积相 等; 对任意正态曲线,按标准差为单位,对应的面 积相等; -1.64 +1.64内面积为90%; -1.96 +1.96内面积为95%; -2.58 +2.58内面积为99%。 魏永越 23 标准正态分布 标准正态分布(standard normal distribution)是均 数为0,标准差为1的正态分布。 记为N(0,1)。 标准正态分布是一条曲线。 概率密度函数: u Xe 2 2 1 () 2 (- u +) 魏永越 24 正态分布转换为标准正态分布 若 XN(,2),作变换: 则u服
8、从标准正态分布。 u称为标准正态离差(standard normal deviate) X u 魏永越 25 怎么用? 全国20岁正常女性身高 mean=158cm,SD=5cm 某女生升高155cm P = 0.2742 某女生升高170cm P = 0.9918 155 158 0.6 5 u 170 158 2.4 5 u 魏永越 26 标准正态分布曲线下面积(u) u 0.00 -0.02 -0.04 -0.06 -0.08 -3.0 0.0013 0.0013 0.0012 0.0011 0.0010 -2.5 0.0062 0.0059 0.0055 0.0052 0.0049 -
9、2.4 0.0082 0.0078 0.0073 0.0069 0.0066 -2.0 0.0228 0.0217 0.0207 0.0197 0.0188 -1.9 0.0287 0.0274 0.0262 0.0250 0.0239 -1.6 0.0548 0.0526 0.0505 0.0485 0.0465 -1.0 0.1587 0.1539 0.1492 0.1446 0.1401 -0.6 0.2743 0.2676 0.2611 0.2546 0.2483 -0.5 0.3085 0.3015 0.2946 0.2877 0.2810 0 0.5000 0.4920 0.484
10、0 0.4761 0.4681 0 u 魏永越 27 P = 0.2742 P = 0.9918 155 158 0.6 5 u 170 158 2.4 5 u 魏永越 28 正态分布的应用 估计频数分布 确定临床参考值范围 魏永越 29 估计频数分布 某项目研究婴儿的出生体重服从正态分布, 其均数为3067g,标准差为350g。若以 2500g作为低体重儿,试估计低体重儿的比 例。 首先计算标准离差: 查标准正态分布表: (-1.62)=0.0526 结果:估计低体重儿的比例为5.26%. 25003067 1.62 350 u 魏永越 30 某市120名12岁男童身高均数142.67cm,
11、标 准差为s=6.00cm。设该资料服从正态分布, 试求该地12岁男童身高在132cm以下者占该 地12岁男童总数的比例。 首先计算标准离差: 查标准正态分布表: (-1.78)=0.0375 结果:估计低体重儿的比例为3.75%. 132142.67 1.78 6 u 估计频数分布 魏永越 31 全国20岁正常女性身高 mean=158cm,SD=5cm 全国20岁正常男性身高 mean=172cm,SD=4cm 一20岁正常女生170cm 一20岁正常男生170cm U1=(170-158)/5 = 2.4 = P = 0.9918 U2=(170-172)/4 = -0.5 = P =
12、0.3085 魏永越 32 参考值范围(reference interval) 参考值范围又称正常值范围(normal range)。 什么是参考值范围: 是绝大多数正常人的某观察指标所在的范围。 绝大多数:90%,95%,99%等等。 确定参考值范围的意义: 用于判断正常与异常。 “正常人”的定义: 排除了影响所研究的指标的疾病和有关因素的 同质的人群。 魏永越 33 148 167 158 2.5% 2.5% 95% 魏永越 34 参考值范围确定的原则 选定同质的正常人作为研究对象 控制检测误差 判断是否分组(性别,年龄组) 单、双侧问题 选择百分界值(90%,95%) 确定可疑范围 魏永
13、越 35 单侧与双侧参考值范围 根据医学专业知识确定! 双侧:白细胞计数,血清总胆固醇, 单侧:上限: 转氨酶,尿铅,发汞 下限: 肺活量,IQ, 魏永越 36 正常人 病人 假阳性率 假阴性率 正常人与病人的数据分布重叠示意图(单侧) 魏永越 37 正常人 病人 假阳性率 假阴性率 正常人与病人的数据分布重叠示意图(单侧) 魏永越 38 正常人 病人 假阳性率 假阴性率 病人 正常人与病人的数据分布重叠示意图(双侧) 魏永越 39 设正常人数据分布的总体 均数为,总体方差为 病人 病人 正常人与病人的数据分布重叠示意图(双侧) 正常人 上限 下限 魏永越 40 正常人 N(,) 上限 下限
14、标准正态分布 N(0,1) 上限 下限 2.5% 1.96 ? 魏永越 41 双侧参考值范围的上限: 双侧参考值范围的下限: /2 /2 , RUX u so RUXu /2 /2 , RLX u so RLXu 魏永越 42 参考值范围的估计方法 方法 双侧 正态分布法 百分位数法 P2.5P97.5 Xus /2 肌酐(Crea) 36144 mol/L 魏永越 43 例 某地调查110名健康成年男性的第一秒肺通 气量得均数为4.2L,标准差为0.7L。请计算 90%的参考值范围。 注:标准正态分布中双侧90%界值为1.64 魏永越 44 例 已知100例肝功能正常的成年男性,其AST 均
15、数为28,标准差为10,95%分位数为45, 则其95%参考值范围为? P95 即 P5 P95 Xus /2 Xu s Xu s 魏永越 46 江苏省人民医院生化检验参考值范围 检查项目 正常值范围 单位 肌 酐(Crea) 36144 mol/L 尿素氮(Urea) 2.17.2 mmol/L 谷草转氨酶(AST) 45 U/L 谷丙转氨酶(ALT) 45 U/L 魏永越 47 练习 1 正态分布与标准正态分布有何区别? 2 正态分布N(,2) 中,-1.96至+1.64 者占多 大比例? 3 参考值范围涵义,确定原则。 魏永越 48 总结 正态分布是描述个体变异的重要分布之一, 也是统计学理论中的重要分布之一; 正态分布是一簇分布,由两个参数决定:均 数和标准差; 正态分布曲线下的面积是有规律的,且与标 准正态分布曲线下的面积对应(以标准正态 离差为单位)。 魏永越 49 需要掌握的内容 正态分布的性质 正态曲线下面积的分布规律 参考值范围确定的原则和方法 魏永越 50
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。