医科大学精品课件:概率分布(研).ppt

上传人(卖家):金钥匙文档 文档编号:443991 上传时间:2020-04-07 格式:PPT 页数:74 大小:3.08MB
下载 相关 举报
医科大学精品课件:概率分布(研).ppt_第1页
第1页 / 共74页
医科大学精品课件:概率分布(研).ppt_第2页
第2页 / 共74页
医科大学精品课件:概率分布(研).ppt_第3页
第3页 / 共74页
医科大学精品课件:概率分布(研).ppt_第4页
第4页 / 共74页
医科大学精品课件:概率分布(研).ppt_第5页
第5页 / 共74页
点击查看更多>>
资源描述

1、3 概率分布,统计 描述,抽样分布参数估计:点估计、区间估计,定量资料,定性资料:频率型指标、强度型指标、比,统计表和统计图,统计 推断,变量,概率分布:正态分布、二项分布、Possion分布,假设检验,实验设计,分组数,实验设计:三要素、四原则、实验设计方案、样本含量估算,教学内容:,应了解具有普遍意义的、样本所在总体分布的情况,随机变量的分布常见的有三种类型:,3.1.1 正态分布概念和特征 3.1.2 标准正态分布 . 3.1.3 正态分布的应用 . 3.1.4 正态分布的判断 .,3.1.1 正态分布的概念和特征,举例: 某妇产科医生观察1402例临产母亲体重资料(kg),试述其体重频

2、数分布的特征。,表5-1 某医院1402例待分娩孕妇体重频数分布, ,作图:以体重测量值为横轴,频率密度为纵轴作出直方图,此图即称为频率密度图;纵轴表示的是每个组段内单位长度所占有的频率。,图5-1 体重频率密度图,若将各直条顶端的中点顺次连接起来,得一条折线。当样本量 n 越来越大时,组距越来越小,折线就越来越接近一条光滑的曲线。,图5-1 体重频率密度图,图5-2 概率密度曲线示意图,正态分布( normal distribution): 是描述连续型随机变量最重要的分布,又称高斯分布(Gauss distribution)。 医学研究中许多正常人的生理、生化指标的变量分布呈正态分布或近似

3、正态分布。,图5-1 体重频率密度图,由于频率的总和为1,所以该曲线下横轴上的面积为1 面积=频率,正态分布的密度函数,即正态曲线的函数表达式,正态分布曲线:两个参数 和决定了x的概率分布,习惯上用 N (, 2)表示均数 ,标准差的正态分布。,当固定不变时,越大,曲线沿横轴越向右移动;反之, 越小,则曲线沿横轴越向左移动,所以叫正态曲线N(, 2)的位置参数, 。, 位置参数: ,图5-4 正态分布位置随参数变换示意图, 形状参数:,图5-6 正态分布形态随参数变换示意图,当固定不变时,越大,曲线越平阔;越小,曲线越尖峭, 叫正态曲线N(, 2)的形状参数。,1. 单峰、对称分布,对称轴 x

4、=,2. 正态分布N (, 2) 中的两个参数: : 位置参数,决定曲线在横轴上的位置; 增大曲线沿横轴向右移, 减小曲线沿横轴向左移。 : 形状参数,越大数据越分散,曲线越“矮胖”,越小数据越集中,曲线越“瘦高” 。,4. x 取值从- 至+ ,相应的概率密度函数f (x) 对应的曲线位于X轴的上方,与X轴永不相交,正态变量在x=时,概率 f (x)取值最大,两边逐渐减少。,3. 当 x=时, f (x)取最大值,即 均数位于曲线的最高处。峰值为:,(5)正态分布曲线下面积的规律,1.正态曲线下累计频数的总和等于 1,则: 横轴上曲线下的面积(概率)就等于 或 1; 均数两侧的面积(概率)各

5、占 50%。,- a b,- a,2.正态曲线N (, 2)下,如下 x 值对应的面积规律:,3.1.2 标准正态分布,由, 决定的正态分布曲线 N (, 2)具有多样性,为了应用方便,常将正态概率函数中的 x 作如下变量代换,令: Z称叫对应于观测值x的标准得分(standard score)。把Z代入概率密度函数 ,得标准正态分布的概率密度函数: 相对于正态变量 x,Z 没有度量单位。根据 u 的不同取值,可绘出标准正态分布的图形。,任意正态分布曲线 XN(,2),标准正态分布曲线 XN(0,1),将一般正态分布曲线的 的位置平移到原点,再以标准差为横轴单位,这样就把原来个别的正态分布转换

6、为一般的标准正态分布 N(0,1),亦称为 Z分布。,采用定积分的办法,对函数式 (1) 或 (2) 定积分,算得从 - 到 x 累计面积,从而推算出该区间事件发生的概率值。 .,图 6 正态分布(左)及标准正态曲线下(右)的累计面积,例3-1:设ZN(0,1),试计算: (1)Z 取值区间在(- , - 1.96) 内的概率P ? (2)Z 取值区间在(+1.96 ,+ ) 内的概率P ? (3)Z 取值区间在(- 1.96 ,+1.96)内的概率P ?,解析:,ZN (0,1),-1.96,95%,故:求一般正态分布N(,2)曲线下的面积:, 先求 Z 值:, 根据 Z 值在表中查出相应的

7、面积值,当总体均数和总体标准差未知时,就用样本均数和样本标准差来代替计算。,所以对正态分布或近似正态分布资料,只要求出均数和标准差,便可就其频数分布作出概略估计了。,X= -1.96时,所对应的左侧累积概率是多少? X= +1.96时,所对应的右侧累积概率是多少? X在( -1.96 , +1.96 )间对应概率是多少?,正态分布N (, 2)下:,ZN (0,1),95%,-1.96,2.5%,2.5%, +1.96,N (, 2),95%,常用的正态分布、标准正态分布曲线下面积规律,3.1.3 正态分布的应用,1. 概率计算:120 名 8 岁男孩身高均数 123.02 cm,标准差为 4

8、.79 cm,试估计: (1)身高在130以上者占该地8岁男孩总数的百分比;(2)身高在120128者占该地8岁男孩总数的百分比;(3)该地80%男孩的身高集中在哪个范围?,解析:,N (0,1),7.21%,7.21%,(2)身高在120128者占该地8岁男孩总数的百分比;,(3)该地80%男孩的身高集中在哪个范围?,解析:,N (123.02,4.792),解析:,120cm,128cm,-0.63,1.46,58.65%,58.65%,N (123.02,4.792),2. 确定医学参考值范围,参考值范围(reference range):指特定“正常”人群的解剖、生理、生化指标及组织代

9、谢含量等数据中大多数个体取值所在的范围。,1. 所谓“正常人”不是指“健康人”,而是指排除了对所研究的指标有影响的疾病和有关因素的特定人群,必须是随机选择的。 2.样本含量足够大:100例以上,举例:制定成年健康女性血红蛋白的参考值范围,制定步骤:,首先要确定一批样本含量足够大的“正常人”,进行样本相关指标测量,整理数据,进行资料分布类型的诊断。, 百分位法:适用于任何分布类型资料,特别是偏态分布资料以及一端或两端无确切数值的资料。,如95%参考值范围:,以不同的方法计算参考值范围:,0 100,而后根据指标的实际用途确定单侧或双侧界值。,根据研究目的和使用要求选定适当的百分界值,最常用的是9

10、5%。,N (0,1 ),N (, 2 ), 正态分布法:适用于正态或近似正态分布资料,举例1 调查某地120名健康女性血红蛋白,直方图显示其分布近似正态, 试估计该地健康女性血红蛋白的95%参考值范围。,解析:,1. 分布近似正态,2. 过高过低均为异常,3. 求上、下界值,上界:,下界:,所以,该地健康女性血红蛋白的95%参考值范围是(97.41,137.39)g/l。,单侧临界值:标准正态分布单侧尾部面积等于时所对应的正侧变量值,记作Z。,若按左单侧算,则是97.5% 参考值范围,按左单侧算,是95% 参考值范围,举例2: 某地调查120名健康成年男性的第一秒肺通气量得均数 X =4.2

11、(L), 标准差S =0.7(L),试据此估计其第一秒肺通气量的95%参考值范围。,解析:,1. 分布近似正态,2. 仅过低为异常,3. 求下界值,下界:,所以,该地健康成年男子第一秒肺通气量的95%参考值范围为不低于3.05(L)。,单侧临界值:标准正态分布单侧尾部面积等于时所对应的正侧变量值,记作Z。,双侧临界值:标准正态分布双侧尾部面积之和等于时所对应的正侧变量值,记作Z/2。,正确地理解参考值范围:,没有绝对的正常和异常,正常中含有“异常”,异常中含有“正常”; 不同实验环境、不同仪器检测的灵敏度和精确度不完全一样; 某些指标有必要按性别、年龄或其它因素分别制定参考值。,3. 进行质量

12、控制,基本原理: 许多临床检验指标,当影响某一指标的随机因素很多,而每个因素所起的作用均不太大时,这个指标的随机波动属于随机误差,则往往服从正态分布。 如果某一差异仅是由个体差异和随机误差导致的,那么观察结果服从正态分布。,质量控制图,质量控制图1,质量控制图2,目前推崇的接近零不合格过程的有效控制: 实现六西格玛质量控制,判断异常的8种情况是: 有1个点距中心线的距离超过控制线; 在中心线的一侧连续有9个点; 连续6个点稳定地增加或减少; 连续14个点交替上下; 连续3个点中有2个点在警戒线外; 连续5个点中有4个点距中心线距离超过1个标准差 中心线一侧或两侧连续15个点距中心线距离超出都在

13、1个标准差以内; 中心线一侧或两侧连续8个点距中心线距离超出都超出1个标准差范围。,4. 正态分布是许多统计方法的理论基础,后续课的内容许多方法,都是以正态分布的原理来分析的。t 分布、 分布和F分布等都是正态分布基础上推演过来。 许多非正态分布的资料, 当观察例数足够多时, 也趋于正态分布, 可用近似正态原理来分析, 也可将一些非正态分布的资料转化为正态分布来处理。,3.1.4 正态分布的判断,如何判断一组数据是否符合正态分布:,1. 根据文献报道 例如:文献报道中学生的体重、肺活量服从正态分布,则可沿用文献的作法对数据进行处理。 2. 根据经验或专业知识判断: 例如:根据专业知识,同性别健

14、康成人的红细胞数、血红蛋白含量、脉搏数都近似正态分布,而正常人的血铅含量近似对数正态分布。,3. 用统计软件进行正态性检验: SPSS、SAS、EXCEL等,方法,绘制图形直接观察,专门检验方法考察,1.“直方图”或“茎叶图” 2.“P-P图”或“Q-Q图”,“直方图”或“茎叶图”: 可直接地进行观察, 但不能直观地给出数据分布与正态分布相关多少的信息,2. “P-P图”或“Q-Q图”地:直观地表示数据是否符合所考察的正态分布:,P-P图:比较变量的实际累积概率和正态分布的理论累 积概率的符合程度。,去势P-P图:分布的残差图,实际累积概率,理论累积概率,若残差的绝对值0.05,基本认为服从N

15、(0,1),Q-Q图:根据变量的实际分位数和与理论分布进行绘图,并据此判断变量是否服从 特定的分布。,实际累积值,理论累积值,若残差的绝对值0.05,基本认为服从N(0,1),去势Q-Q图:分布的残差图,举例:100 名健康成年女子血清蛋白含量表, 试对其 进行正态性检验。,【电脑实现】SPSS,结果输出:,绘制图形直接观察:,1. 直方图,2. Q-Q图,去势Q-Q图,SPSS规定: 当n 5000 时,结果以Shapiro-Wilk (W检验)为准; 当n 5000时,结果以Kolmogorov- Smirnov (D检验) 为准,H0:呈正态分布;H1:不呈正态分布 =0.10,正态性检

16、验:,注意: 很多统计方法的前提是变量服从正态分布,应该建立这种意识, 对变量是否服从正态分布应该通过检验确定。 在SPSS 中有很多方法可以进行正态分布的检验, 在使用中可以根据自己对SPSS 熟悉程度选择一种方法对正态分布进行检验。,正态分布图形有其明确的特征,是一典型的钟形曲线。 正态分布的两个参数是均数和标准差, 为了应用方便,常对任意一个正态分布的随机变量X作Z变换,将其转为标准正态曲线。 应用正态分布曲线下的面积分布规律,可以估计医学参考值范围,概率及进行质控等,正态分布是一种重要的连续型变量分布形式。,小 结,选择题:,2.正态分布曲线下右侧5对应的分位点为 A.+1.96 B.

17、-1.96 C.+2.58 D.+1.64 E.-2.58,1.正态分布的两个参数, 对应的正态曲线平行右移 A.增大 B. 减小 C. 增大 D. 减小 E. 增大同时增大,3.正态分布的特点有: A. 算术均数=几何均数 B. 算术均数=中位数 C. 几何均数=中位数 D. 以上都没有,分析题 : 为估计某地居民尿汞值的参考值范围, 测得某地200名正常成人的尿汞值如下,试计算尿汞值的95%医学参考值范围。,思考题:,1. 如何判断一组数据是否符合正态分布? 根据文献报道 根据经验或专业知识判断 借助统计软件上的正态性检验 2. 对称分布在 范围内,也包括95%的观察值吗? 3. 如何判断

18、一组资料是否服从Poisson分布?,计算题: 1. 某地抽查120份黄连中小蘖碱含量(mg/100g)得平均数为4.38,标准差为0.18,假设数据服从正态分布,问: (1)95%黄连样品中小蘖碱含量在什么范围? (2)有一份黄连样品,小蘖碱含量为4.80,怎样评价?,答案:,根据公式,另:(4.8-4.38)/0.18=2.331.96,所以可认为小蘖碱含量不正常。,2. 某地1998年抽样调查了100名18岁男大学生身高,其均数=172.70cm,标准差= 4.01 cm。 (1) 估计该地18岁男大学生身高在168 cm以下者占该地18岁男大学生总数的百分数; (2) 估计该地18岁男

19、大学生身高在177 cm以下者占该地18岁男大学生总数的百分数。,答案:,查附表得, (u)=0.1210,即该地18岁男大学生身高在168 cm以下者占该地18岁男大学生总数的12.10%。,查附表得, (-1.07)=0.1423, 则 (u)=1- (-1.07)=1-0.1423=0.8577 即该地18岁男大学生身高在177 cm以下者占该地18岁男大学生总数的85.77%。,3. 已知某地正常成年女子的血清总蛋白数服从正态分布,调查了该地110名正常成年女子,得样本血清总蛋白均数为72.8g/L,标准差为3.8g/L,试估计该地正常成年女子血清总蛋白介于66.0 75.0 g/L之间的比例,及110名正常成年女子中血清总蛋白介于66.075.0 g/L之间的人数。,答:大样本,可将样本均数、标准差 S 作为总体、 的估计值,即将其血清总蛋白数近似看作服从N(72.8, 3.82)的正态分布。 1. 将变量作如下标准化变换:,2. 查 u 值表得:,THANK YOU!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 大学
版权提示 | 免责声明

1,本文(医科大学精品课件:概率分布(研).ppt)为本站会员(金钥匙文档)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|