医学精品课件:02第二章数值变量资料的统计描述.ppt

上传人(卖家):金钥匙文档 文档编号:438498 上传时间:2020-04-06 格式:PPT 页数:72 大小:5.97MB
下载 相关 举报
医学精品课件:02第二章数值变量资料的统计描述.ppt_第1页
第1页 / 共72页
医学精品课件:02第二章数值变量资料的统计描述.ppt_第2页
第2页 / 共72页
医学精品课件:02第二章数值变量资料的统计描述.ppt_第3页
第3页 / 共72页
医学精品课件:02第二章数值变量资料的统计描述.ppt_第4页
第4页 / 共72页
医学精品课件:02第二章数值变量资料的统计描述.ppt_第5页
第5页 / 共72页
点击查看更多>>
资源描述

1、,2020/4/6,1,第二章 数值变量资料的统计描述,医学统计学 人民卫生出版社,学习要求 掌握:常用的集中趋势指标和离散趋势指标以及各指标的适用条件;正态曲线下面积的分布规律;医学参考值范围的制定。 熟悉:数值变量资料频数表的编制方法和用途。 了解:正态分布的概念及特征;质量控制的意义。,第一节 频数分布表,频数是指变量值出现的次数或个数。 频数分布就是变量在其取值范围内各组段的分布情况。 频数分布可以用频数分布表、频数分布图来表示。编制频数分布表是统计分析资料的第一步。 下面以例2.1,2013年某小学120名8岁健康男孩身高(cm)测量资料为例讲解如何编者频数分布表和频数分布图。,例2

2、.1 2013年某小学120名8岁男孩身高(cm)测量资料,最小值,最大值,一、频数表的编制,计算极差:即最大值和最小值之差,本例: R=134.5-112.3=22.2(cm) 确定组段和组距 :分组的目的是反映数据分布的特征,组数通常根据观察例数的多少而定,一般以815个组数为宜。各组段的起点称为“下限”,终点称为“上限”。每个组段都是半开半闭区间,即只包括下限,不包括上限。为计算方便,组距i= R/10,再适当取整。 本例组距i=R/10=2.22(cm),取整数为=2cm。 各组段不能重叠,每个组段都是半开半闭区间,第一组段应包括所有观察值中的最小值,其下限一般取包括最小值的、较为整齐

3、的数值。最后一个组段必须包括最大值,其余各个组段首尾相连,绘制频数表 统计出各组段内的数据个数,绘制频数表. 见表2-1。 用划记或分卡法将各观察单位归如各组段,然后清点各组段内观察值个数即得各组段频数。,表2-1、120名8岁健康男孩身高(cm)资料频数分布,最小组段包含最小值,最大组段包含最大值,相邻组段不能有重复数字,二、频数分布图,为了能更直观地了解频数分布情况,通常在编制频数分布表的基础上,绘制频数分布图。可以更加直观形象地表达频数分布的信息,并可与频数分布表互为补充。 常见的频数分布图为直方图(histogram),是一种用垂直条段代表频数分布的图形,以身高组段为X轴,标度是各组的

4、组距;以频数为Y轴,标度是各组频数大小。见图2-1。,三、频数分布表和频数分布图的主要用途,1揭示频数分布的特征 集中趋势 离散趋势 2揭示频数分布的类型,对称分布:正态分布 Symmetric Normal distribution,偏态分布 Skewed distribution,正偏态分布 Positively skewed,负偏态分布 Negatively skewed,资料分布,正态分布:中间高、两边低、左右对称,负偏态分布:长尾向左延伸,正偏态分布:长尾向右延伸,三、频数分布表和频数分布图的主要用途,3便于发现某些特大或特小的可疑值:在频数分布表的两端,连续出现几个组段的频数为0后

5、,又出现一些特大或特小值,让人怀疑这些数据的准确性,对于这些数据需要进一步的检查和核对。 4便于进一步计算统计指标和做统计分析。 5大样本资料的陈述形式:描述一个大样本资料时,如将所有原始数据都罗列出来,往往显得过于冗长繁琐,令人毫无印象,也看不出数据的分布特征与类型。但是如果改用频数分布表描述,能让人快速判断出数据的分布特征和类型,令人印象深刻。,2.2 集中趋势指标,集中趋势指标,主要用于描述一组同质数值变量的平均水平或集中趋势,亦称平均数。常用的主要有: 算术均数 几何均数 中位数,一、算术均数,简称均数,总体均数用表示,样本均数用 表示。用于描述正态分布资料或近似正态分布资料。 直接法

6、 常用于小样本资料。公式为: 加权法 用于频数表资料。公式为,二、几何均数,用于描述等比关系资料或对数正态分布资料,用G表示。 直接法 用于小样本数据。公式为: 加权法 用于样本中有较多相同变量值或频数表资料。,有5个人的血清抗体效价为1:10,1:100, 1:1000,1:10000,1:100000。求平均血清抗体效价。,5个人的平均血清抗体效价为1:1000,50人的血清平均抗体效价为1:41.70,即1:42,计算几何均数对变量值的要求,不能同时有正值和负值 不能有0 若全为负值,应先按正值计算,得出结果后再加负号。,三、中位数及百分位数,中位数,用M表示,指将一组变量值按从小到大的

7、顺序排列,位次居中的变量值。 用于描述偏态分布资料或分布状态不明的资料、变量值中有个别过小或过大值、分布一端或两端无确定数据的资料平均水平。,直接法 先将变量值按从小到大的顺序排列。 当n为奇数时,位置居中的变量值即为中位数。 当n为偶数时,位置居中的两个变量值的均数即为中位数。,中位数,n为偶数,n为奇数,有7个人的血压(收缩压)测定值(mmHg)为:120、123、125、127、128、130、132, 求中位数。,某病患者8人的潜伏期(天)分别为5,6,8,9,11,11,13,16。求中位数。,8人的平均潜伏期为10天,即M10(天),中位数,7人血压的中位数为M=127(mmHg)

8、,频数表法 先将变量值按从小到大的顺序列出频数表,并分别计算累计频数和累计频率,然后找出中位数所在组段,代入下列公式求中位数。 式中L为中位数所在组段下限,i为该组段组距, 为该组段的频数, 为小于L的各组段累计频数。,上限值U,i; fm,中位数Md,下限值L,百分位数,是一种位置指标,以 表示。 理论上有x比 小,有(100x)比 大。 百分位数计算公式如下:,表2-1 120名8岁健康男孩身高(cm)资料频数分布,中位数的特点,特定的百分位数(P50),在全部观察值中有一半比它大,有一半比它小,应用最广。 不是由全部观察值计算出来的,因此不受特大值、特小值的影响,适用于描述偏态资料的集中

9、位置。 只受居中观察值波动的影响,因而不敏感。 用中位数代替均数、几何均数会减低灵敏度。,均数、几何均数和中位数的相异点,2.3 离散趋势指标,请比较以下3组数据的离散趋势: 现有三组健康女大学生口腔体温测得值()如下 1组 36.8 36.9 37.0 37.1 37.2 2组 36.5 36.9 37.0 37.1 37.5 3组 36.5 36.7 37.0 37.3 37.5 三组均数均为37.0。,一、极差,极差也称全距,以R表示,是一组变量值中最大值和最小值的差。 其优点是简单明了。但缺点是仅考虑了资料的最大值和最小值,不能反映组内其他数据的变异程度。 上述资料 R1=37.2-3

10、6.8=0.4 R2=37.5-36.5=1.0 R3=37.5-36.5=1.0 即第一组的离散趋势最小,第2、3组离散趋势相同。显然这样的判断过于简单,不能反映资料内部数据的变异度情况。,二、四分位数间距,,称为下四分位数,有四分之一变量值比第25百分位数小。 ,称为上四分位数,有四分之一变量值比第75百分位数大。 四分位数间距Q即为 与 之差。即Q= 适用于偏态分布资料,比全距稳定,但仍未考虑每个变量值的变异程度。,表2-1 120名8岁健康男孩身高(cm)资料频数分布,离均差之和 离均差 有正有负,正负相抵使得总体上 用 反映离散趋势,数学上处理比较困难 离均差平方和 来反映变异,三、

11、方差,自由度n1限制条件的个数,用表示。(n1):当 选定时,n个变量值中能自由变动的变量值的个数。,方差优点 方差越大,资料的离散程度越大(全面考虑了每个观察值)。 不受观察值个数的影响。 方差缺点 一些资料不适用于以平方表示。 单位为原始单位的平方单位,不能跟均数结合起来用来反映资料的分布特点。,四、标准差,标准差是方差的平方根,标准差的单位和变量单位一致。与方差一样,标准差只取正值。总体标准差记为,样本标准差用s表示。,标准差的计算方法 直接法 加权法,表3-2 加权法计算标准差,将数值代入计算式,标准差的应用,描述事物的变异程度:适用于对称分布资料 衡量均数的代表性:资料的均数相近,度

12、量单位相同的条件下,标准差大,表示观察值离均数较远,均数代表性差,表明事物内部数据的变异度大;反之,标准差小,则反映均数的代表性较好,事物内部数据的变异度小 结合样本均数描述频数分布特征:描述正态分布资料的分布特征和估计医学参考值范围 计算变异系数和标准误,标准差优点,根据全部数值计算; 适用于代数法处理; 受抽样变动的影响甚小。,五、变异系数,变异系数表示数据分布的相对离散程度,用于比较均数相差悬殊的两组或多组资料的离散程度,或比较度量衡单位不同的两组或多组资料的变异程度。用CV表示。,2.4 正态分布,一、正态分布的概念和特征 正态分布的密度函数f(X)为: 式中为总体均数,为总体标准差,

13、为圆周率,e为自然对数的底,、e皆为常量,仅X为变量。以X为横轴,f(X)为纵轴,当、已知时,即可按上式绘出正态分布曲线的图形。,(二) 正态分布的特征, 集中性:正态曲线在横轴上方均数处最高。 对称性:正态分布以均数为中心,左右对称。 正态分布有两个参数,即均数与标准差。是位置参数;是形状参数,决定曲线的高矮胖瘦。通常用N(, 2)表示均数为、方差为2的正态分布,用N(0,1)表示均数为0,方差为1的标准正态分布。 正态分布曲线下的面积有一定规律。,正态分布图形特点: 钟型 中间高 两头低 左右对称 最高处对应于X轴的值就是均数 曲线下面积为1 标准差决定曲线的形状,二、标准正态分布,标准正

14、态分布:指均数为0,标准差为1的正态分布。常称z分布或u分布。 标准正态分布与正态分布的转换公式:,即若x服从正态分布N(,2),则z就服从均数为0,标准差为1的正态分布。,标准正态分布,三、正态曲线下面积的分布规律,正态曲线下面积的意义:正态曲线下一定区间内的面积代表变量值落在该区间的概率。整个曲线下的面积为1,代表总概率为1。 曲线下面积的求法:定积分法和标准正态分布法,一个服从正态分布的指标,只要求得其均数与标准差,就能全面掌握该指标频数的分布规律。,正态分布曲线下的面积,1.64范围内的面积为90% 1.96范围内的面积为95% 2.58范围内的面积占99%,1. 标准正态分布: 求曲

15、线下(z1,z2)范围内的面积。,z0:查表,分别求从-到z2与 从-到z1的面积; 两者之差为所求面积。,z2,z1,(2) z0:利用正态分布的对称性求曲线 下从-到z范围的面积。 例:从-到z=1.76范围内的面积。,1.76,1.76, 查表, - 到u=-1.76的面积 为0.0392 可知从z=1.76到+范围内的面 积也是0.0392 因曲线下总面积为1,故从-到z=1.76范围内的面积为: 1-0.0392= 0.9608,2. 非标准正态分布:求曲线下任意(x1,x2)范围内的面积。,先作标准正态变换; 再查标准正态分布表求得面积。 例:已知110名7岁男童身高 。现欲估计该

16、地身高界于116.5cm到119.0cm范围内7岁男童比 例及110名7岁男童中身高界于此值范 围内的人数。,(1) 标准正态分布变换:,(2) 查表得:,(3) 求D:,估计该地身高界于116.5119.0cm范围内的7岁男童比例为13.92%; 估计110名7岁男童中有15名男童的身高界于116.5119.0cm范围内。,正态分布的应用,正态分布的判断和检验:经验法和正态性检验 描述正态分布资料的频数(频率)分布范围 医学参考值范围的制定(后) 用于异常值的剔除 用于质量控制:为了控制实验中的误差,实验室的质量控制中,常以 作为上、下警戒限;以 作为上、下控制限。 (2s和3s是1.96s

17、与2.58s的近似值) 正态分布理论的其他应用,正态分布的应用,例:从某地随机抽取100名一年级男大学生,测得平均身高为166.2cm,标准差为5.3cm,现欲估计该地身高界于低于160cm,身高高于180cm,以及身高在165cm175cm范围内的一年级男大学生的比例和人数。,查标准正态分布表得: (z1) (0.02)0.4920 (z2) (1.66)0.0485 1(z2)+ (z1)0.4595,医学参考值范围的制定,正常值范围(或医学参考值范围):医学上常把绝大多数正常人的某指标值的波动范围称为该指标的正常值范围(或医学参考值范围) 。 注意:正常人并非指没有任何疾病的人,而指同质

18、前提下排除了足以影响所测指标的因素的人。,正常值范围的确定步骤,选定正常人群,并抽取一定的样本含量(一般大样本)。 测定方法应统一、准确。 决定是否分组制定医学参考值范围 根据专业知识确定用单侧或双侧范围。 根据需要确定可信度。,6. 按资料特点选定不同方法计算正常值范围上、下限。 正态分布法:适于正态分布资料。对数正态分布的资料取对数后可用正态分布法估计。 百分位数法:适于偏态分布资料或分布不明类型的资料。所需样本含量较大。,正常值范围的确定步骤,表1 正常值范围的界值,即成年男子第一秒肺通气量不低于3.05L。,对数正态分布法 适用于对数正态分布资料,双侧上界 双侧下界 单侧上界 单侧下界,例:某市调查了200例正常成人血铅含量,估计该市成人血铅含量95%医学参考值范围。 单侧上界,某市正常成人血铅含量频数表,3. 百分位数法 常用于偏态分布资料,双侧上界 P97.5 双侧下界 P2.5 单侧上界 P95 单侧下界 P5,某市正常成人血铅含量频数表,成人血铅正常值38.8ug/100g,2020/4/6,72,Thank You !,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 中职 > 医药护理
版权提示 | 免责声明

1,本文(医学精品课件:02第二章数值变量资料的统计描述.ppt)为本站会员(金钥匙文档)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|