定量资料的统计描述解析课件.ppt

上传人(卖家):三亚风情 文档编号:3008853 上传时间:2022-06-21 格式:PPT 页数:30 大小:163KB
下载 相关 举报
定量资料的统计描述解析课件.ppt_第1页
第1页 / 共30页
定量资料的统计描述解析课件.ppt_第2页
第2页 / 共30页
定量资料的统计描述解析课件.ppt_第3页
第3页 / 共30页
定量资料的统计描述解析课件.ppt_第4页
第4页 / 共30页
定量资料的统计描述解析课件.ppt_第5页
第5页 / 共30页
点击查看更多>>
资源描述

1、定量资料的统计描述定量资料的统计描述 统计描述是统计分析的最基本内容,也 是统计分析的重要一部分.在统计学中经常 用统计指标和统计图表来揭示和反映原始 资料的数量特征和信息.第一节第一节 频数分布表与频数分布图频数分布表与频数分布图频数分布表频数分布表用于反映各变量(观察单位的某种特征)值及其相应频数之间关系的一类表格,我们称之为频数表.这里频数指对一种变量在多个观察单位中进行多次观察,其中某一变量值重复出现的次数.不同的资料类型编制频数表难易程度不同,其中计数资料和等级资料比较简单,而计量资料相对较繁杂些. 计量资料频数表的编制计量资料频数表的编制 一般情况下,样本含量小于30的统计资料无须

2、编制频数表,但对于大样本含量的资料,编制频数表有利于进一步的统计分析、且频数表本身也具有统计描述的作用. 求出极差 确定组段数 确定组距 列出各个组段 确定每一组段频数选 极差即最大值与最小值之差 一般 815 之间 组距=R/组段数,但一般取一方便计算的数字 第一组段包括极小值,最后一组段包括极大值,除最后一组段可同时标出上下限,其他组段只标出下限。 根据变量值大小把各观察单位归入各个组段 编制频数表的步骤编制频数表的步骤编制频数表步骤流程图编制频数表步骤流程图举例说明计量资料频数表的编制过程举例说明计量资料频数表的编制过程 某地 13 岁女孩 118 人的身高(cm)资料 151.3 13

3、4.1 143.7 144.9 152.2 145.0 146.4 141.2 143.3 156.3 142.0 141.3 142.5 145.5 149.5 141.1 150.6 140.9 147.2 144.8 144.5 139.8 145.7 139.3 144.8 147.5 140.5 139.9 135.4 148.5 139.1 144.5 138.5 146.2 146.8 142.3 150.9 145.5 138.1 147.1 143.8 140.5 138.5 145.2 146.8 148.9 151.8 145.6 138.1 148.1 143.9 14

4、1.5 160.8* 155.2 138.9 140.9 150.7 148.6 137.9 148.1 135.4 147.8 139.9 148.7 139.5 140.6 144.5 142.9 129.4* 143.5 142.1 149.8 154.6 148.7 153.2 146.5 132.5 146.8 148.6 145.0 136.5 145.0 144.6 137.5 143.5 150.0 143.5 146.5 149.8 143.1 143.3 157.6 143.7 146.7 139.2 142.6 143.5 131.5 135.5 149.8 135.4

5、149.8 138.9 152.3 141.8 150.8 146.3 142.5 147.5 136.1 141.2 146.4 143.8 149.5 147.5 140.3 138.5 142.5 步骤如下:步骤如下:!R=160.8-129.4=31.4。!组段数=10;组距=R/10=3.1430(cm);按要求确定每一组段上下限。!分组统计每一组段的频数,编制频数表。 118 例 13 岁女孩身高(cm)资料频数表。 身高组段 频数 组中值 (1) (2) (3) 129 2 130.5 132 2 133.5 135 8 136.5 138 20 139.5 141 26 142

6、.5 144 25 145.5 147 20 148.5 150 9 151.5 153 3 154.5 156 2 157.5 159162 1 160.5 合计 118 计量资料频数分布表计量资料频数分布表 计量资料频数分布图计量资料频数分布图 身高160.0158.0156.0154.0152.0150.0148.0146.0144.0142.0140.0138.0136.0134.0132.0130.020100Std. Dev = 5.46 Mean = 144.3N = 118.00频数分布表的用途频数分布表的用途Z揭示数值变量频数分布的类型和特征 Z作为陈述资料的形式Z便于发现一

7、些特大或特小的可疑值Z便于进一步的统计分析 分布特征分布特征 集中趋势:集中趋势:指频数表中频数分布表现为频数向某一位置集中的趋势 离散趋势:离散趋势:指频数虽然向某一位置集中,但频数分布表现为各组段都有频数分布,而不是所有频数分布在集中位置的趋势。 分布类型分布类型 对称分布:对称分布:各组段的频数以中间组段为中心,左右两侧基本对称 偏态分布偏态分布:各组段的频数不以中间组段为中心,而是一侧偏多或偏少 计量资料频数分布的类型和特征计量资料频数分布的类型和特征 第二节 集中趋势的描述指标 1、算术平均数(arithmetic mean) (1) 直接法 nxxxnxXnnii 211 (2)加

8、权法 又称频数表法,适用于频数表资料。当观察例数较时用。 kkkkiiikiifffxfxfxffxfX 21221111 2、几何平均数(geometric mean) 几何平均数用符号 G 表示。用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。 医学上常用于表示类似抗体滴度等呈倍数关系的等比级数资料。 1)直接法 nxnxxxxxxGniinnn1121121lglglglglglg 例 有 6 份血清的抗体效价分别为 1:10,1:20,1:40,1:80,1:160,1:320,求平均抗体效价。 为便于计算,可先将抗体效价取倒数,将效价倒数代入公式 ,得 G=(lg10+

9、lg20+lg40+lg80+lg160+lg320)/6= (1.7526)=56.57 6 份血清的平均抗体效价为 1:56.57 (2)加权法 又称频数表法,当观察例数 n 较大时,可先编制频数分布表,用此法计算几何平均数 kiikiiifxfG111lglg 例 100 名受试者接种某疫苗三周后,抗体测定结果如下表第(1)栏和第(2)栏,求平均抗体滴度。 表 100 名受试者平均抗体滴度计算表 抗体滴度 频数f 滴度倒数 X lgX flgX (1) (2) (3) (4) (5)=(2)(4) 1:4 6 4 0.6021 3.6126 1:8 10 8 0.9031 9.0310

10、1:16 16 16 1.2041 19.2656 1:32 34 32 1.5051 51.1734 1:64 20 64 1.8062 36.1240 1:128 8 128 2.1072 16.8576 1:256 5 256 2.4082 12.0410 1:512 1 512 2.7093 2.7093 合计 100 - - 150.8145 k1iik1iii1fxlgflgG=(150.8145/100) =(1.5081)=32.2 100 名受试者平均抗体滴度为 1:32.2。 3、百分位数(percentile)与中位数(median) 百分位数是一种位置指标,用符号Px表

11、示常用的百分位数有P2.5,P5,P25,P50,P75,P95,P97.5等,其中P25,P50,P75又称为四分位数。百分位数常用于描述一组观察值在某百分位置上的水平,多个百分位结合使用,可更全面地描述资料的分布特征。 中位数是一个特定的百分位数即P50,用符号M表示。把一组观察值按从小到大(或从大到小)的次序排列,位置居于最中央的那个数据就是中位数。中位数也是反映频数分布集中位置的统计指标,但它只由所处中间位置的部分变量值计算所得,不能反映所有数值的变化,故中位数缺乏敏感性。中位数理论上可用于任何分布类型的资料,但实践中常用于偏态分布资料和分布两端无确定值的资料。其计算方法有直接法和频数

12、表法两种。 (1)直接法 当观察例数 n 不大时, 此法常用。先将观察值按大小顺序排列,选用下列公式求 M。 当 n 为奇数时 M=X(n+1)/2 当 n 为偶数时 M=2122nnXX 例 某病患者 8 人的潜伏期(天)分别为 2,3,3,4,7,8,10,18,求它们的中位数。 本例 n=8 为偶数,将 8 人潜伏期从小到大排列,用公式算得 M=2XX12n2n = X4 + X5/2=(4+7)/2=5.5(天) (2)频数表法 当观察例数n较多时,可先编制频数表,再通过频数表计算中位数。 公式为: M = Lm + i/fm( n50% - fL ) 例 现有187例某种沙门氏菌食物

13、中毒病人的潜伏期(小时),见表第(1)栏、第(2)栏,求中位数。 表 187 例某种沙门氏菌食物中毒潜伏期(小时)分布 潜伏期(小时) 频数 f 累计频数f (1) (2) (3) 0- 35 35 12- 70 105 24- 40 145 36- 23 168 48- 12 180 60- 6 186 72-84 1 187 M = 12 + 12/70( 18750% - 35 )= 22.0(小时) 中位数M即第50百分位数P50,故百分位数Px的计算类似M,计算公式为: Px = Lx + i/fx( nx% - fL ) 例 求上表资料的P2.5,P25,P75。 本例n=187,

14、因1872.5%=4.675,18725%=46.75,18775%=140.25, 结合表第(3)栏累计频数可知P2.5,P25,P75分别在“0-”,“12-”,“24-”组段内, P2.5 = 0 + 12/35( 1872.5% - 0 )=1.6(小时) P25 = 12 + 12/70( 18725% - 35 )=14.0(小时) P75 = 24 + 12/40( 18775% - 105 )=34.6(小时)第三节 离散趋势的描述指标 1、全距(range) 计算公式为: R = XmaxXmin 全距越大,说明变量的变异程度越大。其度量单位与原变量单位相同。2、四分位数间距(quartile) 是一组数值变量值中上四分数(即P75,记为Qu)与下四分数(即P25,记为QL)之差,用符号QR表示 计算公式为: QR =P75-P25 它一般和中位数一起描述偏态分布资料的分布特征。3、方差(variance) 离均差平方和的算术平均数,即为方差。总体方差用符号2(读seigama)表示,样本方差用S2表示。计算公式分别为:NxNii1221122nXxSnii 4、标准差(standard deviation) 方差的平方根即为标准差。总体标准差用表示,样本标准差用S表示。计算公式分别为: NxN1i2i 11121212nnxxnXxSniniiinii

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(定量资料的统计描述解析课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|