ImageVerifierCode 换一换
格式:PPT , 页数:53 ,大小:778KB ,
文档编号:6025296      下载积分:22 文币
快捷下载
登录下载
邮箱/手机:
温馨提示:
系统将以此处填写的邮箱或者手机号生成账号和密码,方便再次下载。 如填写123,账号和密码都是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

优惠套餐
 

温馨提示:若手机下载失败,请复制以下地址【https://www.163wenku.com/d-6025296.html】到电脑浏览器->登陆(账号密码均为手机号或邮箱;不要扫码登陆)->重新下载(不再收费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录  
下载须知

1: 试题类文档的标题没说有答案,则无答案;主观题也可能无答案。PPT的音视频可能无法播放。 请谨慎下单,一旦售出,概不退换。
2: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
3: 本文为用户(ziliao2023)主动上传,所有收益归该用户。163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

1,本文(集中趋势课件.ppt)为本站会员(ziliao2023)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!

集中趋势课件.ppt

1、 本章的内容和重点本章的内容和重点第一节第一节 频数分布频数分布第二节第二节 集中趋势的描述集中趋势的描述第三节第三节 离散趋势的描述离散趋势的描述第四节第四节 描述分布形态的统计指标描述分布形态的统计指标教学目的与要求教学目的与要求 掌握:描述定量资料的集中趋势的指标掌握:描述定量资料的集中趋势的指标算术均数、几算术均数、几何均数、中位数的计算方法和适用条件,描述定量资料的何均数、中位数的计算方法和适用条件,描述定量资料的离散趋势的指标离散趋势的指标极差、四分位数间距、方差、标准差极差、四分位数间距、方差、标准差和变异系数的计算方法和适用条件。和变异系数的计算方法和适用条件。熟悉:连续型变量

2、频数表的编制,频数分布类型,百分位熟悉:连续型变量频数表的编制,频数分布类型,百分位数法的概念及计算。数法的概念及计算。了解:离散型定量变量的频数分布了解:离散型定量变量的频数分布 单变量计量资料的统计分析单变量计量资料的统计分析 研究总体统计描述样本统计推断随机抽样参数估计假设检验统计表统计图统计指标定量资料的统计描述定量资料的统计描述 统计表频数分布表统计表频数分布表 统计图频数分布图统计图频数分布图 统计指标统计指标 集中趋势:均数、几何均数、中位数集中趋势:均数、几何均数、中位数 离散趋势:极差、四分位间距、方差、标准离散趋势:极差、四分位间距、方差、标准差、变异系数差、变异系数编号编

3、号 年龄年龄 性别性别 治疗组治疗组 舒张压舒张压 体温体温 疗效疗效 X1 X1 X2X2 X3 X3 X4 X5X4 X5 X6X6 1 37 男男 A 11.27 37.5 显效显效 2 45 女女 B 12.53 37.0 有效有效 3 43 男男 A 10.93 36.5 有效有效 4 59 女女 B 14.67 37.8 无效无效 100 54 男男 B 16.80 37.6 无效无效频数与频数分布频数与频数分布频数与频数分布频数与频数分布频数频数:某个测量值的个(例)数。:某个测量值的个(例)数。频数分布表频数分布表(frequency distribution table):)

4、:又称频数表,又称频数表,是将是将原始数据值适当分组后得到各组的频数,原始数据值适当分组后得到各组的频数,如表如表2-1频数分布表。频数分布表。适用于适用于样本量较大样本量较大的资料进行统计描述的常用方法。的资料进行统计描述的常用方法。通过频数表可以显示数据分布的范围与形态。通过频数表可以显示数据分布的范围与形态。可用手工和计算机软件(如可用手工和计算机软件(如SASSAS、SPSSSPSS等)方便制作频等)方便制作频数表。数表。频数与频数分布频数与频数分布离散型定量变量的频数分布离散型定量变量的频数分布 例例2-1 19982-1 1998年某山区年某山区9696名孕妇产前名孕妇产前检查次数

5、资料如下:检查次数资料如下:0 0,3 3,2 2,0 0,1 1,5 5,6 6,3 3,2 2,4 4,1 1,0 0,6 6,5 5,1 1,3 3,3 3,4 4,7 7等共等共9696个数值个数值频数与频数分布频数与频数分布 表表2-12-1:9696名妇女产前检查次数分布的频数分布表名妇女产前检查次数分布的频数分布表表2-1 1998年某地96名妇妇女产产前检查检查次数数分布检查检查次数数频数频数频频率(%)累计计人数数累计频计频率(%)(1 1)(2 2)(3 3)(4 4)(5 5)0 04 44.24.24 44.24.21 17 77.37.3111111.511.52 2

6、111111.511.5222222.922.93 3131313.513.5353536.536.54 4262627.127.1616163.563.55 5232324.024.0848487.587.55121212.512.59696100.0100.0合计计9696100100 频数与频数分布频数与频数分布图图2-12-1图 2-1 某 地 96名 妇 女 产 前 检 查 次 率 分 布051 01 52 02 53 0012345 5产 前 检 查 次 数频率(%)频数与频数分布频数与频数分布连续型定量变量的频数分布连续型定量变量的频数分布 频数分布表的编制步骤频数分布表的编制步

7、骤1.1.求极差求极差 2.2.确定组段数、组距确定组段数、组距3.3.从小到大列出组段从小到大列出组段4.4.清点各组段包含的观察单位数(频数)清点各组段包含的观察单位数(频数)5.5.整理成频数分布表整理成频数分布表 频数与频数分布频数与频数分布连续型定量变量的频数分布连续型定量变量的频数分布 例2-2 2-2 抽样调查某市抽样调查某市19971997年年1212岁男童岁男童120120人的身高人的身高(cm)(cm)资料如下。资料如下。将数据适当分组,计数每组的频数,根据这些将数据适当分组,计数每组的频数,根据这些数据编制成的频数分布表(表数据编制成的频数分布表(表2-22-2)则能显示

8、出这)则能显示出这组数据分布的特点。组数据分布的特点。频数与频数分布频数与频数分布某市1997年12岁男童120人的身高(cm)资料如下。142.3 156.6 142.7 145.7 138.2 141.6 142.5 130.5 134.5 148.8134.4 148.8 137.9 151.3 140.8 149.8 145.2 141.8 146.8 135.1150.3 133.1 142.7 143.9 151.1 144.0 145.4 146.2 143.3 156.3141.9 140.7 141.2 141.5 148.8 140.1 150.6 139.5 146.4

9、143.8143.5 139.2 144.7 139.3 141.9 147.8 140.5 138.9 134.7 147.3138.1 140.2 137.4 145.1 145.8 147.9 150.8 144.5 137.1 147.1142.9 134.9 143.6 142.3 125.9 132.7 152.9 147.9 141.8 141.4140.9 141.4 160.9 154.2 137.9 139.9 149.7 147.5 136.9 148.1134.7 138.5 138.9 137.7 138.5 139.6 143.5 142.9 129.4 142.5

10、141.2 148.9 154.0 147.7 152.3 146.6 132.1 145.9 146.7 144.0135.5 144.4 143.4 137.4 143.6 150.0 143.3 146.5 149.0 142.1140.2 145.4 142.4 148.9 146.7 139.2 139.6 142.4 138.7 139.9频数与频数分布频数与频数分布手工编制表手工编制表2-22-2步骤:步骤:(1 1)计算)计算全距全距(rangerange,R R),也称为极差),也称为极差 R R=最大值最小值最大值最小值 =160.9=160.9125.9125.93535

11、(cmcm)(2 2)确定)确定组段数与组距组段数与组距:组距组距=上限下限上限下限=R R/(预计的组段数)(预计的组段数)i=R/K(极差(极差/组数)组数)本例如果预计取本例如果预计取1010个组段,则组距长度约为个组段,则组距长度约为35/10=3.5,35/10=3.5,取整数取整数4 4。两。两端的组段应分别包含最小值或最大值;端的组段应分别包含最小值或最大值;(3 3)列表列表 做出如表做出如表2-22-2的表格,将选好的组段顺序地列在的表格,将选好的组段顺序地列在 (1)(1)列。按照列。按照 “下限下限x x上限上限”的原则确定每一例数据的原则确定每一例数据x x应归属的组段

12、。应归属的组段。组组 段段 频频 数数 频频 率率 124124 1 1 0.0083 0.0083 128 128 2 0.01672 0.0167 132 132 1010 0.0833 0.0833 136 136 2222 0.1834 0.1834 140 140 3737 0.3083 0.3083 144 144 2626 0.2167 0.2167 148 148 1515 0.1250 0.1250 152 152 4 4 0.0333 0.0333 156 156 2 2 0.0167 0.0167 160 160 1 1 0.0083 0.0083 合合 计计 12012

13、0 1.0000 1.0000频数与频数分布频数与频数分布 124132140148156164010203040人数图 某市120名12岁男童身高的频数分布频数分布的类型频数分布的类型 types of frequency distribution对称分布 symmetric distribution 偏态分布 skewness distribution频数表与频数分布频数表与频数分布124132140148156164010203040人数身高(cm)对称分布频数表与频数分布频数表与频数分布偏态分布正偏态(positive skew)负偏态(negative skew)Frequencyv

14、ar512345678902468Frequencyvar6123456789100510频数表与频数分布非对称分布称为skewness;俗称偏态分布,有人称偏峰分布。“偏”是偏离的意思,表示个别观察值偏离均数较远,而不是“集中位置偏”;频数表与频数分布 分布不对称者称为偏态分布。偏态分布又分为正偏分布和负偏分布。所谓正偏分布是指分布的长尾在峰的右侧,又称右偏分布;所谓负偏分布是指分布的长尾在峰的左侧,又称左偏分布。”频数表与频数分布频数表与频数分布70 3 5 7 9 11 13 15 17 19 21 10 20 30 40 50 60 0 1 人数大多数居民发汞含量在115mol/kg之

15、间,少数人的发汞大于15mol/kg,分布呈正偏态。发汞含量(mol/kg)(a)239人发汞含量的频数分布图 某城市892名老年人生存质量自评分的频数分布0 10 20 30 40 50 60 70 80 90 100自评分400300200100 0人数0 5 10 15 20 25 30 35 40 45 0 1 02 03 040(b)102名黑色素瘤患者的生存时间频数分布人数生存时间(月)患者生存时间大部份在30个月内,少数达45个月,分布呈极度偏态,又称L型分布。图 某地19901992年男性死亡年龄分布 0 5 10 15 20 25 30 35 40 45 50 55 60 6

16、5 70 75 80 85死亡年龄(岁)2500200015001000 500 0频数分布表和频数分布图的用途频数分布表和频数分布图的用途 描述分布类型描述分布类型 描述分布的特征描述分布的特征 集中趋势反映资料的平均水平集中趋势反映资料的平均水平 离散趋势反映资料的变异程度离散趋势反映资料的变异程度 便于发现特大、特小的可疑值便于发现特大、特小的可疑值 便于计算有关指标、统计分析与处理便于计算有关指标、统计分析与处理 求出极差 确定组段数 确定组距 列出各个组段 确定每一组段频数极差即最大值与最小值之差 一般815之间 组距=R/组段数,但一般取一方便计算的数字 第一组段包括极小值,最后一

17、组段包括极大值,除最后一组段可同时标出上下限,其他组段只标出下限。根据变量值大小把各观察单位归入各个组段 编制频数表步骤流程图频数分布特征频数分布特征 124132140148156164010203040人数图 某市120名12岁男童身高的频数分布第二节第二节 集中趋势统计指标集中趋势统计指标 平均数平均数:描述一组变量值集中位置的特征值,用来描述一组变量值集中位置的特征值,用来 说明某种现象或事物数量的平均水平说明某种现象或事物数量的平均水平 适用条件适用条件:适用于:适用于正态分布正态分布或或近似正态分布近似正态分布的资料的资料 (对称分布对称分布)1 1)直接计算法)直接计算法:计算公

18、式为计算公式为 式中式中X X1 1,X,X2 2和和XnXn为所有观察值,为所有观察值,n n为样本含量,为样本含量,(希(希腊字母,读作腊字母,读作sigmasigma)为求和的符号)为求和的符号。nXXXxn .21nXnXnXiinii1一、算术均数:简称均数,用 表示(样本均数)X定量变量的特征数定量变量的特征数2 2)加权频数表法:)加权频数表法:计算公式为计算公式为nfXffXxOO120例17岁男生的身高频数分布均数的应用:最适于对称分布资料,特别是正态分布资料;对于偏态资料,均数不能较好地反映其集中趋势。我也知道了!定量变量的特征数定量变量的特征数二、几何均数(二、几何均数(

19、geometric meangeometric mean,G G)适用条件:适用条件:适用于对数正态分布或近似正态分布,以适用于对数正态分布或近似正态分布,以及呈倍数关系的等比资料。其频数图一般呈正偏峰分布。及呈倍数关系的等比资料。其频数图一般呈正偏峰分布。在医学研究中常适用于免疫学的指标。其计算公式为在医学研究中常适用于免疫学的指标。其计算公式为 nXXXXGnnlglg.121定量变量的特征数定量变量的特征数例例2-5 72-5 7名慢性迁延性肝炎患者的名慢性迁延性肝炎患者的HBsAgHBsAg滴度资料滴度资料为为1:161:16,1:321:32,1:321:32,1:641:64,1:

20、641:64,1:1281:128,1:5121:512。试计算其几何均数。试计算其几何均数。6451212864643232167G)log(log1nXG.648062.1lg7512lg128lg64lg64lg32lg32lg16lglg11定量变量的特征数定量变量的特征数加权法计算几何均数例例2-6 522-6 52例慢性肝炎患者的例慢性肝炎患者的HBsAgHBsAg滴度数据如表滴度数据如表2-2-4 4。试计算滴度的几何均数。试计算滴度的几何均数。nXffXfGloglgloglog11定量变量的特征数定量变量的特征数表2-4 52例慢性肝炎患者的HBsAg滴度资资料抗体滴度频数频

21、数(f f)滴度倒数数(X X)lgXf(lgX)1:162 216161.204121.204122.408242.408241:327 732321.505151.5051510.5360510.536051:64111164641.806181.8061819.8679819.867981:12813131281282.107212.1072127.3937327.393731:25612122562562.408242.4082428.8988828.898881:5127 75125122.709272.7092718.9648918.96489合计计5252108.06977108

22、.06977定量变量的特征数定量变量的特征数 52 52例慢性肝炎患者的例慢性肝炎患者的HBsAgHBsAg滴度的几何均数为滴度的几何均数为 1119.747051119.74705。74705.1195206977.108lg1G111lg150.2778lg()lg()lg(2.1779)150.669fXGf几何均数的应用:1.等比资料,如抗体平均滴度2.对数正态分布资料Remember!使用几何均数时的注意点:1)观察值不能有0。2)观察值不能同时有正值和负值。若全为负值,在计算时先把负号去掉,得出结果再加上负号。Be careful!定量变量的特征数定量变量的特征数三、中位数(三、中

23、位数(median,M)适用条件:适用条件:可用于各种分布的定量资料。尤其用于可用于各种分布的定量资料。尤其用于偏态分布资料、一端或两端无确定数据资料和分布不明偏态分布资料、一端或两端无确定数据资料和分布不明的资料。的资料。M:将全部观察值:将全部观察值从小到大从小到大排序,位于排序,位于中间位置中间位置的观察值的观察值 如如 今有今有6名工人接触某有害物质后,引起中名工人接触某有害物质后,引起中毒的潜伏期分别是:毒的潜伏期分别是:1天,天,3天,天,5天,天,4天,天,8天,天,7天。该天。该6位工人的平均潜伏期是多少位工人的平均潜伏期是多少天?天?中位数例 9例正常人的发汞值:1.1 1.

24、8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 M=4.8 9例正常人的发汞值:1.1,1.8 3.5 4.2 4.8 5.6 5.9 7.1 16 M=4.8 10例正常人的发汞值:1.1 1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 16 M=(4.8+5.6)/2=5.2%X(100)%XXP 百分位数示意图(二)百分位数(percentile)百分位数法计算中位数百分位数法计算中位数:频数表资料(大样本)频数表资料(大样本)百分位数的计算公式为百分位数的计算公式为 式中式中L LX X、i iX X和和f fX X分别为第百分位数所在组段的下限、组分别

25、为第百分位数所在组段的下限、组距和频数,距和频数,fLfL为小于各组段的累计频数,为小于各组段的累计频数,L LX X为总为总例数。中位数的计算公式例数。中位数的计算公式(%)XXXLXiPLnXff 50505050()2LinMPLff表表2-5 120名正常成年男子血清铁含量(名正常成年男子血清铁含量(mol/L)组段组段频数频数f累计频数累计频数f累计频率累计频率%6110.838343.33106108.331281815.0014123025.0016205041.6718277764.172018221224826428301合计合计120)/(74.18)50%50120(27

26、218LmolM定量变量的特征数定量变量的特征数120例17岁男生的身高频数分布百分位数的应用:百分位数用于描述某个观察序列在某百分位置上的水平。常用于确定参考值范围,亦称正常值范围。平均数应用的注意事项平均数应用的注意事项 同质同质的资料计算平均数才有意义的资料计算平均数才有意义 根据资料分布的特征选用适当的平均数根据资料分布的特征选用适当的平均数 算术均数:单峰对称分布的资料算术均数:单峰对称分布的资料 几何均数:等比资料、滴度资料、正偏态资料几何均数:等比资料、滴度资料、正偏态资料 中位数:理论上可用于任何分布资料,但当资料适合中位数:理论上可用于任何分布资料,但当资料适合计算均数或几何

27、均数时,不宜用中位数计算均数或几何均数时,不宜用中位数(偏态分布、分布不明资料、有不确定值的资料)(偏态分布、分布不明资料、有不确定值的资料)1 1 有有5 5人的血清滴度为:人的血清滴度为:1:20,1:40,1:80,1:160,1:3201:20,1:40,1:80,1:160,1:320则平均则平均滴度是滴度是 A.1A.1:4040 B.1 B.1:8080 C.1 C.1:160160 D.1 D.1:320320 2.2.一组变量值,其大小分别为一组变量值,其大小分别为1010,1212,9 9,7 7,1111,其中位数是,其中位数是 A.9A.9 B.7 B.7 C.10 C

28、.10 D.11 D.113.3.一组变量值,其大小分别为一组变量值,其大小分别为1010,1212,9 9,7 7,1111,3939,其中位数,其中位数是是 A.9A.9 B.7 B.7 C.10.5 C.10.5 D.11 D.11 4.4.正常成年男子的血铅含量系偏态分布资料正常成年男子的血铅含量系偏态分布资料,对数变换后对数变换后的呈正态分布。欲描述血铅的平均水平宜用的呈正态分布。欲描述血铅的平均水平宜用A.A.原始数据的算术均数原始数据的算术均数B.B.原始数据的几何均数原始数据的几何均数C.C.原始数据的中位数原始数据的中位数D.D.原始数据的标准差原始数据的标准差 5.5.偏态分布数值资料偏态分布数值资料,对数变换后对数变换后,分布仍呈偏态。描述分布仍呈偏态。描述数据的集中趋势宜用数据的集中趋势宜用A.A.算术均数算术均数B.B.几何均数几何均数C.C.中位数中位数D.D.标准差标准差

侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|