医药统计学-第一章-数据的描述与整理概要课件.ppt

上传人(卖家):晟晟文业 文档编号:3810343 上传时间:2022-10-15 格式:PPT 页数:93 大小:1.58MB
下载 相关 举报
医药统计学-第一章-数据的描述与整理概要课件.ppt_第1页
第1页 / 共93页
医药统计学-第一章-数据的描述与整理概要课件.ppt_第2页
第2页 / 共93页
医药统计学-第一章-数据的描述与整理概要课件.ppt_第3页
第3页 / 共93页
医药统计学-第一章-数据的描述与整理概要课件.ppt_第4页
第4页 / 共93页
医药统计学-第一章-数据的描述与整理概要课件.ppt_第5页
第5页 / 共93页
点击查看更多>>
资源描述

1、是研究是研究数量规律的数量规律的数学学科。数学学科。eg:研究运动员打靶成绩的规律,分析研究运动员打靶成绩的规律,分析11种可能结种可能结果(果(0、1、2、3、4、.、10环)出现的概率及其规环)出现的概率及其规律性。律性。以以为基为基础,通过对数据的础,通过对数据的、和和来研究来研究的统计规律的学科。的统计规律的学科。以以、为基为基础,研究础,研究(数据)的(数据)的、和和的科学。的科学。目的是帮助人们分析所占有的信息,达到去伪目的是帮助人们分析所占有的信息,达到去伪存真、去粗取精、正确认识世界的一种重要手段。存真、去粗取精、正确认识世界的一种重要手段。:单数名词表示统计学,复数名词表示统

2、单数名词表示统计学,复数名词表示统计数据或资料。计数据或资料。Webster国际大辞典(第三版)对统计学的定义国际大辞典(第三版)对统计学的定义是:是:“a science dealing with the collection,analysis,interpretation and presentation of numerical data”。Last JM 主编的一本流行病学辞典对统计学的主编的一本流行病学辞典对统计学的定义是:定义是:“the of dealing with variation in data through collection,classification and

3、analysis in such a way as to obtain reliable results”。由此看出:统计学是处理资料中变异性的科学由此看出:统计学是处理资料中变异性的科学和艺术,是在收集、归类、分析和解释大量数据的和艺术,是在收集、归类、分析和解释大量数据的过程中获取可靠结果的一门学科,强调了过程中获取可靠结果的一门学科,强调了“”。任何统计工作和统计研任何统计工作和统计研 究的全过程都可分为以下究的全过程都可分为以下五个步骤五个步骤:(design):):关键、依据。在进行统计工作和研关键、依据。在进行统计工作和研 究工作之前必须有一个周密的设计。究工作之前必须有一个周密的

4、设计。前期准备工作前期准备工作 设计内容包括:设计内容包括:确定研究目的、研究假说;确定研究目的、研究假说;确定观察对象、观察单位、样本含量和抽样方法;确定观察对象、观察单位、样本含量和抽样方法;拟定研究方案;拟定研究方案;预期分析指标、误差控制措施、进度与费用等。预期分析指标、误差控制措施、进度与费用等。设计是整个研究工作中设计是整个研究工作中的一环,也是指导的一环,也是指导以后工作的依据。以后工作的依据。(collection of data):):遵循统计学原理遵循统计学原理 采取必要措施得到准确可靠的原始资料。采取必要措施得到准确可靠的原始资料。、原则。原则。):包括:包括。eg:日常

5、医疗卫生工作记录、统计报表、专门报告卡日常医疗卫生工作记录、统计报表、专门报告卡等;等;(一时性资料)。(一时性资料)。eg:专题专题调查资料、实验研究资料。调查资料、实验研究资料。文献的二次开发(循证文献的二次开发(循证医学)。医学)。(sorting data):):通过科学的分组和归纳,通过科学的分组和归纳,用图表的形式来展示资料特征,使原始资料系统化、用图表的形式来展示资料特征,使原始资料系统化、条理化,便于进一步计算统计指标和分析。条理化,便于进一步计算统计指标和分析。步骤:步骤:遵循及时性、完整性、准确性、有效性原则。遵循及时性、完整性、准确性、有效性原则。包括包括与与。(eg:录

6、入误差录入误差170输入为输入为17,对结果影响,对结果影响较大,故应进行双份录入)较大,故应进行双份录入)按性质、类别分类整理,即按性质、类别分类整理,即“同质者同质者合并,非同质者分开合并,非同质者分开”的原则对资料进行分组。多的原则对资料进行分组。多用于定性数据(定类或定序数据)的整理。一般用用于定性数据(定类或定序数据)的整理。一般用二维表。二维表。按数量大小分组整理,即在同质基础按数量大小分组整理,即在同质基础上根据数值大小进行分组,组与组之间是连续的或上根据数值大小进行分组,组与组之间是连续的或非连续的。多用于定量数据(数值数据)的整理。非连续的。多用于定量数据(数值数据)的整理。

7、汇总归纳。汇总归纳。(analysis of data):):目的是计算有关指目的是计算有关指标,反映数据的综合特征,阐明事物的内在联系和标,反映数据的综合特征,阐明事物的内在联系和规律,是统计学的规律,是统计学的。包括:包括:(descriptive statistics):用):用(样(样本均数、标准差、率)本均数、标准差、率)与与等方法对样本资等方法对样本资料的数量特征及其分布规律进行描述分析事物特征。料的数量特征及其分布规律进行描述分析事物特征。(inferential statistics):指):指,以,以及如何用及如何用特征,分析事物间相互特征,分析事物间相互关系关系(eg:药物

8、疗效的统计学分析)药物疗效的统计学分析)。(interpretation of data):):对统计结果进对统计结果进行说明和应用行说明和应用(eg:药物疗效的统计判断)药物疗效的统计判断)。进行资料分析时,需根据进行资料分析时,需根据、和和选择恰当的描述性指标和统计推断方法。选择恰当的描述性指标和统计推断方法。统计工作的五个步骤统计工作的五个步骤,任何一,任何一步的缺陷,都将影响整个研究结果。步的缺陷,都将影响整个研究结果。目前,应用广泛,成为医药学研究、疾病防治、卫目前,应用广泛,成为医药学研究、疾病防治、卫生事业管理等多方面的重要手段、工具之一,即成生事业管理等多方面的重要手段、工具之

9、一,即成为为。应用应用与与的原理与方法研究的原理与方法研究以及卫生服务领域中数据的以及卫生服务领域中数据的、和和的一门科学。的一门科学。理论基础理论基础、研究对象研究对象、医药领域:新药研制、药物鉴定、药理分析、试验医药领域:新药研制、药物鉴定、药理分析、试验设计、药政管理、处方筛选、医药信息等。设计、药政管理、处方筛选、医药信息等。目的:目的:掌握医药数理统计学的基本掌握医药数理统计学的基本、基本、基本、基本、基本,为今后从事医药领域的科学研,为今后从事医药领域的科学研究、阅读专业书刊、从事具体的实践工作打下必要究、阅读专业书刊、从事具体的实践工作打下必要的数理统计学基础。的数理统计学基础。

10、研究统计资料的研究统计资料的是判断统计资料的是判断统计资料的(故应初步编制频数分布表,绘制频数分布图)(故应初步编制频数分布表,绘制频数分布图)。频数(频数(frequence):各类别的数据个数,即观察值):各类别的数据个数,即观察值的个数。的个数。频率(频率(frequency/relative frequency):各类别的数):各类别的数据个数占总数据个数的比例值。据个数占总数据个数的比例值。频数分布表(频数分布表(frequency table):反映各类别及其相):反映各类别及其相应频数的表格形式,即观察值在其所取范围内分布的应频数的表格形式,即观察值在其所取范围内分布的情况。情况

11、。100400个数据,一般分个数据,一般分515个组个组段,可适当变动。段,可适当变动。观察单位较少时组段数可相对少些,观察单位较多观察单位较少时组段数可相对少些,观察单位较多时组段数可相对多些。时组段数可相对多些。Sturgesr的经验公式计算组数:的经验公式计算组数:k=1+lnN/ln2 (N:数据的个数数据的个数;ln:以以e为底的自然对数为底的自然对数):不可过多:资料分散,编制与计算繁锁,且分布规律不能显示。不可过多:资料分散,编制与计算繁锁,且分布规律不能显示。不可过少:损失信息,计算误差较大,且无法显示分布特征。不可过少:损失信息,计算误差较大,且无法显示分布特征。原则:以显示

12、数据的分布特征和规律为依据。原则:以显示数据的分布特征和规律为依据。(class interval/class width):相邻两组):相邻两组段的下限之差称为组距。段的下限之差称为组距。全距或极差(全距或极差(range):):R=最大值最大值最小值最小值=Xmax Xmin组距组距(d):d=R/k:d 可等距,也可不等距。可等距,也可不等距。eg:数据中有特大或特小的数值(食物中毒的潜数据中有特大或特小的数值(食物中毒的潜伏期,年龄分组伏期,年龄分组0-0-、7-7-、1818、60-60-等)等)。各组段的起点和终点分别称为下限和上各组段的起点和终点分别称为下限和上限。限。原则:不重

13、不漏;原则:不重不漏;:第一组段应包括全部观察值中的最小值,最末组段第一组段应包括全部观察值中的最小值,最末组段应包括全部观察值中的最大值,并且同时写出其下应包括全部观察值中的最大值,并且同时写出其下限与上限。限与上限。连续性资料的某组段包含下限,但不包含上限。连续性资料的某组段包含下限,但不包含上限。确定组段界限,列成确定组段界限,列成 表表1.3的形式,采用计算机或用划记法将原始数据汇的形式,采用计算机或用划记法将原始数据汇总,得出各组段的观察例数,即频数,表中的第总,得出各组段的观察例数,即频数,表中的第(1)、()、(2)栏即所需的频数表。)栏即所需的频数表。:计算机编制准确、快速,但

14、应保证原始数据的准确输计算机编制准确、快速,但应保证原始数据的准确输入和组距的合理设计。入和组距的合理设计。p 频数表的用途频数表的用途,便于进一步分析。,便于进一步分析。观察观察:描述描述集中趋势、集中趋势、离散趋势和分布的的形状。离散趋势和分布的的形状。观察数据的观察数据的(),以便选取适),以便选取适 当的统计方法。当的统计方法。发现资料中某些特大或特小的发现资料中某些特大或特小的。当样本含量较大时,各组段的频率作为当样本含量较大时,各组段的频率作为值。值。指多数频数集中在中央位置,两端的频指多数频数集中在中央位置,两端的频 数分布大致对称。特殊的对称分布为数分布大致对称。特殊的对称分布

15、为(normal distribution)。)。eg:体重、身高等生理、生化检测结果等。体重、身高等生理、生化检测结果等。频数分布不对称,集中位置偏向一侧。频数分布不对称,集中位置偏向一侧。124132140148156164010203040人人数数身高身高(cm)Fraction身高110.2134.50.236364eg:又称又称,指观察值较多的集,指观察值较多的集中在数值较小的一侧中在数值较小的一侧(eg:传染病的潜伏期、非必需元素传染病的潜伏期、非必需元素含量分布等)。含量分布等)。又称又称,指观察值较多的集,指观察值较多的集中在数值较大的一侧中在数值较大的一侧(eg:学生成绩、儿

16、童视力、糖尿病学生成绩、儿童视力、糖尿病年龄分布、冠心病、大多数恶性肿瘤等慢性病患者的年龄分布年龄分布、冠心病、大多数恶性肿瘤等慢性病患者的年龄分布为负偏态分布)。为负偏态分布)。:Frequencyvar512345678902468Frequencyvar6123456789100510二、常用统计软件简介二、常用统计软件简介全称全称Statistical Analysis System,是当前最流行的,是当前最流行的的统计分析软件,但操作略为繁琐。的统计分析软件,但操作略为繁琐。全称全称Statistical Package for Social Science,是,是的专业统计分析软件

17、,操作的专业统计分析软件,操作方便。方便。可进行基本的统计分析。操作简便。可进行基本的统计分析。操作简便。(central tendency):身高有高有):身高有高有 矮,但多数人身高集中在中间部分组段,以中等矮,但多数人身高集中在中间部分组段,以中等身身 高居多,此为集中趋势。高居多,此为集中趋势。(dispersion):由中等身高到较矮或:由中等身高到较矮或 较高的频数分布逐渐减少,反映了离散程度。对较高的频数分布逐渐减少,反映了离散程度。对于于 数值变量资料,可从集中趋势和离散程度两个侧数值变量资料,可从集中趋势和离散程度两个侧面面 去分析其规律性。去分析其规律性。:峰度与偏度。:峰

18、度与偏度。分布的形状分布的形状频数分布表、图显示的集中趋势和离散程度较频数分布表、图显示的集中趋势和离散程度较,而计算其各指标则是准确、定量描述其,而计算其各指标则是准确、定量描述其分布特征。分布特征。平均数,反映观察值的集中位平均数,反映观察值的集中位置或平均水平,即观察值的典型水平或代表值。置或平均水平,即观察值的典型水平或代表值。描述一组描述一组观察值的平均水平或中心位置的观察值的平均水平或中心位置的常用指标有常用指标有均数均数、中位数中位数、众数众数、几何均数几何均数等。等。平均水平指标平均水平指标:简称:简称,是反映一组是反映一组的呈的呈的的的的的指标,用得最多的统计描述指标。的指标

19、,用得最多的统计描述指标。x(1 1)计算:计算:直接法:直接法:eg:1010名七岁儿童体重名七岁儿童体重(kg)分别分别17.3,18.0,19.4,20.6,21.2,21.8,22.5,23.2,24.0,25.5,求平均体重求平均体重。解:解:x17.3+18+25.5 1021.35(kg)加权法加权法(weighting method):xf1x1+f2x2+f3x3+fnxn f1+f2+f3+fn f x f它是权重!它是权重!组中值组中值(2 2)应用()应用():均数能全面反映全部观察值的平均数量水均数能全面反映全部观察值的平均数量水平,应用甚广,平,应用甚广,最适于最适

20、于资料,特别是资料,特别是的数值资料的数值资料;对于偏态资料,均数对于偏态资料,均数较好地反映其集较好地反映其集中趋势。中趋势。我也知道我也知道了!了!(3 3)数学性质)数学性质:)=0=0 )2 2 其中,其中,a为任意实数。为任意实数。niix1(xniix1(x21niiax截尾截尾均值均值eg:比赛时去比赛时去掉一个最高分、掉一个最高分、一个最低分,一个最低分,然后计算均值。然后计算均值。(median):将一组数据按从小到大的将一组数据按从小到大的 顺序排列,位置居中的数即是中位数。是反顺序排列,位置居中的数即是中位数。是反映一组映一组的呈的呈的的的的水平。用水平。用 表示。表示。

21、(1 1)计算:)计算:直接法:直接法:(1)/2/2/2 1 n()/2 n nnnXMXX当当 为为奇奇数数当当 为为偶偶数数Me eg:9例正常人的发汞值:例正常人的发汞值:1.1,1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 Me=4.8 9例正常人的发汞值:例正常人的发汞值:1.1,1.8 3.5 4.2 4.8 5.6 5.9 7.1 16 Me=4.8 10例正常人的发汞值:例正常人的发汞值:1.1,1.8 3.5 4.2 4.8 5.6 5.9 7.1 10.5 16 Me=(4.8+5.6)/2=5.2 加权法:加权法:我知道了!我知道了!)2(LMfnf

22、iLMe2 2)应用()应用():):常用于描述常用于描述或或的集中的集中趋势,它与均数、几何均数不同的是,不是由全趋势,它与均数、几何均数不同的是,不是由全部观察值的数据综合得到,不受极端值的影响,部观察值的数据综合得到,不受极端值的影响,而只受而只受的影响。的影响。对于对称分布资料,对于对称分布资料,中位数和均数在理论上是中位数和均数在理论上是 相同的相同的。(mode):是数据中出现次数:是数据中出现次数的观察值,的观察值,用用Mo表示。一般用来反映一组表示。一般用来反映一组的的的的水平。水平。应用条件:应用条件:或仅为一个分布或仅为一个分布 中心的中心的资料。资料。优点:易理解,不受极

23、端值的影响。优点:易理解,不受极端值的影响。缺点:灵敏度、计算功能和稳定性差,具有不唯缺点:灵敏度、计算功能和稳定性差,具有不唯 一性。一性。在数值数据在数值数据中,可能有中,可能有多个或无多个或无Mo 离散程度用离散程度用指标表示,反映各观察值与其指标表示,反映各观察值与其平均水平(中心值)的偏离程度。平均水平(中心值)的偏离程度。,即离散程度越小,集中指标对一组数,即离散程度越小,集中指标对一组数据的代表性代表性越好。据的代表性代表性越好。eg:两名运动员分别打靶两名运动员分别打靶1010次,对其成绩分别次,对其成绩分别计算集中趋势与离散趋势指标,若集中趋势一致,计算集中趋势与离散趋势指标

24、,若集中趋势一致,则比较离散趋势,从而可说明平均水平对其真实能则比较离散趋势,从而可说明平均水平对其真实能力的代表性。力的代表性。常用的变异指标有常用的变异指标有全距全距、方差方差、标准差标准差、变变异系数异系数 等。等。eg:设有三组设有三组同同年龄、年龄、同同性别儿童体重性别儿童体重(kg),数据),数据 如下:如下:(一)极差(一)极差(range)用字母用字母R表示,最大值与最小表示,最大值与最小 值之差。值之差。R=最大值最大值最小值最小值=Xmax Xmin 描述数据分布的范围描述数据分布的范围(的范围的范围)。极。极 差大,说明数据分布较分散差大,说明数据分布较分散(变异度大变异

25、度大)。2 2、特点、特点 计算方法计算方法;,仅考虑资料两侧极端值,没有利用观,仅考虑资料两侧极端值,没有利用观 察值中的全部信息察值中的全部信息(除了最大、最小值外,不能除了最大、最小值外,不能 反映组内其他数据的变异反映组内其他数据的变异);,样本较大时抽到较大值与较小值的可,样本较大时抽到较大值与较小值的可 能性也较大,则样本极差也较大,故能性也较大,则样本极差也较大,故。eg:上述三组数据中:上述三组数据中:甲组数据的极差甲组数据的极差 R=34-26=8 乙组数据的极差乙组数据的极差 R=36-24=12 丙组数据的极差丙组数据的极差 R=34-26=8 甲组、丙组数据分布较乙组集

26、中。甲组、丙组数据分布较乙组集中。(二)方差与标准差(二)方差与标准差(variance):又称均方(MS),考虑观察值个数N的影响。总体方差总体方差2 2表示表示。2NX22)(NiixN121x描述一组描述一组的呈的呈的的的的的重要指标,的重要指标,常用常用SD表示。表示。方差的度量单位是原度量单位的平方,故将方方差的度量单位是原度量单位的平方,故将方 差开方后与原数据的度量单位相同。差开方后与原数据的度量单位相同。适用条件:适用条件:的的资料。资料。标准差的计算标准差的计算 直接法直接法 Nxi2)(1)(1)(222nnxxnxxSiii 加权法加权法 1)(22iiiiiiffxfx

27、fS其中,其中,xi 是各组段的组中值是各组段的组中值,fi 是相应的频数是相应的频数。eg:甲组:甲组:26 28 30 32 34 乙组:乙组:24 27 30 33 36 丙组:丙组:26 29 30 31 34解:解:极差极差 方差方差 标准差标准差 甲组:甲组:8 10.0 3.16 乙组:乙组:12 22.5 4.74 丙组:丙组:8 8.5 2.92 反映一组反映一组(个体的(个体的 变异程度)变异程度);反映一组反映一组;反映反映;用于计算变异系数、标准误;用于计算变异系数、标准误;结合均数与正态分布的规律估计参考值的结合均数与正态分布的规律估计参考值的 范围。范围。(简记为(

28、简记为CV,离散系数),离散系数)CVeg:某 地某 地 2 02 0 岁 男 子岁 男 子 1 0 01 0 0 人,身 高 均 数 为人,身 高 均 数 为166.06166.06cm,标准差为标准差为4.984.98cm;体重均数为体重均数为53.7253.72kg,标准差为标准差为4.964.96kg。试比较身高和体重的变异何者为大?试比较身高和体重的变异何者为大?解:由于度量单位不同,故不能直接比较两者解:由于度量单位不同,故不能直接比较两者的标准差,而应比较变异系数:的标准差,而应比较变异系数:身高身高 体重体重 由此可见,该地由此可见,该地2020岁男子体重的变异度大岁男子体重的

29、变异度大于身高的变异度。于身高的变异度。%98.2%10006.16698.4CV%23.9%10072.5396.4CV 统计表和统计图是重要的统计表和统计图是重要的方法。方法。优点:优点:简单、明了、易于理解简单、明了、易于理解(代替冗长的文字代替冗长的文字 叙述,表达清楚,对比鲜明叙述,表达清楚,对比鲜明)。便于比较。便于比较。统计图可形象、生动而直观地表达统计分析统计图可形象、生动而直观地表达统计分析 结果或资料的图形。结果或资料的图形。缺点:不能精确地显示数字大小。缺点:不能精确地显示数字大小。医药学领域中常用的统计图有条形图、百分医药学领域中常用的统计图有条形图、百分 条图、圆图、

30、线图、半对数图、直方图、条图、圆图、线图、半对数图、直方图、散散 点图、箱式图与统计地图等。点图、箱式图与统计地图等。(一)绘制统计图的基本要求(一)绘制统计图的基本要求 根据根据和和选择适当的图形。选择适当的图形。应说明资料的内容(主词和宾词)、时间和地应说明资料的内容(主词和宾词)、时间和地点,一般位于图的下方。点,一般位于图的下方。图的纵、横轴应注明图的纵、横轴应注明及对应单位,尺度应等距及对应单位,尺度应等距或具有规律性,一般自左而右、自上而下、由小到或具有规律性,一般自左而右、自上而下、由小到大。大。为使图形美观并便于比较,统计图的为使图形美观并便于比较,统计图的,有时为了说明问题也

31、可加以变动。,有时为了说明问题也可加以变动。比较、说明不同事物时,可用不同颜色或线条表比较、说明不同事物时,可用不同颜色或线条表示,并常附图例说明,但不宜过多,放在纵、横示,并常附图例说明,但不宜过多,放在纵、横标目之间或图域中。标目之间或图域中。图域:圆图、直角坐标系第一象限,长方形框架。图域:圆图、直角坐标系第一象限,长方形框架。:除:除、和和外,其余图的纵外,其余图的纵轴尺度必须从轴尺度必须从0开始。开始。(二)常用统计图的适用条件与绘制(二)常用统计图的适用条件与绘制 1 1)概念:用等宽直条的长短来表示)概念:用等宽直条的长短来表示 大小,用于表示大小,用于表示。2 2)适用资料:)

32、适用资料:、的的数据或数据或数据资料数据资料(资料有明确分组,不连续)资料有明确分组,不连续)。3 3)分类:分为单式和复式两种。)分类:分为单式和复式两种。单式适用于只有一组观察资料;单式适用于只有一组观察资料;复式适用于有若干组观察资料。复式适用于有若干组观察资料。4 4)绘制要点:)绘制要点:坐标轴:横轴为观察项目,纵轴为数值,坐标轴:横轴为观察项目,纵轴为数值,;直条的宽度:直条的宽度:。复式直条图在同一。复式直条图在同一观察项目的各组之间无间距;观察项目的各组之间无间距;排列顺序:可以根据数值从大到小,从小到大,排列顺序:可以根据数值从大到小,从小到大,或按时间顺序排列。或按时间顺序

33、排列。5 5)应用:)应用:图2.某 地1 9 9 5年 癌 症、心血管疾病死亡率020406080100120癌症心血管疾病死亡率(1/1 0 万)男女0200400600800省会城市县及乡村一般城市评分男女图图 3 2007年某省不同地区、性别的卫生系统反应性评分比较年某省不同地区、性别的卫生系统反应性评分比较 1 1)概念:以长条面积为)概念:以长条面积为100%100%,用长条内各段面,用长条内各段面 积所占的百分比来表示各部分在全体中所占积所占的百分比来表示各部分在全体中所占的比例。的比例。2 2)适用资料:)适用资料:3 3)应用:)应用:4 4)绘制要点:)绘制要点:标尺:有标

34、尺,在图的上方或下方,起始的位标尺:有标尺,在图的上方或下方,起始的位置、总长度和百分条图一致。全长为置、总长度和百分条图一致。全长为100%100%,分,分成成1010格,每格格,每格10%10%。分段:按各部分所占百分比的大小排列,在图分段:按各部分所占百分比的大小排列,在图上标出百分比。上标出百分比。图例:在图外要附图例说明。图例:在图外要附图例说明。33.2025.5021.4010.20 9.800%20%40%60%80%100%副教授教辅人员讲师助教教授图图5 2008年某医科大学公共卫生学院专业技术人员构成年某医科大学公共卫生学院专业技术人员构成 1 1)概念:又称饼图,圆形图

35、适用于)概念:又称饼图,圆形图适用于的的资料,表示资料,表示。以一个圆面积为。以一个圆面积为100%100%,用圆内各扇形面积所占的百分比来表示各用圆内各扇形面积所占的百分比来表示各部分所占的构成比例部分所占的构成比例。2 2)适用资料:)适用资料:。3 3)应用:)应用:4 4)绘制要点:)绘制要点:每每3.63.6o o为为1%1%,用,用3.63.6乘以百分数即为所占扇形的乘以百分数即为所占扇形的度数。用量角器画出。度数。用量角器画出。从相当于从相当于的位置开始的位置开始方向绘图。方向绘图。每部分用不同线条或颜色表示,并在图上标出每部分用不同线条或颜色表示,并在图上标出百分比,下附图例说

36、明。百分比,下附图例说明。当比较不同资料的百分构成时,可以画两个相当比较不同资料的百分构成时,可以画两个相等大小的圆,在每个圆的下面写明标题,并用等大小的圆,在每个圆的下面写明标题,并用相同的图例表示同一个构成部分。相同的图例表示同一个构成部分。图4.某 地5 岁以下 儿童死亡原因分布43%30%18%9%呼吸系疾病传染病先天性疾病其它副 教 授33.2%教 辅 人 员25.5%讲 师21.4%助 教10.2%教 授9.8%图图7 2008年某医科大学公共卫生学院专业技术人员构成年某医科大学公共卫生学院专业技术人员构成 1 1)概念:以线段的上升或下降来表示事物在时间上)概念:以线段的上升或下

37、降来表示事物在时间上的发展变化或一种现象随另一种现象变迁的情况的发展变化或一种现象随另一种现象变迁的情况2 2)适用资料:)适用资料:的,但的,但的资料。的资料。3 3)应用:)应用:表示资料的变化趋势,并可表明表示资料的变化趋势,并可表明,如另一连续变,如另一连续变量是时间,则称量是时间,则称。4 4)绘制要点:)绘制要点:坐标轴:横轴表示时间或组段,纵轴表示频数或坐标轴:横轴表示时间或组段,纵轴表示频数或率。率。,因此在看图时要,因此在看图时要注意纵轴的起点坐标。注意纵轴的起点坐标。数据点画在组段中间位置。相邻的点用直线连接,数据点画在组段中间位置。相邻的点用直线连接,。无数据的组段用虚线

38、连。无数据的组段用虚线连接。直线不能任意外延。接。直线不能任意外延。,否则不易分清。当有两条或两条以上曲线在同一否则不易分清。当有两条或两条以上曲线在同一张线图上时,须用不同颜色或不同的图形形式加张线图上时,须用不同颜色或不同的图形形式加以区分,并附图例加以说明。以区分,并附图例加以说明。图5 某地1 9 49-1958年 婴 儿死亡率0204060801001201401949 1950 1951 1952 1953 1954 1955 1956 1957 1958年份婴儿死亡率(1/千)图图9 某地某地1950-1966年伤寒与结核病死亡率年伤寒与结核病死亡率 1 1)概念:又称频数分布图

39、,用于表达)概念:又称频数分布图,用于表达的的的的。以各矩形面积来代表各组。以各矩形面积来代表各组频数的多少频数的多少。2 2)适用资料:)适用资料:3 3)绘制要点)绘制要点坐标轴:横轴代表变量值,要用相等的距离表坐标轴:横轴代表变量值,要用相等的距离表示相等的数量。示相等的数量。各矩形间各矩形间。对于组距相等的资料可以直接作图;对于组距相等的资料可以直接作图;,全部转化为组距相等的频,全部转化为组距相等的频数,用转化后的频数作图。数,用转化后的频数作图。标化后的热能(R)1.501.381.251.131.00.88.75.63.50.38频数(人)121086420Std.Dev=.28

40、 Mean=.74N=39.00020040060080048121620人数图图11 2008年某地区居民受教育年限分布年某地区居民受教育年限分布 将直方图各组的顶部中点用直线连接起来的统将直方图各组的顶部中点用直线连接起来的统计图。计图。:折线向左右两边各延伸一组,并取频数为折线向左右两边各延伸一组,并取频数为0,以保证图形的封闭性。以保证图形的封闭性。随着分组组数的增多,则组距越来越小时,所随着分组组数的增多,则组距越来越小时,所 得的曲线为得的曲线为。1 1)概念:以)概念:以。2 2)适用资料:)适用资料:3 3)应用:)应用:4 4)绘制要点:)绘制要点:横轴代表一个变量,纵轴代表

41、另一个变量。横轴代表一个变量,纵轴代表另一个变量。纵横轴的纵横轴的,根据,根据资料的情况而定。资料的情况而定。图1 0.某 地2 0 岁男 青 年身高和前臂长的关系15016017018019040455055 前臂长(c m)身高(c m)00.10.20.30.40.50.60.70.80.91051015202530WR二、统计表二、统计表(statistical tables)统计表就是以表格的形式,表达被统计表就是以表格的形式,表达被研究对象的特征、内部构成及研究项研究对象的特征、内部构成及研究项目分组之间的数量关系。目分组之间的数量关系。统计表的基本结构包括:统计表的基本结构包括:

42、、以及、以及。表表1.甲、乙两地甲、乙两地2006年年HbsAg阳性率阳性率地区调查数阳性数阳性率(%)甲地 5000110022.0乙地 6000105017.5合计11000215019.5 :表格的总名称:表格的总名称(甲、乙两地(甲、乙两地20062006年年HbsAg阳性率)阳性率):横行数字的属性,位于表格的左侧横行数字的属性,位于表格的左侧(表(表 1 1中的中的“甲地、乙地、合计甲地、乙地、合计”一栏)一栏)每一列中数字的属性,位于表格的第每一列中数字的属性,位于表格的第 一横行一横行(表(表1 1中的中的“调查数、阳性数、阳性率调查数、阳性数、阳性率”)横、纵标目横、纵标目连起来可以完成对一个指标的完整连起来可以完成对一个指标的完整叙述叙述(第一个行中的数字可以理解为(第一个行中的数字可以理解为“甲地甲地20062006年调查了年调查了50005000人,人,阳性人数为阳性人数为11001100人,阳性率为人,阳性率为22.0%”22.0%”)表格中还有表格中还有和和,以及,以及。备注是对于。备注是对于 表格的文字说明。表格的文字说明。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 医疗、心理类
版权提示 | 免责声明

1,本文(医药统计学-第一章-数据的描述与整理概要课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|