1、2023-1-13西安医学院公共卫生系医学统计学流病统计教研室雷静绪论绪论2023-1-13西安医学院公共卫生系1.统计学(统计学(statistics),是研究数据的搜集、),是研究数据的搜集、整理与分析的科学,面对不确定的数据(偶然整理与分析的科学,面对不确定的数据(偶然性的)作出科学的推断。性的)作出科学的推断。意义:偶然性意义:偶然性 必然性(客观规律)必然性(客观规律)2.医学统计学(医学统计学(health statistics)是应用统)是应用统计学的原理、方法(如概率论数理统计的理论)计学的原理、方法(如概率论数理统计的理论)研究医学数据资料的收集、整理、分析和推断研究医学数据
2、资料的收集、整理、分析和推断的一门学科。的一门学科。医学统计学的作用及意义医学统计学的作用及意义2023-1-13西安医学院公共卫生系1.统计设计统计设计(design):医学研究:实验性研究与观察性研究医学研究:实验性研究与观察性研究研究设计:专业设计和统计设计研究设计:专业设计和统计设计 医学统计学的基本内容医学统计学的基本内容2023-1-13西安医学院公共卫生系专业设计:专业设计:选题选题 研究目的和假说研究目的和假说 观察对象、处理因素、实验或观察方法观察对象、处理因素、实验或观察方法 实验材料设备实验材料设备 实验效应、观察指标实验效应、观察指标2023-1-13西安医学院公共卫生
3、系统计设计:统计设计:实验分组或抽样方法实验分组或抽样方法 样本含量的估计样本含量的估计 数据管理与质量控制数据管理与质量控制 拟使用的统计分析方法拟使用的统计分析方法2023-1-13西安医学院公共卫生系2.数据整理数据整理:净化原始数据净化原始数据 (发现异常值、离群值、有效数字统一)(发现异常值、离群值、有效数字统一)使其系统化、条理化,便于进一步计算指标和分析使其系统化、条理化,便于进一步计算指标和分析2023-1-13西安医学院公共卫生系3.统计描述(统计描述(descriptive statistics)指用统计指标、统计表、统计图等方法,对资料指用统计指标、统计表、统计图等方法,
4、对资料的数量特征及其分布规律进行测定和描述,不涉及的数量特征及其分布规律进行测定和描述,不涉及由样本推论总体的问题。由样本推论总体的问题。2023-1-13西安医学院公共卫生系4.统计推断(统计推断(inferential statistics)指如何抽样,及如何由样本信息推断总体问题指如何抽样,及如何由样本信息推断总体问题(包括参数估计和假设检验)。(包括参数估计和假设检验)。2023-1-13西安医学院公共卫生系医学统计中的基本概念医学统计中的基本概念 一、同质与变异:一、同质与变异:同一总体中的个体间具有同一总体中的个体间具有同质同质性(共性)性(共性)变异即个体差异,由众多的、偶然的、
5、变异即个体差异,由众多的、偶然的、次要的因素造成的。次要的因素造成的。不能不能由个体由个体代替代替总体,如许多药物广告总体,如许多药物广告2023-1-13西安医学院公共卫生系二、变量与资料(数据)类型:二、变量与资料(数据)类型:1.定量数据(计量资料)定量数据(计量资料)(measurement data)是对每个观察单位(对象)的某项特征是对每个观察单位(对象)的某项特征(指标)进行定量测定所得到的资料。一般(指标)进行定量测定所得到的资料。一般有度量衡单位,如身高、体重、浓度、脉搏、有度量衡单位,如身高、体重、浓度、脉搏、血钠、血钾等。血钠、血钾等。等比资料为其特例,如抗体滴度资料、等
6、比资料为其特例,如抗体滴度资料、细菌菌落数等。细菌菌落数等。2023-1-13西安医学院公共卫生系2.定性数据(计数资料)定性数据(计数资料)(enumeration data)先将观察单位的某项指标按性质或类别进先将观察单位的某项指标按性质或类别进行分组,然后计算各组的数目所得的资料。行分组,然后计算各组的数目所得的资料。又称无序分类资料。又称无序分类资料。(1)二项分类:两类间互相对立,)二项分类:两类间互相对立,如如+、-;治愈与未愈。;治愈与未愈。(2)多项分类:互不相容的多个类别。)多项分类:互不相容的多个类别。如血型(如血型(A、B、AB、O)2023-1-13西安医学院公共卫生系
7、3.有序数据(等级资料)有序数据(等级资料)又称有序分类资料又称有序分类资料 各类间有程度的差别,又具计数资料的各类间有程度的差别,又具计数资料的特性。特性。半定量半定量如:如:-、+、+;无效、有效、显效。;无效、有效、显效。根据需要,计量资料可转化为计数或等级资料根据需要,计量资料可转化为计数或等级资料试判断下列资料的类型试判断下列资料的类型2023-1-13西安医学院公共卫生系试判断下列资料的类型试判断下列资料的类型1.测得某班女生的身高资料如下测得某班女生的身高资料如下(cm):150、152、156、159、159、160、160、161、161、162、163、165、168、17
8、0。2.将上述资料加以整理,分为两组:将上述资料加以整理,分为两组:不超过不超过160 cm者者 7人人 超过超过160 cm者者 7人人3.较低较低(150159)3人人 一般一般(159164)8人人 较高较高(164 )3人人2023-1-13西安医学院公共卫生系三、总体(三、总体(population)与样本()与样本(sample)总体:总体:同质的所有观察单位某种变量值的集合。同质的所有观察单位某种变量值的集合。有限总体:如一定时刻某特定人群的有限总体:如一定时刻某特定人群的H、W 无限总体:如用某药治疗的患者(时间、空间上无限总体:如用某药治疗的患者(时间、空间上无限,观察数无限
9、)。无限,观察数无限)。2023-1-13西安医学院公共卫生系 样本:样本:是从总体中是从总体中随机随机抽取部分观察单位,其抽取部分观察单位,其实测值的集合。实测值的集合。目的是用样本信息来推断总体特征。目的是用样本信息来推断总体特征。样本含量(样本大小、样本例数):即样本包样本含量(样本大小、样本例数):即样本包含的观察单位数。含的观察单位数。随机,不是随意,随机,不是随意,它应保证总体中每个个体被它应保证总体中每个个体被抽取的机率是相等的。抽取的机率是相等的。医学研究的现象绝大多数是随机现象。医学研究的现象绝大多数是随机现象。2023-1-13西安医学院公共卫生系四、参数与统计量四、参数与
10、统计量统计学上常用一些典型的分布模式来近似的统计学上常用一些典型的分布模式来近似的描述变量取值的实际分布,称之为统计模型。描述变量取值的实际分布,称之为统计模型。常见的模型有:正态分布、二项分布、泊松常见的模型有:正态分布、二项分布、泊松分布等。分布等。描述总体分布特征的数值称之为描述总体分布特征的数值称之为参数参数;描述;描述样本分布特征的数值称之为样本分布特征的数值称之为统计量统计量。2023-1-13西安医学院公共卫生系五、误差(五、误差(error)泛指观测值与真实值之差,泛指观测值与真实值之差,样本指标与总体指标之间的差异。样本指标与总体指标之间的差异。主要分三类:主要分三类:(一)
11、系统误差:客观条件、固定因素造成,观察结果(一)系统误差:客观条件、固定因素造成,观察结果有一定的倾向性,偏大或偏小,可校正。有一定的倾向性,偏大或偏小,可校正。如仪器未调零、试剂未校正等。如仪器未调零、试剂未校正等。(二)随机测量误差:生物体的自然变异和各种不可预(二)随机测量误差:生物体的自然变异和各种不可预知的偶然因素造成,没有固定的倾向。知的偶然因素造成,没有固定的倾向。采取一定的措施,可控制在一定的范围内。采取一定的措施,可控制在一定的范围内。如通过多次测量获得的均数。如通过多次测量获得的均数。2023-1-13西安医学院公共卫生系(三)抽样误差:样本与总体之间的差异(三)抽样误差:
12、样本与总体之间的差异 (前两种误差被控制的情况下)(前两种误差被控制的情况下)产生的原因:产生的原因:1.个体差异;个体差异;2.抽样时只能抽取总体的一部分作为样本。抽样时只能抽取总体的一部分作为样本。一般,样本含量越大,抽样误差越小。一般,样本含量越大,抽样误差越小。统计学上,可通过统计学上,可通过“假设检验假设检验”(显著性检验)(显著性检验)来判断抽样误差的大小。来判断抽样误差的大小。2023-1-13西安医学院公共卫生系1.随机现象:在基本条件不变的情况下,观察随机现象:在基本条件不变的情况下,观察的实验,可能出现这种结果,也可能出现那的实验,可能出现这种结果,也可能出现那种结果,呈现
13、出一种偶然性,这种现象称随种结果,呈现出一种偶然性,这种现象称随机现象。机现象。随机试验的三个特点:随机试验的三个特点:可在相同条件下重复进行;可在相同条件下重复进行;每次试验的可能结果不止一个,并且事先能明确每次试验的可能结果不止一个,并且事先能明确试验的所有可能结果;试验的所有可能结果;进行一次试验之前不能确定哪一种结果会出现。进行一次试验之前不能确定哪一种结果会出现。六、概率(六、概率(probability)2023-1-13西安医学院公共卫生系2.随机事件(随机事件(random event)随机事件:在随机试验中,可能出现的结随机事件:在随机试验中,可能出现的结果称为随机事件。果称
14、为随机事件。频率频率:在相同条件下重复进行:在相同条件下重复进行N次随机试验次随机试验中,若事件中,若事件A出现出现m次,则次,则m/N称为事件称为事件A在在N次试验中出现的频率,简称为事件次试验中出现的频率,简称为事件A的的频率记作频率记作W(A)。)。大量的重复试验显示,某事件出现的频率大量的重复试验显示,某事件出现的频率具稳定性,说明随机事件出现的可能性大具稳定性,说明随机事件出现的可能性大小是事件本身固有的一种客观属性,可以小是事件本身固有的一种客观属性,可以对它进行度量。对它进行度量。2023-1-13西安医学院公共卫生系3.概率概率(probability)-P4统计定义:若在某一
15、组条件下,当试验次数越统计定义:若在某一组条件下,当试验次数越来越多,事件来越多,事件A出现的频率稳定在某一常数出现的频率稳定在某一常数p附近作微小摆动,称常数附近作微小摆动,称常数p为事件为事件A的概率,的概率,记作记作P(A)=p 是描述随机事件发生的可能性大小的数值是描述随机事件发生的可能性大小的数值。常用常用P表示,事件表示,事件A发生的概率记为发生的概率记为P(A)。)。频率频率一般是不确定的数,一般是不确定的数,概率概率则为确定的数;则为确定的数;当试验次数足够多时,频率相对稳定,便把当试验次数足够多时,频率相对稳定,便把频率作为概率的近似值。频率作为概率的近似值。即即P(A)W(
16、A)。)。2023-1-13西安医学院公共卫生系概率的三个性质概率的三个性质(1)对于任何事件)对于任何事件A,有,有0P(A)1;(2)对于必然事件,)对于必然事件,P(A)=1;(3)对于不可能事件,)对于不可能事件,P(A)=0。2023-1-13西安医学院公共卫生系4.小概率事件小概率事件:习惯将习惯将P0.05或或P0.01称为小概率事称为小概率事件。表示事件发生的可能性很小。件。表示事件发生的可能性很小。这种小概率事件在一次试验中可以认这种小概率事件在一次试验中可以认为不会发生为不会发生即即小概率原理小概率原理。以此作为。以此作为假设检验判断的基本依据。假设检验判断的基本依据。20
17、23-1-13西安医学院公共卫生系 对统计公式,只要求了解其意义、对统计公式,只要求了解其意义、用途和应用条件用途和应用条件 不必深究其数学推导不必深究其数学推导六、学习医学统计学应注意的问题六、学习医学统计学应注意的问题2023-1-13西安医学院公共卫生系小结小结 统计工作的基本内容统计工作的基本内容 计量资料、计数资料、等级分组资料计量资料、计数资料、等级分组资料 总体、样本总体、样本 频率、概率、小概率事件频率、概率、小概率事件后面内容直接删除就行资料可以编辑修改使用资料可以编辑修改使用资料仅供参考,实际情况实际分析主要经营:课件设计,文档制作,网络软件设计、图文设计制作、发布广告等秉着以优质的服务对待每一位客户,做到让客户满意!致力于数据挖掘,合同简历、论文写作、PPT设计、计划书、策划案、学习课件、各类模板等方方面面,打造全网一站式需求The user can demonstrate on a projector or computer,or print the presentation and make it into a film to be used in a wider field