第一章绪论基本概念课件.ppt

上传人(卖家):晟晟文业 文档编号:5068105 上传时间:2023-02-08 格式:PPT 页数:57 大小:135KB
下载 相关 举报
第一章绪论基本概念课件.ppt_第1页
第1页 / 共57页
第一章绪论基本概念课件.ppt_第2页
第2页 / 共57页
第一章绪论基本概念课件.ppt_第3页
第3页 / 共57页
第一章绪论基本概念课件.ppt_第4页
第4页 / 共57页
第一章绪论基本概念课件.ppt_第5页
第5页 / 共57页
点击查看更多>>
资源描述

1、第一章第一章 绪论与统计学基本概念绪论与统计学基本概念 流行病统计学系韩少梅流行病统计学系韩少梅统计学的定义统计学的定义 统计学统计学(statisticsstatistics)就是运用概率论和就是运用概率论和数理统计的基本原理和方法,来研究数据的搜数理统计的基本原理和方法,来研究数据的搜集、整理和分析的一门学科。集、整理和分析的一门学科。统计学既是描述、归纳、搜集数据规律和统计学既是描述、归纳、搜集数据规律和解释数据的科学,也是研究人员合理地、灵活解释数据的科学,也是研究人员合理地、灵活地应用统计学原理和方法,充分提取信息,深地应用统计学原理和方法,充分提取信息,深入解释事物客观规律的一种手

2、段。入解释事物客观规律的一种手段。一一、医学统计学医学统计学 “根据数理统计的原理、方法紧密结合医学根据数理统计的原理、方法紧密结合医学实践,研究医药卫生领域中的资料收集、整理、实践,研究医药卫生领域中的资料收集、整理、分析和推断的一门应用学科,来分析和解释生物分析和推断的一门应用学科,来分析和解释生物界各种现象和实验调查资料的科学界各种现象和实验调查资料的科学”。l医学统计学是统计学与基础医学、预防医学、临床医学医学统计学是统计学与基础医学、预防医学、临床医学相结合的一门交叉学科。相结合的一门交叉学科。l它是以基础医学、预防医学、临床医学理论为指导,用它是以基础医学、预防医学、临床医学理论为

3、指导,用统计学的原理和方法来研究其领域数据的搜集、整理和统计学的原理和方法来研究其领域数据的搜集、整理和分析,并以资料所提供的信息来指导我们更好的开展疾分析,并以资料所提供的信息来指导我们更好的开展疾病控制和治疗工作。病控制和治疗工作。主要学习内容主要学习内容1 1、统计描述(定量资料和分类资料的集中趋势和离散趋、统计描述(定量资料和分类资料的集中趋势和离散趋势指标、抽样误差和参数估计及常用统计图表);势指标、抽样误差和参数估计及常用统计图表);2 2、常见的理论分布及其应用(正态分布、二项分布与、常见的理论分布及其应用(正态分布、二项分布与PoissonPoisson分布);分布);3 3、

4、总体参数的估计(分总体均数、总体率和总体平均、总体参数的估计(分总体均数、总体率和总体平均数);数);4 4、假设检验(、假设检验(t t检验、检验、u u检验、方差分析、相对数、二项检验、方差分析、相对数、二项分布及其应用、四格表及列联表资料的卡方检验、秩和分布及其应用、四格表及列联表资料的卡方检验、秩和检验等);检验等);5 5、回归与相关、多元线性回归与、回归与相关、多元线性回归与logisticlogistic回归;回归;6 6、实验设计和调查设计、实验设计和调查设计研究对象研究对象l医学统计学的研究对象是人体及与人体有关的各种具医学统计学的研究对象是人体及与人体有关的各种具有不确定性

5、的医学数据。有不确定性的医学数据。l统计学所要研究的是有变异的信息统计学所要研究的是有变异的信息,即随机变量。在即随机变量。在同类的对象中往往存在着变异。如果各观察个体都完同类的对象中往往存在着变异。如果各观察个体都完全相同,没有什么变异,就不是统计学的研究对象了。全相同,没有什么变异,就不是统计学的研究对象了。医学统计学的主要内容医学统计学的主要内容l统计学基本原理和方法统计学基本原理和方法 包括资料的收集、整理和分析包括资料的收集、整理和分析的基本原理和方法。的基本原理和方法。l医学研究设计医学研究设计 包括观察性研究中的现场调查、病例对包括观察性研究中的现场调查、病例对照研究和队列研究设

6、计,实验研究中的临床试验、动照研究和队列研究设计,实验研究中的临床试验、动物实验及实验室研究设计等。物实验及实验室研究设计等。l统计学的应用统计学的应用 包括医学人口统计、生命统计及疾病监包括医学人口统计、生命统计及疾病监测与控制中常用的综合评价方法。测与控制中常用的综合评价方法。医学统计学的任务医学统计学的任务 l结合专业知识和具体要求进行医学科研设计;结合专业知识和具体要求进行医学科研设计;l对收集到的资料进行整理,做统计描述;对收集到的资料进行整理,做统计描述;l对资料进行统计分析和解释。对资料进行统计分析和解释。医学统计学的作用医学统计学的作用 l保证调查和试验设计的科学性和完整性;保

7、证调查和试验设计的科学性和完整性;l指标的确定应具有特异性、客观性、灵敏性和精密度高;指标的确定应具有特异性、客观性、灵敏性和精密度高;比如:要评价某种治疗方法对某种恶性肿瘤的治疗效果,比如:要评价某种治疗方法对某种恶性肿瘤的治疗效果,所选用的评价指标应该是一年生存率、五年生存率等指所选用的评价指标应该是一年生存率、五年生存率等指标,而不应选用治愈率或死亡率等指标。标,而不应选用治愈率或死亡率等指标。l样本量足够大,数据真实可靠;样本量足够大,数据真实可靠;l选用统计分析方法正确。选用统计分析方法正确。二二、统计工作的基本步骤统计工作的基本步骤 1.研究设计研究设计2.搜集资料搜集资料3.整理

8、资料整理资料4.分析资料分析资料 WebsterWebster国际大辞典(第三版)对统计学的定义是国际大辞典(第三版)对统计学的定义是“a science dealing with the collection,a science dealing with the collection,analysis,interpretation and presentation of analysis,interpretation and presentation of numerical data”numerical data”。Last JM Last JM 主编的一本流行病学辞典对统计学的定义是主编

9、的一本流行病学辞典对统计学的定义是“the science and art of dealing with variation in the science and art of dealing with variation in data through collection,classification and data through collection,classification and analysis in such a way as to obtain reliable analysis in such a way as to obtain reliable results”

10、results”。由此可知:统计学是处理资料中变异性的科学和由此可知:统计学是处理资料中变异性的科学和艺术,是关于数据收集、整理、表达和解释的普遍原理艺术,是关于数据收集、整理、表达和解释的普遍原理和方法。这里强调了和方法。这里强调了“过程过程”,但在实际工作中,许多,但在实际工作中,许多人往往是忽略了设计、收集和归类(整理),到了分析人往往是忽略了设计、收集和归类(整理),到了分析数据时才想到统计学,此时难免发生数据时才想到统计学,此时难免发生“悔之晚矣悔之晚矣”的憾的憾事。事。科学研究过程科学研究过程任何一项医学研究,在确定研究目的之后,首要任何一项医学研究,在确定研究目的之后,首要问题:

11、考虑怎样安排试验或者说需要一份良好的问题:考虑怎样安排试验或者说需要一份良好的研究计划研究计划(称为研究设计称为研究设计),它是使研究结果满足,它是使研究结果满足科学性的重要保证。科学性的重要保证。数据采集数据采集数据分析数据分析设计报报告告1.研究设计研究设计l研究设计(研究设计(design)是对整个研究过程的总体设想和是对整个研究过程的总体设想和安排,是统计工作和医学科研工作的基础。安排,是统计工作和医学科研工作的基础。l研究设计的质量直接影响着试验结果的准确性、可靠研究设计的质量直接影响着试验结果的准确性、可靠性、严密性和代表性,一旦出现设计上的失误或缺陷,性、严密性和代表性,一旦出现

12、设计上的失误或缺陷,可能会导致整个研究的失败。可能会导致整个研究的失败。研究设计的主要内容研究设计的主要内容l研究的目的、意义和预期结果;研究的目的、意义和预期结果;l具体的研究内容或调查项目具体的研究内容或调查项目;l样本含量的估计及研究对象的选择;样本含量的估计及研究对象的选择;l随机抽样的方法,观察单位和分析指标的选取;随机抽样的方法,观察单位和分析指标的选取;l数据库的建立和维护,资料整理和分析的方法;数据库的建立和维护,资料整理和分析的方法;l数据库软件和统计分析软件的选用;数据库软件和统计分析软件的选用;l在资料的搜集、整理和分析的全过程中控制误差的方法在资料的搜集、整理和分析的全

13、过程中控制误差的方法和具体措施;和具体措施;l在研究的整个过程中需动用的人力、物力和财力;在研究的整个过程中需动用的人力、物力和财力;l研究的进度和参与人员,等等。研究的进度和参与人员,等等。l根据内容可分为根据内容可分为专业设计专业设计和和统计设计统计设计。专业设计要求运用医学专业知识进行设计,它反映专业设计要求运用医学专业知识进行设计,它反映了研究者对医学专业知识的掌握程度和能力;了研究者对医学专业知识的掌握程度和能力;统计设计是运用统计学知识进行设计,是保证研究统计设计是运用统计学知识进行设计,是保证研究者正确运用统计学知识进行统计描述和统计推断的者正确运用统计学知识进行统计描述和统计推

14、断的前提。前提。研究设计类型研究设计类型 统计设计可按照在研究过程中是否对研究对象进行统计设计可按照在研究过程中是否对研究对象进行干预分为调查研究设计和实验研究设计。干预分为调查研究设计和实验研究设计。调查设计是指研究者通过客观地观察、描述调查对调查设计是指研究者通过客观地观察、描述调查对象来搜集资料,未加任何的干预措施,比如:调查象来搜集资料,未加任何的干预措施,比如:调查了解某地学龄前儿童的乙肝表面抗原的阳性率,某了解某地学龄前儿童的乙肝表面抗原的阳性率,某地新生儿出生缺陷的发生率等;地新生儿出生缺陷的发生率等;实验设计是指研究者根据研究假设主动地对研究对实验设计是指研究者根据研究假设主动

15、地对研究对象加以干预措施,并观察总结其结果,回答研究假象加以干预措施,并观察总结其结果,回答研究假设所提出的问题。设所提出的问题。实例:调查设计实例:调查设计-某地老年人生活质量和需求的研究设计某地老年人生活质量和需求的研究设计研究目的是了解研究目的是了解某地某地老年人生活质量现状并探讨影响老年人生老年人生活质量现状并探讨影响老年人生活质量的主要因素;活质量的主要因素;研究方法是以问卷访谈方式来评价老年人的生活质量状况;研究方法是以问卷访谈方式来评价老年人的生活质量状况;资料收集是由经过专门培训的调查员资料收集是由经过专门培训的调查员(学生和教师学生和教师)对老年人进对老年人进行入户访问获得;

16、行入户访问获得;调查量表采用专门生活质量量表,并根据当地的实际情况进行调查量表采用专门生活质量量表,并根据当地的实际情况进行适当的修改;适当的修改;收集到的资料经核查整理后建立数据库,并用统计分析软件进收集到的资料经核查整理后建立数据库,并用统计分析软件进行相应的整理和分析。行相应的整理和分析。实例:实验设计实例:实验设计-研究脂健乳是否有降脂作用研究脂健乳是否有降脂作用 首先假设脂健乳可以降低血脂,再将条件相似的首先假设脂健乳可以降低血脂,再将条件相似的2020只大鼠先用高脂饲料喂养做成高脂血症的模型。只大鼠先用高脂饲料喂养做成高脂血症的模型。然后将动物随机分为实验组和对照组然后将动物随机分

17、为实验组和对照组 实验组服用脂健乳实验组服用脂健乳 对照组单纯服用豆奶对照组单纯服用豆奶 喂养一个月后观察比较两组之间各项血脂指标的喂养一个月后观察比较两组之间各项血脂指标的差别有无统计学意义,进而得出脂健乳是否具有降低差别有无统计学意义,进而得出脂健乳是否具有降低血脂的保健作用的结论。血脂的保健作用的结论。2.搜集资料搜集资料l搜集资料是研究人员按照研究设计的具体要求,获得准搜集资料是研究人员按照研究设计的具体要求,获得准确、完整、可靠的原始数据确、完整、可靠的原始数据。l医学统计资料主要来源于三方面:医学统计资料主要来源于三方面:统计工作报表和报告卡统计工作报表和报告卡 常规保存的工作记录

18、常规保存的工作记录 专项调查和实验研究资料专项调查和实验研究资料3.整理资料整理资料l整理资料是按照研究设计的目的对资料进行分组归纳,整理资料是按照研究设计的目的对资料进行分组归纳,使分散的数据条理化,系统化,为资料的进一步分析使分散的数据条理化,系统化,为资料的进一步分析做准备。做准备。l原始资料的人工检查、核对原始资料的人工检查、核对 l输入计算机、建立数据库输入计算机、建立数据库 l对数据库资料进行计算机检查对数据库资料进行计算机检查 4.分析资料分析资料l分析资料是指计算有关的统计指标,以反映数据的综分析资料是指计算有关的统计指标,以反映数据的综合特征,阐明事物的内在联系和规律。合特征

19、,阐明事物的内在联系和规律。l统计描述是根据研究设计的要求,选用适当的统计指统计描述是根据研究设计的要求,选用适当的统计指标、统计表、统计图等方法,对资料的数量特征及分标、统计表、统计图等方法,对资料的数量特征及分布规律进行测定和描述。布规律进行测定和描述。l统计推断是根据概率分布和抽样的原理,在随机变量统计推断是根据概率分布和抽样的原理,在随机变量的样本信息基础上推断总体特征。统计推断包括参数的样本信息基础上推断总体特征。统计推断包括参数估计和假设检验。在进行统计分析时,要根据统计设估计和假设检验。在进行统计分析时,要根据统计设计的目的和要求,选用正确的统计推断方法,对样本计的目的和要求,选

20、用正确的统计推断方法,对样本资料进行准确的描述和推断,才能得到真实可靠的分资料进行准确的描述和推断,才能得到真实可靠的分析结果。析结果。三三、统计学的基本概念统计学的基本概念l同质与变异同质与变异l随机变量与研究资料的类型随机变量与研究资料的类型l医学研究中常用的测量尺度医学研究中常用的测量尺度l个体、总体与样本个体、总体与样本l参数与统计量参数与统计量l误差误差l频率与概率频率与概率 同质同质 就是性质相同,它是进行统计分析的前提。就是性质相同,它是进行统计分析的前提。统计分析是在一定数量的观察单位的基础上进统计分析是在一定数量的观察单位的基础上进行的,这一定数量的观察单位在研究的主要方行的

21、,这一定数量的观察单位在研究的主要方面必须具有相同的性质。面必须具有相同的性质。比如,研究某地高血压病人的生活质量,研究对象比如,研究某地高血压病人的生活质量,研究对象必须是同质的,即都是同一地区的高血压病人。必须是同质的,即都是同一地区的高血压病人。如果不能满足同质的要求,那么研究资料就是杂乱如果不能满足同质的要求,那么研究资料就是杂乱无章的,便不能得出有用的信息和结论。无章的,便不能得出有用的信息和结论。变异变异 同质是相对的,研究对象只是在某一方面是性质相同质是相对的,研究对象只是在某一方面是性质相同的,同类的观察对象之间往往也存在着变异。同的,同类的观察对象之间往往也存在着变异。比如,

22、同一地区、同一年龄的男童的身高并非完全相比如,同一地区、同一年龄的男童的身高并非完全相同,而是千差万别、参差不齐的,这种参差不齐的情同,而是千差万别、参差不齐的,这种参差不齐的情况就是变异况就是变异。与同质的相对性不同,变异是绝对的、客观存在的,与同质的相对性不同,变异是绝对的、客观存在的,这在生物学和医学界是非常普遍的。这在生物学和医学界是非常普遍的。统计学就是通过对变异的研究来探索生物随机现统计学就是通过对变异的研究来探索生物随机现象内在规律的一门科学。象内在规律的一门科学。变量与随机变量变量与随机变量l变量是指我们观察或测量到的每个观察单位的特征或指变量是指我们观察或测量到的每个观察单位

23、的特征或指标标,对观察单位的各个变量的观察结果称为变量值或观对观察单位的各个变量的观察结果称为变量值或观察值察值,因为测量不同的观察单位会得到不同的观察结果,因为测量不同的观察单位会得到不同的观察结果,所以称之为变量。所以称之为变量。l变异是生物个体的共有特征,反映了生物个体的不确定变异是生物个体的共有特征,反映了生物个体的不确定性。在测量观察单位的变量值之前,只知道变量值所在性。在测量观察单位的变量值之前,只知道变量值所在的可能范围,并不知道其具体取值情况,比如只知道的可能范围,并不知道其具体取值情况,比如只知道8岁岁男童的身高可能在男童的身高可能在50-150厘米的范围内,但不能确定某厘米

24、的范围内,但不能确定某个男童的具体身高,正是因为变量的这种不确定性,概个男童的具体身高,正是因为变量的这种不确定性,概率论中将其称为随机变量率论中将其称为随机变量。医学研究中常用的测量尺度医学研究中常用的测量尺度l名义尺度:名义尺度:指变量的结果是按事物属性分类来进指变量的结果是按事物属性分类来进行的测量,如性别、职业,所有符号与属性一一对行的测量,如性别、职业,所有符号与属性一一对应,同一符号内各变量值的本质相同。应,同一符号内各变量值的本质相同。l顺序尺度:顺序尺度:其变量值不但可以分类,而且各类之其变量值不但可以分类,而且各类之间有某种特征程度上的不同,可用数学上大于或小间有某种特征程度

25、上的不同,可用数学上大于或小于来表达它们之间的关系,如治疗结果、文化程度。于来表达它们之间的关系,如治疗结果、文化程度。l区间尺度:区间尺度:指用数量大小来度量某种特征,它不仅指用数量大小来度量某种特征,它不仅表示顺序,而且可把两次测量之间的相差表达出来。表示顺序,而且可把两次测量之间的相差表达出来。其变量值可以是实数轴上的一个连续区间,任意两个其变量值可以是实数轴上的一个连续区间,任意两个取值之间可有无穷多个值,表现为连续型变量,也可取值之间可有无穷多个值,表现为连续型变量,也可以是整数范围内的随机变量。以是整数范围内的随机变量。l比数尺度:比数尺度:指以比值、比例等来度量某种特征,如指以比

26、值、比例等来度量某种特征,如中性粒细胞占白细胞总数的百分比、体重指数等。中性粒细胞占白细胞总数的百分比、体重指数等。个体、总体与样本个体、总体与样本 l个体个体:可以是一个人、一个动物、一个家庭、一个地可以是一个人、一个动物、一个家庭、一个地区、一份样品等,是科学研究的基本观察单位区、一份样品等,是科学研究的基本观察单位。l总体总体:根据研究目的所确定的性质相同的所有观察单根据研究目的所确定的性质相同的所有观察单位的某种变量值的集合。如:调查某地位的某种变量值的集合。如:调查某地1999年正常成年正常成年男子的红细胞数,则观察对象是该地年男子的红细胞数,则观察对象是该地1999年正常成年正常成

27、年男子,总体就是该地年男子,总体就是该地1999年正常成年男子的血红细年正常成年男子的血红细胞数。胞数。l根据总体中观察单位数是否已知,分为:有限总体根据总体中观察单位数是否已知,分为:有限总体:有有确定的时间、空间和有限个观察单位,如上例。无限总确定的时间、空间和有限个观察单位,如上例。无限总体体:没有确定的时间和空间限制,观察单位数为无限。没有确定的时间和空间限制,观察单位数为无限。l样本样本:从总体中随机抽取的部分观察单位的某个从总体中随机抽取的部分观察单位的某个变量的测量值所组成的集合。变量的测量值所组成的集合。l抽样的目的是用样本信息来推断总体特征,因此要抽样的目的是用样本信息来推断

28、总体特征,因此要保证样本的可靠性和代表性,使样本能够充分地反保证样本的可靠性和代表性,使样本能够充分地反映总体的真实情况。这就要求抽样要遵守随机化的映总体的真实情况。这就要求抽样要遵守随机化的原则,并保证足够的样本含量。原则,并保证足够的样本含量。l随机抽样是保证总体中每一个观察单位均有同等机随机抽样是保证总体中每一个观察单位均有同等机会被抽取。会被抽取。l样本含量样本含量:指样本中所包含的观察单位数。指样本中所包含的观察单位数。参数和统计量参数和统计量l在科研工作中,通过对样本中的观察单位的变量值进行在科研工作中,通过对样本中的观察单位的变量值进行统计分析所得到的统计指标称为统计分析所得到的

29、统计指标称为统计量统计量。如:样本均数、如:样本均数、样本回归系数、样本标准差、样本率等。样本回归系数、样本标准差、样本率等。l参数参数是反映总体特征的统计指标,如果样本的代表性好,是反映总体特征的统计指标,如果样本的代表性好,那么统计量与相应的参数的数值非常接近,就可以用样那么统计量与相应的参数的数值非常接近,就可以用样本统计量来估计总体参数,所以样本的统计量也称为参本统计量来估计总体参数,所以样本的统计量也称为参数的估计值,例如用样本均数、样本回归系数和样本率数的估计值,例如用样本均数、样本回归系数和样本率来估计总体均数、总体回归系数和总体率。来估计总体均数、总体回归系数和总体率。误差误差

30、 l统计学研究中,将观察值(实际值)与真实值(理论统计学研究中,将观察值(实际值)与真实值(理论值)之差称之为误差值)之差称之为误差,由于生物个体的变异性等原因由于生物个体的变异性等原因使得误差在医学领域中广泛存在。使得误差在医学领域中广泛存在。l误差按其产生的原因和性质可分为误差按其产生的原因和性质可分为:1.过失误差过失误差l过失误差是由于观察者的错误造成的误差,比如观察者过失误差是由于观察者的错误造成的误差,比如观察者有意或无意的记录错误,计算错误,数据核查、录入错有意或无意的记录错误,计算错误,数据核查、录入错误,度量衡单位错误,甚至故意修改数据导致的错误。误,度量衡单位错误,甚至故意

31、修改数据导致的错误。l过失误差在统计学研究中是不允许的,必须通过加强调过失误差在统计学研究中是不允许的,必须通过加强调查、录入和分析人员的责任心,完善检查核对制度等方查、录入和分析人员的责任心,完善检查核对制度等方法来避免和消除过失误差,以保证数据和结果的真实性。法来避免和消除过失误差,以保证数据和结果的真实性。2.系统误差系统误差l系统误差是由于设计人员、受试者、观察者、研究者、系统误差是由于设计人员、受试者、观察者、研究者、仪器设备、研究方法及外部环境的非实验因素等原因的仪器设备、研究方法及外部环境的非实验因素等原因的影响造成的有一定的变化规律的误差。影响造成的有一定的变化规律的误差。l总

32、的来说,系统误差的产生原因复杂,而且不能通过适总的来说,系统误差的产生原因复杂,而且不能通过适当的统计方法来消除,所以对研究结果的影响很大。当的统计方法来消除,所以对研究结果的影响很大。l但是系统误差一般是恒向、恒量的,且有其特定的变化但是系统误差一般是恒向、恒量的,且有其特定的变化规律,故可以通过严格、科学的实验设计将其减小或控规律,故可以通过严格、科学的实验设计将其减小或控制在最小范围之内。制在最小范围之内。3.随机误差随机误差l随机误差是排除过失误差、系统误差之后尚存在的误随机误差是排除过失误差、系统误差之后尚存在的误差,它由多种无法控制的因素引起的,大小和方向是差,它由多种无法控制的因

33、素引起的,大小和方向是随机变化的。随机变化的。l尽管随机误差是不可避免的,但其以零为中心呈正态尽管随机误差是不可避免的,但其以零为中心呈正态分布,所以可以利用概率统计学的方法对随机误差进分布,所以可以利用概率统计学的方法对随机误差进行估计。行估计。l随机误差包括抽样误差和随机测量误差两类。随机误差包括抽样误差和随机测量误差两类。l抽样误差是在随机抽样研究中,由于抽样而引起的样本统抽样误差是在随机抽样研究中,由于抽样而引起的样本统计量和总体参数之间的差异。抽样误差的大小主要取决于计量和总体参数之间的差异。抽样误差的大小主要取决于个体之间变异程度的大小和样本含量的多少,变异程度越个体之间变异程度的

34、大小和样本含量的多少,变异程度越大,样本含量越小,抽样误差就越大;反之亦然。大,样本含量越小,抽样误差就越大;反之亦然。l随机测量误差指在同一条件下对同一观察单位的同一指标随机测量误差指在同一条件下对同一观察单位的同一指标进行重复测量所产生的误差。由于医学技术水平的限制,进行重复测量所产生的误差。由于医学技术水平的限制,随机测量误差目前也是无法避免的,只能尽量提高仪器设随机测量误差目前也是无法避免的,只能尽量提高仪器设备的准确性和精密性来控制随机测量误差在容许的范围之备的准确性和精密性来控制随机测量误差在容许的范围之内。内。频率与概率频率与概率 l某单位配蜂刺脱敏药,陆续试用于被蜂刺的患者,共

35、某单位配蜂刺脱敏药,陆续试用于被蜂刺的患者,共计计200人,其中人,其中180人用药后症状减轻。有效率为人用药后症状减轻。有效率为180/200=0.90或或90%。这个数字是从反复实验与实际。这个数字是从反复实验与实际观察得来的。观察得来的。l那么对于另一个接受此治疗的病人,预计脱敏得可能那么对于另一个接受此治疗的病人,预计脱敏得可能性约为性约为90。就是说若有蜂刺患者。就是说若有蜂刺患者10人使用脱敏药,人使用脱敏药,预计约预计约9人可能有效。人可能有效。l这里这里180/200是频率。用数学语言来表示,在是频率。用数学语言来表示,在n次随机次随机试验中,随机事件试验中,随机事件A发生了发

36、生了k次,记次,记fn(A)=k/n,则称则称fn(A)为随机事件为随机事件A在在n次试验中出现的频率次试验中出现的频率。l实践证明,当实验次数实践证明,当实验次数n逐渐增多时,逐渐增多时,fn(A)在一个常数附在一个常数附近摆动。摆动的幅度随着近摆动。摆动的幅度随着n的增大将愈来愈小,而逐渐稳定的增大将愈来愈小,而逐渐稳定下来。这个常数是客观存在的,称为事件下来。这个常数是客观存在的,称为事件A的概率,记作的概率,记作P(A),),概率表示随机事件发生可能性的大小。概率表示随机事件发生可能性的大小。l频率稳定性是定义事件的概率的客观基础,它揭示了隐藏频率稳定性是定义事件的概率的客观基础,它揭

37、示了隐藏在随机现象中的规律性,这种规律性就是通常所说的统计在随机现象中的规律性,这种规律性就是通常所说的统计规律性。规律性。l实际应用中,常用实际应用中,常用n时的频率作为概率的估计值时的频率作为概率的估计值。l随机事件概率的大小在随机事件概率的大小在0 与与1 之间。之间。lP 值越接近值越接近1,表示某事件发生的可能性越大,表示某事件发生的可能性越大,lP 值越接近值越接近0,表示某事件发生的可能性越小。,表示某事件发生的可能性越小。l严格说,严格说,P=1,表示事件必然发生,表示事件必然发生,P=0,表示事件不表示事件不可能发生,他们是确定性的,不是随机事件,但可把可能发生,他们是确定性

38、的,不是随机事件,但可把他们看成随机事件的特例。他们看成随机事件的特例。l统计分析中的很多结论都是带有概率性的。统计分析中的很多结论都是带有概率性的。习惯上将习惯上将 P0.05,称为小概率事件,表示在一次实验或观察中称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可以视为很可能不发生。该事件发生的可能性很小,可以视为很可能不发生。四四、研究资料的类型、研究资料的类型l定量变量、数值变量计量资料定量变量、数值变量计量资料l定性变量、分类变量计数资料定性变量、分类变量计数资料l顺序变量、有序分类变量等级资料顺序变量、有序分类变量等级资料1.定量变量计量资料定量变量计量资料l定量变量

39、是用仪器、工具或其它定量方法进行测定或定量变量是用仪器、工具或其它定量方法进行测定或衡量所取得的数据。衡量所取得的数据。l其变量值是定量的,表现为大小不等的数值,可以由其变量值是定量的,表现为大小不等的数值,可以由区间尺度、比数尺度测得。区间尺度、比数尺度测得。l定量变量一般带有度量衡单位,如身高(定量变量一般带有度量衡单位,如身高(cm)、)、体体重(重(kg)、)、白细胞计数(白细胞计数(109/L)、)、血压(血压(kPa)、)、龋龋齿个数等。齿个数等。l由一组同质的定量变量所组成的资料称为计量资料,由一组同质的定量变量所组成的资料称为计量资料,计量资料的各个观察值之间有量的区别,没有性

40、质的计量资料的各个观察值之间有量的区别,没有性质的不同。不同。2.定性变量计数资料定性变量计数资料l其变量值是定性的,表现为无不相容的类别或属性,其变量值是定性的,表现为无不相容的类别或属性,一般由名义尺度测得。一般由名义尺度测得。l定性变量的属性指标的分类是无序的,这是定性变定性变量的属性指标的分类是无序的,这是定性变量与顺序变量的区别所在。量与顺序变量的区别所在。l由同质的定性变量组成的资料称为计数资料,计数由同质的定性变量组成的资料称为计数资料,计数资料是按照事物的属性分组,然后清点各组的观察资料是按照事物的属性分组,然后清点各组的观察单位个数得到的资料,各观察单位之间一般没有量单位个数

41、得到的资料,各观察单位之间一般没有量的区别,但有质的不同。的区别,但有质的不同。l计数资料的变量值只能代表事物的某些属性或分类,计数资料的变量值只能代表事物的某些属性或分类,不能反映程度上的差别。不能反映程度上的差别。定性变量的分类定性变量的分类l如果变量只有相互独立的两种属性,称为二分类变如果变量只有相互独立的两种属性,称为二分类变量,这是最简单的数据类型,如性别有男或女;检量,这是最简单的数据类型,如性别有男或女;检查乙肝表面抗原的携带情况,有阳性或阴性;给小查乙肝表面抗原的携带情况,有阳性或阴性;给小白鼠注射药物,其结局有生存或死亡等。白鼠注射药物,其结局有生存或死亡等。l如果变量的观察

42、结果表现为相互独立的多种属性,如果变量的观察结果表现为相互独立的多种属性,称为多分类变量,比如血型分为相互独立的四类:称为多分类变量,比如血型分为相互独立的四类:A型、型、B型、型、O型和型和AB型,肺癌可分为腺癌、鳞癌、腺型,肺癌可分为腺癌、鳞癌、腺鳞癌、未分化癌、类癌和支气管腺癌等,各类之间鳞癌、未分化癌、类癌和支气管腺癌等,各类之间只有性质的不同,没有大小和程度上的差别。只有性质的不同,没有大小和程度上的差别。3.顺序变量等级资料顺序变量等级资料l顺序变量的观察结果由顺序尺度测得。顺序变量可顺序变量的观察结果由顺序尺度测得。顺序变量可以体现程度上的不同,但是不能精确地测量相邻的以体现程度

43、上的不同,但是不能精确地测量相邻的两个变量值之间的差别。两个变量值之间的差别。l由同质的顺序变量组成的资料称为等级资料,它是由同质的顺序变量组成的资料称为等级资料,它是介于计量资料和计数资料之间的半定量观察结果,介于计量资料和计数资料之间的半定量观察结果,通常有两个以上的等级。通常有两个以上的等级。l等级资料也是先将观察单位按照某种属性或某个标等级资料也是先将观察单位按照某种属性或某个标志分组,然后清点各组观察单位的数目得来的,但志分组,然后清点各组观察单位的数目得来的,但是所分的各组之间有等级的顺序,各个类别之间存是所分的各组之间有等级的顺序,各个类别之间存在着大小和程度上的差别,这一点不同

44、于计数资料。在着大小和程度上的差别,这一点不同于计数资料。4.连续型资料和离散型资料连续型资料和离散型资料l连续型资料连续型资料 理论上在任何两个连续型数据之间都还理论上在任何两个连续型数据之间都还有无穷多个数据,只要测量仪器足够精确,连续型数有无穷多个数据,只要测量仪器足够精确,连续型数据可以精确到小数点后第无限位,比如体重,在据可以精确到小数点后第无限位,比如体重,在60.1和和60.2kg之间理论上存在着无限多个数据。之间理论上存在着无限多个数据。l离散型资料离散型资料 往往是一种计数,比如心率、脉搏、儿往往是一种计数,比如心率、脉搏、儿童龋齿个数、血小板数、某年某地交通事故死亡人数童龋

45、齿个数、血小板数、某年某地交通事故死亡人数等,这种计数只能是等,这种计数只能是0和正整数,不会是负数,也没和正整数,不会是负数,也没有小数点。有小数点。5.资料的转化资料的转化 l 计量变量(计量变量(g/L)计数资料(正常和异常)等级计数资料(正常和异常)等级资料(重度贫血、中度贫血、轻度贫血、正常、血红资料(重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高)。蛋白增高)。l根据分析问题的需要,各类变量可以互相转化。如:根据分析问题的需要,各类变量可以互相转化。如:观察某人群成年男子的血红蛋白量(观察某人群成年男子的血红蛋白量(g/Lg/L),属数值属数值变量;变量;l若分析比较某种病人的血

46、红蛋白水平与正常人有无差若分析比较某种病人的血红蛋白水平与正常人有无差别,须按计量资料进行处理。别,须按计量资料进行处理。序号序号正常人组正常人组病人组病人组1 2345.若按血红蛋白正常与偏低分为两类,可按二项分类资料处理;若按血红蛋白正常与偏低分为两类,若按血红蛋白正常与偏低分为两类,可按二项分类资料处理;可按二项分类资料处理;正常人组正常人组病人组病人组正常正常 偏低偏低合计合计若按贫血的诊断标准将血红蛋白含量分为五个等级:重若按贫血的诊断标准将血红蛋白含量分为五个等级:重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高,度贫血、中度贫血、轻度贫血、正常、血红蛋白增高,可按等级资料处理。可

47、按等级资料处理。正常人组正常人组病人组病人组重度贫血重度贫血 中度贫血中度贫血轻度贫血轻度贫血正常正常血红蛋白增高血红蛋白增高合计合计l由等级资料向计量资料转化时一定要慎重,在由等级资料向计量资料转化时一定要慎重,在SF-36SF-36中,有一个是中,有一个是“总的来说,您认为您的健康状况是总的来说,您认为您的健康状况是”,选项有选项有极好极好=5=5,很好,很好=4=4,好,好=3=3,一般,一般=2=2,差,差=1=1。设计讨论题:设计讨论题:预测:预测:1936年,罗斯福任美国总统的第一任期届满,共和党的候选人堪萨斯州州长兰登参加竞选。美国文学摘要对于美国总统的竞选进行了预测。当时大多数

48、观察家认为罗斯福会轻易获胜,而文学摘要根据自己的民意测验断定兰登与罗斯福的获胜比例将为57%对43%。方法:方法:发出1000万张调查表(按电话簿和俱乐部成员发出调查表),回收200万份,其中有114万人(57%)支持兰登,只有86万人(43%)支持罗斯福总统连任。调查对象:调查对象:1000万份调查表是按电话簿和俱乐部成员发出,而在1936年有家庭电话的和参加俱乐部并成为俱乐部成员的,大都是中上层社会的美国人。共和党主要代表美国中上层社会,而罗斯福所在的民主党主要代表美国广大中下层社会人民的利益,所以罗斯福在中上层社会的支持率比较低。结果:结果:然而事实却是罗斯福以62%比38%的巨大优势连

49、任成功。问题出现在该调查未遵循随机抽样原则抽取被调查对象,得到与事实完全相悖的预测,断送了这家颇有名气的杂志的前程,不久文学摘要只得停刊,就此“关门大吉”。结论:结论:当样本的选择方法发生偏差时,样本量再多也无济于事,它只能是在更大范围、更大程度地重复这个偏差错误。医学统计学医学统计学的学习重点:的学习重点:1、掌握其基本知识、基本技能、基本概念、基本方、掌握其基本知识、基本技能、基本概念、基本方 法。建立逻辑思维方法和提高分析问题的能力。法。建立逻辑思维方法和提高分析问题的能力。2、掌握调查设计和试验设计的基本原则。具有收、掌握调查设计和试验设计的基本原则。具有收集、整理、分析统计资料的系统工作能力。集、整理、分析统计资料的系统工作能力。3、掌握一套统计软件的使用方法(、掌握一套统计软件的使用方法(SAS、SPSS、STATA等),等),能够达到在完成能够达到在完成医学统计学医学统计学课程后,独立完成科研论文和正确应用统计方课程后,独立完成科研论文和正确应用统计方 法。法。

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第一章绪论基本概念课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|