1、第一章第一章 绪论绪论主讲:黄志碧 本章重点本章重点1、统计工作基本步骤、统计工作基本步骤 设计、收集资料、整理资料、分析资料设计、收集资料、整理资料、分析资料2、统计资料的类型、统计资料的类型 计量资料、计数资料、等级资料计量资料、计数资料、等级资料3、几个重要的概念、几个重要的概念 同质同质 和变异、总体和样本、概率和小概和变异、总体和样本、概率和小概率事件、抽样误差。率事件、抽样误差。第一节第一节 医学统计学的概念医学统计学的概念 “A science dealing with the collection,analysis,interpretation,and presentation
2、 of masses of numerical data”(Websters International Dictionary)。“The science and art of dealing with variation in data through collection,classification,and analysis in such a way as to obtain reliable results”(John M.Last,A Dictionary of Epidemiology)什么是统计学什么是统计学(statistics)(statistics)?什么是统计学什么是统
3、计学(statistics)(statistics)?内容内容:收集、分析、解释和表达数据收集、分析、解释和表达数据 统计学统计学:处理数据中变异性的科学与艺术处理数据中变异性的科学与艺术 目的目的:求得可靠的结果求得可靠的结果 统计学的现实地位:基金申请(统计学的现实地位:基金申请(NIHNIH)、)、药物开发与申报(药物开发与申报(FDAFDA)、卫生决策。)、卫生决策。一、统计学的概念一、统计学的概念 统计学是应用概率论和数理统计的原理、统计学是应用概率论和数理统计的原理、方法研究数据的收集、整理、分析和推断的方法研究数据的收集、整理、分析和推断的一门学科。一门学科。目的:目的:对数据资
4、料去粗取精,去伪存真,透对数据资料去粗取精,去伪存真,透过事物的数量现象过事物的数量现象,认识事物的规律性。认识事物的规律性。统计学在不同领域的应用,就形成不同的统计统计学在不同领域的应用,就形成不同的统计学科。学科。如:如:生物统计学(生物统计学(Biostatistics)Biostatistics)、卫生统计学、卫生统计学(Health statistics)(Health statistics)、医学统计学、医学统计学(Medical(Medical statistics)statistics)、预防医学统计学、预防医学统计学(Preventive(Preventive statist
5、ics)statistics)、妇幼统计学、卫生管理统计学、计划、妇幼统计学、卫生管理统计学、计划生育统计学、教育统计学、工业统计学、农业统计生育统计学、教育统计学、工业统计学、农业统计学、商业统计学等学、商业统计学等 。统计学统计学理论基础理论基础研究对象研究对象概率论概率论数理统计数理统计有变异的有变异的事物事物 二、医学统计学的概念二、医学统计学的概念Medical Statistics应用概率论和数理统计的应用概率论和数理统计的基本原理和方法,研究医学领域中数据的收基本原理和方法,研究医学领域中数据的收集、整理和分析的一门科学。集、整理和分析的一门科学。D.M.E.design,mea
6、surement and evaluation循证医学循证医学(Evidence Based Medicine(Evidence Based Medicine,EBM)EBM)新药临床实验新药临床实验医学统计在医学发展中的作用医学统计在医学发展中的作用Evidence Based MedicineEvidence Based Medicine(EBM)EBM)是遵循科是遵循科学证据的临床医学。它提倡将临床医师个人学证据的临床医学。它提倡将临床医师个人的临床实践和经验与客观的科学研究证据结的临床实践和经验与客观的科学研究证据结合起来,将最正确的诊断、最安全有效的治合起来,将最正确的诊断、最安全有
7、效的治疗和最精确的预后估计服务于每位具体患者。疗和最精确的预后估计服务于每位具体患者。A STUDY THAT SHAKED THE ENTIRE MEDICAL WORLD1989年一项震惊整个医学界的研究 Of 226 maneuvers in obstetrics&childbirth (在产科使用的在产科使用的226种方法中种方法中,临床试验或系统综述证明临床试验或系统综述证明):20%were beneficial(有效有效:疗效大于副作用疗效大于副作用)30%were harmful or of doubtful value(有害或疗效可疑有害或疗效可疑)50%had no RCT
8、 evidence available(缺乏随缺乏随机对照机对照试验证试验证据据)Iain Chalmers et al.Effective Care in Pregnancy and Childbirth.Oxford:Oxford University Press,1989THE IMPLICATIONS OF THIS STUDY该项研究的重要启示Experience is not reliable.Medical interventions,old or new,should all be scientifically evaluated.经验是不可靠的经验是不可靠的.医学医学干预干预
9、,不管新旧不管新旧,都应接受严格的科学评估都应接受严格的科学评估.Ineffective therapies must be stopped and new ineffective innovations must not be allowed to start.应停止使用无效的应停止使用无效的干预措施干预措施,预防新的无效措施引入医学实践预防新的无效措施引入医学实践.Medical practice should all be based on effective interventions.所有医学干预都应基于严格的研究证据之上所有医学干预都应基于严格的研究证据之上.1992:BIRTH
10、OF EVIDENCE-BASED MEDICINE1992:循证医学诞生Evidence-Based MedicineA New Approach to Teaching the Practice of MedicineEvidence-Based Medicine Working GroupMcMaster University Health Science CentreJAMA 1992;268:2420-2425.“A new paradigm for medical practice is emerging”“一种新的医学实践模式正在兴起一种新的医学实践模式正在兴起”依据现有最好的证
11、据来从事临床实践和实施医疗卫生决策的一种医学实践模式评估该结果评估该结果的外推性的外推性查找查找研究证据研究证据评估证据评估证据的质量的质量评估效果的评估效果的大小和可信度大小和可信度提出问题提出问题循证医学Evidence-based Medicine医学统计学在循证医学中的在循证医学中的地位和作用“生产生产”证据所必备的科学方法证据所必备的科学方法“利用利用”证据所必需的知识技能证据所必需的知识技能“科学决策科学决策”所必需的思维基础所必需的思维基础第二节第二节 医学统计学的内容和任务医学统计学的内容和任务 一、医学统计学主要内容一、医学统计学主要内容 包括科学研究中的统计设计和科研数据包
12、括科学研究中的统计设计和科研数据资料处理中的统计理论和方法资料处理中的统计理论和方法(重点学习(重点学习和掌握内容)。和掌握内容)。1、进行统计设计,收集、整理资料、进行统计设计,收集、整理资料2、对所收集资料进行统计描述和统计推断、对所收集资料进行统计描述和统计推断3、对统计处理的结果进行分析和解释、对统计处理的结果进行分析和解释 二、统计学的任务二、统计学的任务 三、医学统计学的作用三、医学统计学的作用 1、帮助医学工作者有计划有目的地进、帮助医学工作者有计划有目的地进行科研活动行科研活动2、合理地分析和解释试验数据,科学、合理地分析和解释试验数据,科学地揭示数据之间隐含的内在规律性地揭示
13、数据之间隐含的内在规律性 药物临床疗效研究药物临床疗效研究疗效疗效药物药物病情病情心理因素心理因素患者的状况(性别、年龄患者的状况(性别、年龄其他因其他因素素混杂混杂因素因素举举 例例甲药甲药乙药乙药混杂因素混杂因素混杂因素混杂因素疗效疗效疗效疗效广西人均卫生事业费在全国位次广西人均卫生事业费在全国位次(1998(1998年年)指指 标标 广西广西(元元)全国(元)全国(元)广西在全广西在全国位次国位次 人均卫生事业费人均卫生事业费 11.24 18.52 28 人均医院经费人均医院经费 3.70 7.61 30 人均卫生院补助人均卫生院补助 2.67 3.60 28 人均防治防疫事业费人均防
14、治防疫事业费1.66 2.62 29 人均妇幼保健经费人均妇幼保健经费 0.84 0.76 16 中国人口结构、抚养系数、医学敏感中国人口结构、抚养系数、医学敏感 人口变化趋势及其特征人口变化趋势及其特征 中国人口年龄结构的变化中国人口年龄结构的变化1975-19901975-1990年中国疾病别死亡率变化年中国疾病别死亡率变化(%)(%)19991999年中国农村死亡原因构成年中国农村死亡原因构成 (%)(%)目前,由于统计学知识的缺乏,导致公开发目前,由于统计学知识的缺乏,导致公开发表在医学专业刊物上的论文有一半以上存在表在医学专业刊物上的论文有一半以上存在缺陷。缺陷。第三节第三节 统计工
15、作的步骤统计工作的步骤设计设计(design)搜集资料搜集资料(collection of data)整理资料整理资料(sorting data)分析资料分析资料(analysis of data)1、设计、设计(design)统计设计:统计设计:对资料搜集、整理和分析全对资料搜集、整理和分析全过程总的设想和安排。是后续步骤的依过程总的设想和安排。是后续步骤的依据,是据,是最关键最关键的一环。的一环。科研设计科研设计专业设计专业设计统计设计统计设计成果:成果:先进性先进性 创新性创新性 科学性和可行性科学性和可行性2、搜集资料、搜集资料(collection of data)根据设计方案,取得
16、准确可靠的原始根据设计方案,取得准确可靠的原始数据。数据。来源来源统计报表统计报表病历病历专题调查专题调查实验(临床试验)实验(临床试验)3、整理资料、整理资料(sorting data)对原始资料进行审核、校正、整理并对原始资料进行审核、校正、整理并使之系统化、条理化,便于进一步统计分使之系统化、条理化,便于进一步统计分析。析。数据录入工具:数据录入工具:FoxproFoxpro、EcxelEcxel等等数据的预处理:把原始数据转化为能被统数据的预处理:把原始数据转化为能被统计软件识别的数据集计软件识别的数据集例:性别:男女例:性别:男女 sex:=1(男)(男)=2(女)(女)4、分析资料
17、、分析资料(analysis of data)计算有关统计指标,反映数据的综计算有关统计指标,反映数据的综合特征,阐明事物的内在联系和规律。合特征,阐明事物的内在联系和规律。统计分析:统计分析:统计描述和统计推断统计描述和统计推断分析方法:分析方法:与资料类型和分析目的有关与资料类型和分析目的有关统计软件:统计软件:中文:中文:PEMS 3.0 for PEMS 3.0 for WindowsWindows 英文:英文:SAS 9.1SAS 9.1、SPSS 16.0SPSS 16.0 Statistical Package for the Social ScienceStatistical
18、Analysis System第四节第四节 统计学中的几个基本概念统计学中的几个基本概念一、同质与变异一、同质与变异 1、同质(、同质(homogeneity)所谓同质,就是性质相同,在统计学中,影响研所谓同质,就是性质相同,在统计学中,影响研究指标的主要因素相同就是同质。同质是确定研究指标的主要因素相同就是同质。同质是确定研究总体和进行统计分析的基础。究总体和进行统计分析的基础。2、变异、变异(variation)在同质基础上,个体观察值之间的差异。变异是在同质基础上,个体观察值之间的差异。变异是统计学研究的对象。统计学研究的对象。1 1、总体、总体(population)(populati
19、on)根据研究目的所确定的同质的所有观察根据研究目的所确定的同质的所有观察对象某项变量值的集合。对象某项变量值的集合。有关总体的三个要点:有关总体的三个要点:研究目的、同质的、全体研究目的、同质的、全体 二、总体与样本二、总体与样本例:例:目的:目的:了解广西在校男大学生的身高了解广西在校男大学生的身高同质:同质:广西在校男大学生广西在校男大学生全体:全体:全部广西在校男大学生的身高值全部广西在校男大学生的身高值总体总体有限总体有限总体无限总体无限总体广西在校大学广西在校大学生的身高值生的身高值贫血患者贫血患者 2、样本样本(sample):从总体中随机抽取部分观察对象,从总体中随机抽取部分观
20、察对象,其某项变量值的集合。其某项变量值的集合。总体总体样本样本抽样抽样目的目的用样本信息来推断总体特征用样本信息来推断总体特征 抽样研究?我抽样研究?我经常做耶!经常做耶!样本信息推论总体特征的前提:样本信息推论总体特征的前提:1、样本的可靠性:明确划清总体的、样本的可靠性:明确划清总体的同质范围,且样本的每个个体确属预先同质范围,且样本的每个个体确属预先确定的总体。(病例必须确诊)确定的总体。(病例必须确诊)2、样本的代表性:、样本的代表性:(1)样本必须遵循随机化原则)样本必须遵循随机化原则 (2)有足够的样本例数)有足够的样本例数 变量:观察指标变量:观察指标变量值:观察指标的结果变量
21、值:观察指标的结果(或称观察值或称观察值)根据变量的取值不同,将统计资料分三种。根据变量的取值不同,将统计资料分三种。三、变量和资料三、变量和资料对观察对象按属对观察对象按属性或类型分组计性或类型分组计数所得的资料。数所得的资料。每个对象之间没每个对象之间没有量的差异,只有量的差异,只有质的不同。有质的不同。资料的类型资料的类型 计量资料(定计量资料(定量资料)量资料)计数资料(无计数资料(无序分类变量)序分类变量)等级资料(有等级资料(有序分类变量)序分类变量)对每一观察对对每一观察对象用定量的方象用定量的方法,法,测定某项测定某项指标所得的资指标所得的资料。一般有度料。一般有度量衡单位,每
22、量衡单位,每个对象之间有个对象之间有量的区别。量的区别。对观察对象按属对观察对象按属性或类型的程度性或类型的程度不同分组计数,不同分组计数,各属性或类型之各属性或类型之间有程度的差别。间有程度的差别。分类资料分类资料1 1、计量资料(数值变量):、计量资料(数值变量):对每一观察对象用对每一观察对象用定量的方法,测定某项指标所得的资料。一般有定量的方法,测定某项指标所得的资料。一般有度量衡单位,每个对象之间有量的差异。度量衡单位,每个对象之间有量的差异。如:身高、体重、胸围、血压、脉搏、血红如:身高、体重、胸围、血压、脉搏、血红蛋白含量、红细胞数、白细胞数等。蛋白含量、红细胞数、白细胞数等。连
23、续型计量资料:连续型计量资料:身高、体重、胸围、血压身高、体重、胸围、血压离散型计量资料:离散型计量资料:脉搏、红细胞数、白细胞数等脉搏、红细胞数、白细胞数等 2 2、计数资料(无序分类变量):、计数资料(无序分类变量):将观察对象将观察对象按某种属性或类别分组,清点每组观察单位数按某种属性或类别分组,清点每组观察单位数所得的资料。每个对象之间没有量的差异,只所得的资料。每个对象之间没有量的差异,只有质的不同。分为以下两类:有质的不同。分为以下两类:(1 1)、两项分类资料)、两项分类资料(如性别分为男、女,(如性别分为男、女,检查结果分为阴性、阳性);检查结果分为阴性、阳性);(2 2)多项
24、分类资料)多项分类资料(如血型分为:(如血型分为:A A型、型、B B型、型、A BA B型、型、O O型)。型)。3 3、等级资料(有序分类变量)、等级资料(有序分类变量):将观察对象按:将观察对象按某种属性或类别的不同程度分组,清点每组观某种属性或类别的不同程度分组,清点每组观察单位数所得的资料。每个对象之间没有量的察单位数所得的资料。每个对象之间没有量的差异,但各属性或类型之间又有程度上的差别,差异,但各属性或类型之间又有程度上的差别,因此等级资料也称半定量资料(具有定量资料因此等级资料也称半定量资料(具有定量资料的部分属性)。的部分属性)。如治疗效果分为:治愈、显效、有效、好转、如治疗
25、效果分为:治愈、显效、有效、好转、无效、死亡;无效、死亡;例:某地调查高血压的患病情况。例:某地调查高血压的患病情况。每人的血压:以每人的血压:以mmHgmmHg计计计量资料计量资料以舒张压以舒张压90mmHg为高血压,结果为高血压,结果在在1000人中有人中有10名高血压患者,名高血压患者,990名非高血压患者,整理后的资料名非高血压患者,整理后的资料 计数计数资料资料按低血压、正常、高血按低血压、正常、高血压分组所得。压分组所得。等级资料等级资料注意:注意:不同类型的资料采用的统计分不同类型的资料采用的统计分析方法不同;析方法不同;三类资料类型可以相互转化。三类资料类型可以相互转化。计量资
26、料计量资料 计数资料(血压值计数资料(血压值 有无高血压)有无高血压)计量资料计量资料 等级资料(等级资料(Hb 轻、中、重贫血)轻、中、重贫血)计数资料计数资料 计量资料(男、女计量资料(男、女 1、0)等级资料等级资料 计量资料(治愈、显效、好转、无计量资料(治愈、显效、好转、无 效效 3、2、1、0)过失误差:过失误差:由人为失误所造成的误差(可避免)由人为失误所造成的误差(可避免)。系统误差:系统误差:由于测量仪器不准确(可避免)。由于测量仪器不准确(可避免)。抽样误差:抽样误差:样本统计量和总体参数之间的差异,由样本统计量和总体参数之间的差异,由于个体变异和抽样原因所产生。于个体变异
27、和抽样原因所产生。随机测量误差:随机测量误差:在相同条件下对同一观察单位某项在相同条件下对同一观察单位某项指标反复测量所产生的误差(不可避免)。指标反复测量所产生的误差(不可避免)。四、误四、误 差差1、随机误差、随机误差2、非随机误差、非随机误差五、概率五、概率(probability):描述随机事件发生可能性大小的数值,记作描述随机事件发生可能性大小的数值,记作,其取值范围,其取值范围0P10P1,一般用小数表示。,一般用小数表示。0 0,事件不可能发生;,事件不可能发生;1 1,事件必然发生;,事件必然发生;00,事件发生的可能性愈小;,事件发生的可能性愈小;11,事件发生的可能性愈大,
28、事件发生的可能性愈大 随机事件随机事件(random event):在相同条件下,在相同条件下,可以发生也可以不发生,可以这样发生也可以发生也可以不发生,可以这样发生也可以那样发生的事件,亦称偶然事件。可以那样发生的事件,亦称偶然事件。其其 0 0P P1 1 小概率事件:小概率事件:习惯上将习惯上将0.05或或0.01 的随机事件称小的随机事件称小概率事件。表示某事件发生的可能性很小。概率事件。表示某事件发生的可能性很小。小概率理论是进行统计推断的概率理论基础。小概率理论是进行统计推断的概率理论基础。六、参数和统计量六、参数和统计量 1 1、总体指标统称、总体指标统称参数参数。一般用希腊字母
29、。一般用希腊字母表示,如总体均数表示,如总体均数,总体率,总体率,总体标准,总体标准差差。2 2、样本指标统称、样本指标统称统计量统计量。一般以拉丁字母。一般以拉丁字母表示,如样本均数表示,如样本均数 x x,样本率,样本率P P,样本标准,样本标准差差s s。.目标:基本概念、方法与技能目标:基本概念、方法与技能(1 1)基本概念)基本概念 必须正确理解和掌握;必须正确理解和掌握;-医疗卫生专业人员医疗卫生专业人员基本素质基本素质 的标志。的标志。(2 2)常用的设计方法和经典的统计学方法)常用的设计方法和经典的统计学方法学会学会:t t 检验、检验、X X2 2检验、非参数检验、简单回归与
30、相检验、非参数检验、简单回归与相关、流行病学常用统计方法等等。关、流行病学常用统计方法等等。了解了解:这些方法所需设计、适用的条件和结果的意这些方法所需设计、适用的条件和结果的意义。义。知道知道:经典方法适用条件不满足时怎么办?经典方法适用条件不满足时怎么办?第五节第五节 学习医学统计学应注意的问题学习医学统计学应注意的问题(3)计算)计算 实践与概念有关的简单计算,不背复杂的统计实践与概念有关的简单计算,不背复杂的统计学公式,学会查书学公式,学会查书 。注意学习每种统计方法的应用范围、应用条件,注意学习每种统计方法的应用范围、应用条件,大多数统计公式只要求了解其意义和使用方法,大多数统计公式
31、只要求了解其意义和使用方法,不用记忆和探究数理推导。不用记忆和探究数理推导。(4)掌握统计软件包的应用()掌握统计软件包的应用(SPSS)。)。(1)(1)应用是根本目的,学了不会用是最大的失败应用是根本目的,学了不会用是最大的失败 ,没有任何内容需要背诵,理解概念与动手实,没有任何内容需要背诵,理解概念与动手实践才是根本。践才是根本。(2)(2)结合生活经验、医学实际来学习结合生活经验、医学实际来学习借助实例来理解一般规律:每一个重要的概念和借助实例来理解一般规律:每一个重要的概念和原理,都要尽力与一、二个实例联系起来。原理,都要尽力与一、二个实例联系起来。2.2.教与学的方法教与学的方法
32、(3)(3)统计学实习统计学实习 :帮助医药卫生专业人士学习统计帮助医药卫生专业人士学习统计学的好办法学的好办法 (4)(4)案例讨论案例讨论 :从反面吸取教训,利用每一章的案:从反面吸取教训,利用每一章的案例了解容易出错的内容;例了解容易出错的内容;寻找医学论文中统计学的错误与不足寻找医学论文中统计学的错误与不足 少数内容要自学并且要考;有些内容建议自学而不少数内容要自学并且要考;有些内容建议自学而不考;考;(5)(5)为开拓知识、培养自学能力而设有些内容暂不学为开拓知识、培养自学能力而设有些内容暂不学它,将来需要时再学(多元统计方法)。它,将来需要时再学(多元统计方法)。广西医科大学卫生统计黄志碧编制