1、主讲教师:中国医科大学卫生统计教研室 刘 嵘 “统计”一词,对一般人来说并不陌生。在报刊上常见用来说明我们工作、事业成绩的数字、表、图,称为统计数字、统计表和统计图。在西方,统计学(statistics)一词,源出于state(国家、情况),专指有关“国情”的学问,最初多用于文字记叙,后发展为数量比较,随着概率论思想与方法的引入,逐渐形成今天在理论与应用方面都已相当完备的独立学科。l统计学(statistics):是研究数据的收集、整理、分析的一门学科。l医学统计学(medical statistics):是应用概率论和数理统计的基本原理和方法,研究医学数据的收集、整理、分析的一门应用学科。例
2、:治疗某病的新疗法新法:(100例)有效20例,有效率20%;旧法:(100例)有效15例,有效率15%;这两个百分数就是统计描述指标,现在的问题是,这两种疗法的有效率会稳定不变吗?如果说不会,是什么原因?那么,两种疗法的真实有效率会是多少?我们能根据统计描述(20%与15%)就去正式采用还有较大副作用的新疗法?对这样的差异问题,你能再凭直觉去作“否定”?在作任何回答之前,必须判断20%与15%之间的差别是真实的差异,或是仅仅由于“机遇”所致。这里,统计推断可提供帮助。学过统计学,将会了解不仅可判断新疗法是否较好?而且,如果判断它是较好,还能估计判断是错误的可能性有多大。统计分析是科研工作中的
3、一种有力工具。它从科研的总体设计、资料采集、资料整理、资料分析直到最后作出结论都有密切关系。掌握了这个工具可以使用较少的人力、物力和时间获得比较可靠的结果。需要运用统计方法的场合而不去运用它可能造成不应有的缺陷或得出错误的结论。例1:北京某医院某大夫使用“乌贝散”(乌贼骨3钱,白芨3钱,川贝3钱,甘草3钱,共研细末过120目筛,冲服)治疗胃溃疡病出血107例,有效101例,有效率为94.4%。那么如果别的医院,其它大夫使用“乌贝散”来治疗胃溃疡病出血,其有效率也一定是94.4%吗?显然,不一定恰为94.4%,那么是多少呢?比它高还是比它低?这就是一个求可信区间的问题。例2:某杂志中一篇文章报导
4、,用某种中草药治疗玫瑰糠疹,有效率为78,平均疗程为三周左右。问此药治疗玫瑰糠疹的确有效吗?由于玫瑰糠疹具有自然治愈的情况,一般不服药,多喝水,到三周左右有些患者也会自愈。所以,此药的78疗效有待探讨。这就要求设立具有可比性的对照组。再譬如,用某药治某病,治一例有效,能说100有效吗?治疗二例有效,能说明100有效吗?治十例,其中九例有效,能说90有效吗?显然,观察的例数将是个重要因素,例数太少不足以说明问题。观察例数太多,将费时,加重科研经济负担。那么观察多少例能说明问题?这是一个样本可靠性问题。(一)统计研究设计 1.实验设计 2.调查设计 在基础,临床和预防医学研究中,经常遇到科研设计的
5、问题。例如,在临床药物研究中,我们要了解某降压药的疗效。一般地,药物的疗效要受许多因素的影响:药物本身的性质,给药途径,给药时间,病人的病情以及病人的心理状态等。这些因素有些是可以控制的,有些是不能控制的。因此,我们在做研究前,要有一个全面合理的计划,以排除实验中的影响因素,使研究因素的效应突出地表现出来,从中得出准确的结论。医学统计中讲的研究设计就是设计医学实验或调查研究的过程,使从实验或调查得来的数据适合用统计方法分析,得出有效的和客观的结论。例如:现有两种抗肿瘤药,欲探索其对肿瘤细胞的敏感作用。当我们考虑这样的实验时,有许多问题要加以认真思考,如:1)目前抗肿瘤药的效果如何?该两种药优于
6、其它抗肿瘤药的可能特点是什么?2)在这个实验中要用多少种癌细胞?用什么方式把两种药作用到每种癌细胞?3)要观察的实验指标是什么?如何收集实验数据?4)在这个实验中,可能影响实验结果的非实验因素有哪些?应该怎样控制?5)应该用什么统计方法分析该实验的数据?怎样评价两种药物的效果?所有这些问题或者还有许多问题,都必须在进行实验之前充分考虑,作到心中有数,然后决定怎样作这个实验,既作出实施实验步骤的计划,这个过程就是实验设计(design of experiment)。(二)常用的基本统计方法 1.统计描述 2.统计推断 3.二项分布和Poisson分布 4.直线回归和相关、协方差分析等(三)临床医
7、学中常用的统计方法 1.随机对照实验、交叉设计、配对设计、配伍组设计、析因设计及诊断与筛检试验设计 2.随访资料的生存分析 3.信度与效度分析 4.Meta 分析(四)常用医学人口和疾病统计指标及其应用;寿命表的编制原理及其在医学上的应用。(五)多因素分析的统计方法:1.多重线性相关与回归 2.Logistic回归 3.Cox比例风险模型 (一)设计(一)设计 1.确定研究目的2.确定研究对象及其数量3.确定观察指标4.设立适当对照 组及随机化分组5.制定较好的原始记录表6.考虑好统计分析方法7.预期会有何结果8.人员组织及经费预算(二)收集资料(二)收集资料 收集资料就是根据研究的目的,实验
8、设计的要求,收集准确的完整的充满信息的原始资料(raw data)。资料来源:1.临床试验中的病例观察表。2.国家法定报表:卫生工作报表、传染病报表、职业病报表、医院工作报表。3.大规模的流行病调查获取的现场调查资料。这些资料的收集过程,必须进行质量控制。包括它的统一性,确切性,可重复性。对这些原始数据的精度(precision)和偏性(bias)应有明确的控制范围。(三)整理资料 整理资料就是把收集到的原始资料,有目的地进行科学加工,使资料系统化、条理化,以便进行统计分析。1.专业检查:男性患者的调查表中不应出现妇科疾病等;从专业的角度对资料的一致性进行检查,比如诊断和疗效的评定标准是否统一
9、,胃镜下萎缩性胃炎的严重程度的评定标准是否一致等。2.逻辑检查:比如退休时的年龄不应出现小于20岁;六岁的孩子不应有大学文化程度。3.统计检查:检查报表(或报告卡)的纵向,横向的合计和总的合计是否吻合。体重8.50(公斤),身高69.0(cm),头围44.0(cm),胸围42.5(cm),坐高43.0(cm)。理论上算,这五个数据都是以0或5结尾可能性0.032%(四)分析资料(四)分析资料 分析资料就是把经过统计整理的资料,作一系列统计描述和统计推断,阐明事物的规律性。应该注意,不同的资料使用的统计描述和统计推断的方法是不一样的,必须加以区分。1.统计描述:统计描述:指用统计指标、统计表、统
10、计图对资料的数量特征及其分布规律进行测定和描述。2.统计推断:统计推断:指如何抽样及由样本信息推断总体特征。一、基本概念(一)变异(variation):同质基础上个体值之间的差异,称为变异。医学研究的对象是有机的生命体,其机能是十分复杂的。不同的个体在相同的条件下,对外界环境因素可以发生不同的反应。例如,同种族、同年龄、同性别的健康人,在相同的条件下测其脉搏、呼吸、体温等生理指标可以有很大差异。在临床治疗中,用同样的药物治疗病情相同的病人,疗效也不尽相同。即使在实验室里,动物与动物之间也有明显的差异。这种现象称为个体差异或称为变异。变异是由众多的、偶然的、次要的因素造成的。由于医学统计研究的
11、对象是有变异的事物,因此,用观察12例的结果来推论出一般规律是不恰当的。例如,我们不能用某一健康成人的红细胞数作为一般健康成人的红细胞数;也不能因为用青木香治疗一例高血压患者有效,而断定青木香治疗高血压有效率为 100,因为观察例数太少,受个别的偶然的因素影响太大。科学研究的工作,主要任务之一就是要从表现为偶然性的大量数据中,分析出其中必然性的规律。而概率论和数理统计就是要通过这种偶然性去寻找隐藏在其内部的必然规律性。(二)总体和样本1.总体(population):是根据研究目的确定的同质的所有观察单位某种变量值的集合。l有限总体:指明确了特定的时间、空间范围的有限个观察单位所组成的总体。l
12、无限总体:没有时间和空间范围限制的无限个观察单位所组成的总体。2.样本(sample):是总体中随机抽取的部分观察单位,其实测值的集合。样本含量(sample size):是指样本中所包含的观察单位数。譬如,我们要研究华北地区成年人的血液的红细胞数的正常值,那么,华北地区全部健康成年人的血液都是我们的研究对象,这称为总体。但是,我们不可能把华北地区所有健康成年人都进行血液检查,而只能按照一定的科学方法从中抽取一部分人来进行血液检查。然后,根据检验结果来推论华北地区成年人的血液的正常值。这种从总体中抽取部分个体的过程称为抽样(sampling),所抽得的部分成为样本,如何正确的从样本观察到的情况
13、来推测总体,这就是医学统计学要解决的问题之一。从总体中抽取样本,一定要遵循科学原则。一般来说,一个样本应具有“代表性(representative)”、“随机性(randomization)”和“可靠性(reliability)”。代表性:就是要求样本中的每一个个体必须符合总体的规定。这就要求对总体有一个明确的规定。这种规定是根据研究目的而具体确定的。例如,要调查华北地区成年男子的红细胞数的正常值,则我们可以规定研究对象为体温正常、无急性病、无血液消耗性疾病,肝在肋缘下0.5cm以内,血红蛋白在12.5克以上,血小板在10万以上的华北地区18岁以上的男子。必须做肝功、线胸透及某些血项检查等,那
14、么所抽取的样本中的每个个体都必须做上述检查,并符合上述规定。随机性 就是要保证总体中的每个个体有相同的几率被抽作样本。重要的是要避免主客观的“偏因”。必须指出,随机化抽样绝不等于随意抽样。例如,将40只小鼠分为两组。如果闭上眼睛,随意抓取20只作为第一组,留下的作为第二组。表面上看来是随机的,实际上是不随机的。因为体壮、活泼性强的小鼠难于抓到,故大部分留在第二组,两组的活泼性是不同的。可靠性 即对实验的结果要具有可重复性,即由科研课题的样本的结果所推测总体的结论有较大的可信度。由于个体之间存在差异,只有观察一定数量的个体方能体现出其客观规律性。如果根据少数几例就下结论,这种结论可靠性差,体现不
15、了规律,可能被后人所否定,这种先例是曾经发生过的。诚然,每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准,这就涉及到样本含量的估计问题。总体随机抽样编号 性别 年龄红细胞数 血红蛋白 1 n A1 An B1 Bn C1 Cn D1 Dn随机样本 统计推断和总体与样本的基本关系统计推断(三)参数和统计量(三)参数和统计量 1.参数参数(parametric):总体指标。2.统计量统计量(statistics):样本指标。(四)抽样误差(四)抽样误差 1.定义:定义:在统计学上把由抽样造成的样本统计量和总体参数之间的差异或者是各个样本统计量之间的差异统
16、称为抽样误差(sampling error)。(五)概率(五)概率概率(probability):是描述随机事件发生的可能性大小的数值。(1)必然事件:P(A)=1(2)不可能事件:P(A)=0(3)随机事件(偶然事件):0 P(A)1(4)小概率事件:P0.05 或 P0.01l频率和概率的区别和联系频率和概率的区别和联系1.频率(frequency):设在n次随机试验中,事件A出现m次,比值称为事件A在n次试验中出现的频率。医疗工作中所说的发病率、死亡率、治愈率等都是频率。显然,频率具有如下性质:试验的总次数发生的试验次数AnmAf)(1)(0Af2.频率的稳定性 实例1:掷一枚质量均匀的
17、硬币实验 实例2:某年出生男婴及女婴人数 在大量试验中,一个随机事件出现的频率常在某个固定的常数附近摆动,这是一种统计规律,称为频率的稳定性。频率具有稳定性说明随机事件发生的可能性大小是其本身固有的一种客观属性,因此可以对它进行度量。3.概率的统计学定义 在大量重复试验中,若事件A的频率稳定地在某一常数附近摆动,则称此常数为事件A的概率。注意:频率是变动的,而概率则为常数。当试验次数足够多,频率相当稳定时,可把频率作为概率的近似值,即当 时,n)()(APAfn二、资料的类型二、资料的类型 1.计量资料 2.计数资料 可互相转化 3.等级资料 1.定量资料(计量资料)2.定性资料(分类资料)(
18、1)二项分类 (计数资料)(2)多项分类 无序多分类 有序多分类 (等级资料)1.定量资料是对每个观察对象的观察指标用定量方法测定该项指标的数值大小所得的资料,一般有度量衡单位。如身高(cm)、体重(kg)、浓度(mg/l)、脉搏(次/分)、血磷(mg%)、血红蛋白(g%)等。2.定性资料是先将观察对象的观察指标按性质或类别进行分组,然后清点各组该观察指标的数目所得的资料。例如:调查某人群的血型分布,按照、四型分组。清点所得该人群的各血型组的人数是计数资料;临床化验中,将化验结果按 、等级分组,得到每组病人数,就是等级资料;用“生脉散”治疗脑血管病,其疗效可分为治愈、显效、有效、无效,那么其对
19、应的人数将是等级资料。根据分析的需要,计量资料、计数资料和等级分组资料可以互相转化。例如每个人的血红蛋白,原属计量资料;若按血红蛋白正常与异常分为两组,得出各组的人数,是计数资料;若按血红蛋白含量的多少分为五个等级:6(g%)(重度贫血)、6(g%)(中度贫血)、9(g%)(轻度贫血)、12.5(g%)(血红蛋白正常)、16(g%)(血红蛋白增高),计算各等级人数,就是等级分组资料。(一)掌握医学统计学的基本知识、基本技能、基本概念和基本方法。(二)掌握调查设计和实验设计的原则,培养收集、整理和分析统计资料的系统工作能力。重视原始资料的完整性、可靠性及处理数据时的实事求是的科学态度。(三)掌握群体健康的评价方法,学会用医学人口统计和疾病统计等方面的统计指标,综合评价人群健康状况,为卫生决策提供统计信息。如何学习如何学习l循序渐进l认真完成各部分习题