流行病与卫生统计学基本知识综述课件.ppt

上传人(卖家):晟晟文业 文档编号:3823483 上传时间:2022-10-16 格式:PPT 页数:139 大小:1.05MB
下载 相关 举报
流行病与卫生统计学基本知识综述课件.ppt_第1页
第1页 / 共139页
流行病与卫生统计学基本知识综述课件.ppt_第2页
第2页 / 共139页
流行病与卫生统计学基本知识综述课件.ppt_第3页
第3页 / 共139页
流行病与卫生统计学基本知识综述课件.ppt_第4页
第4页 / 共139页
流行病与卫生统计学基本知识综述课件.ppt_第5页
第5页 / 共139页
点击查看更多>>
资源描述

1、流行病学和医学统计学基流行病学和医学统计学基本知识本知识冯嘉丽冯嘉丽一、相对数指标1.1.比比(ratio)(ratio):两个变量的数值之商:两个变量的数值之商 特点:特点:表示分子和分母间的数量关系;表示分子和分母间的数量关系;不管分子和分母所来自的总体如何;不管分子和分母所来自的总体如何;分子和分母是两个彼此分离的互相不重叠或分子和分母是两个彼此分离的互相不重叠或 包含的量;包含的量;分子和分母本身可以是绝对数、比例、比。分子和分母本身可以是绝对数、比例、比。2 2比例比例(proportion)(proportion):表示同一事物局部与总体之间数量上:表示同一事物局部与总体之间数量上

2、的比值。的比值。构成比例:是自身构成的部分与全体的比值。代表随机构成比例:是自身构成的部分与全体的比值。代表随机抽样,抽取到某种成分的概率。抽样,抽取到某种成分的概率。发生(频率)比例:在其内发生某变化的部分与全体的发生(频率)比例:在其内发生某变化的部分与全体的比值。反映在一定时间内,发生某种变化者占全体的比比值。反映在一定时间内,发生某种变化者占全体的比例。例。无量纲,取值范围在无量纲,取值范围在0 0,1 1。3 3率(率(raterate):):在某一确定人群中某事件发生的频率。在某一确定人群中某事件发生的频率。有量纲,可以取任何值,不一定在有量纲,可以取任何值,不一定在0 0,1 1

3、当观察期间为一个单位时段,变量的变化远远小于变量的值当观察期间为一个单位时段,变量的变化远远小于变量的值时,率与发生比例在数值上近似相等。时,率与发生比例在数值上近似相等。(一)发病率(一)发病率表示在一定期间内,一定人群中某病新病例表示在一定期间内,一定人群中某病新病例出现的频率。出现的频率。K=100%,1000/千,或 10000/万 k同时期暴露人口数某病新病例数一定期间内的某人群中发病率注意事项分子:一定期间内的分子:一定期间内的新发病新发病人数。人数。分母:指分母:指可能可能会发生该病的人群。会发生该病的人群。发病率一般根据病例报告来计算,若病例报告制发病率一般根据病例报告来计算,

4、若病例报告制度不健全,病例报告漏报情况严重时或诊断的标度不健全,病例报告漏报情况严重时或诊断的标准不一致时,其准确性将受到影响。准不一致时,其准确性将受到影响。比较不同地区的发病资料时,应考虑年龄或性别比较不同地区的发病资料时,应考虑年龄或性别结构不同,注意可比性,常用发病的标化率进行结构不同,注意可比性,常用发病的标化率进行比较。比较。(二)患病率(二)患病率 某特定时间内总人口中某病某特定时间内总人口中某病新旧病例新旧病例所占的比例所占的比例。按观察时间按观察时间:v 期间患病率期间患病率v 时点患病率时点患病率 K=100%,1000/千,或 10000/万 k人数)该时点人口数(被观察

5、患某病的新旧病例数某一时点一定人群中现时点患病率k观察人数)同期的平均人口数(被现患某病的新旧病例数某观察期间一定人群中期间患病率若未加任何说明,一般是指时点患病率若未加任何说明,一般是指时点患病率 当某地某病的发病率和该病的病程当某地某病的发病率和该病的病程在相当长时间内保持稳定时,患病率、在相当长时间内保持稳定时,患病率、发病率和病程三者的关系是:发病率和病程三者的关系是:P 患病率 I 发病率 D 病程 病程发病率患病率DIP v表示病程较长的慢性病的发生或流行表示病程较长的慢性病的发生或流行v为医疗设施规划,估计医院床位周转,为医疗设施规划,估计医院床位周转,卫生设施及人力的需要量,医

6、疗质量的卫生设施及人力的需要量,医疗质量的评估和医疗费用的投入等提供科学依据。评估和医疗费用的投入等提供科学依据。注意:研究发病的病因时,应选用发病注意:研究发病的病因时,应选用发病率而不选用患病率。率而不选用患病率。应应 用用死亡指标v 死亡率死亡率 (mortality ratemortality rate)v 病死率病死率 (fatality ratefatality rate)v 生存率生存率 (survival rate)(survival rate)v 累积死亡率累积死亡率 (cumulative mortality rate)(cumulative mortality rate)

7、表示在一定期间内,在一定人群中,表示在一定期间内,在一定人群中,死于某病(或死于所有原因)的频率。死于某病(或死于所有原因)的频率。测量人群死亡危险最常用的指标。测量人群死亡危险最常用的指标。k同期平均人口数亡总数某期间内(因某病)死死亡率 K=100%,1000/千,或 10000/万 死亡率死亡率 用于衡量某一时期,一个地区人群死亡危用于衡量某一时期,一个地区人群死亡危险性大小的指标。险性大小的指标。表示一定时期内(通常为年),患某表示一定时期内(通常为年),患某病的全部病人中因该病死亡者的比例。病的全部病人中因该病死亡者的比例。K=100%,1000/千,或 10000/万 k同期患某病

8、的病人数数某时期内因某病死亡人病死率病死率病死率应应 用用v 表示某确诊疾病的死亡概率表示某确诊疾病的死亡概率v可反映该疾病的严重程度可反映该疾病的严重程度v反映医疗水平和诊断能力反映医疗水平和诊断能力v通常多用于急性传染病,较少用于慢性病通常多用于急性传染病,较少用于慢性病 生存率生存率 指接受某种治疗的病人或患某病的人指接受某种治疗的病人或患某病的人中,经若干年随访(通常为中,经若干年随访(通常为1、3、5 年)年)后,尚存活的病人数所占的比例。后,尚存活的病人数所占的比例。%100年的病例数随访满年尚存活的病例数随访满生存率nn应 用v研究疾病对生命的危害程度研究疾病对生命的危害程度v评

9、价某些病程较长疾病的远期疗效评价某些病程较长疾病的远期疗效v在某些慢性病、传染病,如结核病、癌在某些慢性病、传染病,如结核病、癌 症、冠心病等的研究中常应用症、冠心病等的研究中常应用累积死亡率累积死亡率5般为为各年龄组的组距,一iI,以小数表示为各年龄组的死亡专率iP在一定时间内死亡人数占某确定人群中的比例。在一定时间内死亡人数占某确定人群中的比例。iiIP累积死亡率 累积死亡率是由各年龄组死亡专率构成,不受人口构累积死亡率是由各年龄组死亡专率构成,不受人口构成的影响,两个累积死亡率可直接比较。成的影响,两个累积死亡率可直接比较。注意事项计算某病的发病率或死亡率时,从理论上讲应以所有可能患某种

10、疾病的人数作为分母才能正确地反映发病或死亡的强度。但在实际计算时有一定困难。分子应有确切的定义或标准并应当坚持始终计算疾病的频率时,通常是以年为时间单位,但也可根据研究者的需要另外规定时间单位关联强度的流行病学指标关联强度的流行病学指标v相对危险度相对危险度v特异危险度特异危险度v人群特异危险度人群特异危险度v人群特异危险度百分比人群特异危险度百分比相对危险度(危险比相对危险度(危险比/率比)率比)RRRR 意义:意义:暴露组发病或死亡的危险是非暴露组的多少倍暴露组发病或死亡的危险是非暴露组的多少倍RRRR值越大,暴露的效应越大,暴露与结局关联值越大,暴露的效应越大,暴露与结局关联强度越大强度

11、越大 010ncnaIIRReIe:暴露组率:暴露组率Io:非暴露组率:非暴露组率概念:暴露组发病(或死亡)率与非暴露概念:暴露组发病(或死亡)率与非暴露组发病(或死亡)率的比值。组发病(或死亡)率的比值。意 义RR=1,表示暴露与疾病危险无关联RR1,说明疾病的危险度增加,正相关,暴露越多,疾病越多,可能是致病因素。RR1,说明疾病的危险度减少,负相关,暴露越多,疾病越少,具有保护意义。特异危险度特异危险度(归因危险度(归因危险度/率差)率差)ARAR 意义意义暴露与非暴露人群比较,所增加的疾病发生数量,表示单独由某因素所暴露与非暴露人群比较,所增加的疾病发生数量,表示单独由某因素所致的发病

12、(或死亡)危险致的发病(或死亡)危险 ARAR值越大,暴露因素消除后所减少的疾病数量越大值越大,暴露因素消除后所减少的疾病数量越大 010ncnaIIARe1000RRIIIRRAR或概念:暴露组发病(或死亡)率与非暴露组发病(或死亡)率之差。意义:吸烟对于每个受害者,患肺癌的危险性比患心血管病意义:吸烟对于每个受害者,患肺癌的危险性比患心血管病的危险大得多;对于整个人群,吸烟引起心血管的死亡率却比的危险大得多;对于整个人群,吸烟引起心血管的死亡率却比肺癌的高。肺癌的高。RR RR 吸烟对肺癌的病因学意义较大吸烟对肺癌的病因学意义较大AR AR 戒烟对心血管疾病的预防作用较大,戒烟对心血管疾病

13、的预防作用较大,即公共卫生意义较大即公共卫生意义较大 RR与与AR的区别的区别疾病疾病吸烟者吸烟者非吸烟者非吸烟者RRAR肺癌肺癌48.334.6910.843.84心血管疾病心血管疾病294.67169.451.7125.13(1/10万人年万人年)人群归因危险度人群归因危险度 PARPAR 意义意义暴露人群与一般人群比较,所增加的疾病发生率的暴露人群与一般人群比较,所增加的疾病发生率的大小大小PARPAR值越大,暴露因素消除后所减少的疾病数量越值越大,暴露因素消除后所减少的疾病数量越大大 PAR=ItI0 It:全人群发病率:全人群发病率Io:非暴露组发病率:非暴露组发病率概念:指总人群发

14、病率中归因于暴露的部分。人群归因危险度百分比人群归因危险度百分比PAR%PAR%意义意义 PARPAR占总人群全部发病(或死亡)的百分比占总人群全部发病(或死亡)的百分比%100%0ttIIIPAR%100111%RRPRRPPARee或或 Pe:总人群的暴露比例:总人群的暴露比例概念:人群中因暴露于某因素所致某病占人群中某病发病的百分比。流行病学研究方法分类按设计类型分类按设计类型分类描述流行病学描述流行病学 分析流行病学分析流行病学 横断面调查横断面调查疾病监测疾病监测生态学研究生态学研究筛检筛检病例对照研究病例对照研究队列研究队列研究实验流行病学实验流行病学 随机化临床实验随机化临床实验

15、现场试验现场试验社区干预实验社区干预实验理论流行病学理论流行病学流行病学模型流行病学模型 描述流行病学收集资料(现有资料、专门目的调查所得资料)计算相应统计指标和疾病率比较不同时间、地区、人群中的分布情况探索病因、评价防治措施及其效果现况调查研究特定时点或期间内对特定人群某种疾病或健康状研究特定时点或期间内对特定人群某种疾病或健康状况进行的调查研究。况进行的调查研究。调查人群:社区居民、企业员工、社区卫生服务中心调查人群:社区居民、企业员工、社区卫生服务中心的患者的患者又称横断面研究、患病率研究又称横断面研究、患病率研究第一节、现况研究第一节、现况研究目 的描述疾病的患病率或健康状况的分布描述

16、疾病的患病率或健康状况的分布提供疾病致病因素的线索提供疾病致病因素的线索确定高危人群确定高危人群对疾病监测、预防接种效果及其他资料的质量评价对疾病监测、预防接种效果及其他资料的质量评价第二节现况调查第二节现况调查方法及种类面访信访电话访问自填式问卷调查:个人基本情况、个人与家族病史、行为及生活方式体格检查和实验室检查敏感问题的调查方法优优 点点常用抽样调查,结果有较强推广意义常用抽样调查,结果有较强推广意义有来自同一群体的自然形成的同期对照组,结果具有有来自同一群体的自然形成的同期对照组,结果具有可比性可比性可同时观察多种因素可同时观察多种因素第二节现况调查第二节现况调查缺缺 点点难以确定先因

17、后果的时相关系难以确定先因后果的时相关系不能获得发病率资料不能获得发病率资料研究对象可能处于临床前期而被误定为正常人研究对象可能处于临床前期而被误定为正常人第二节现况调查第二节现况调查研究实例P234练习某社区卫生服务中心想了解社区居民慢性病患病及相关因素的现状,为制定社区慢性病管理及慢性病健康教育措施提供依据。方式:抽样调查步骤:确定研究对象,估计样本量调查方法:问卷包括:人口学特征、慢性病患病的情况、慢性病相关危险因素情况以及慢性病相关知识分析指标:患病率(病种、性别、年龄组);暴露率(各危险因素、性别、年龄组、暴露率与患病的关系);知晓率(相关知识、性别、年龄组)分析流行病学描述性研究分

18、析疾病和健康状态与可能的致病因素之间的关系筛选致病因素形成和检验病因假说队列研究对一定范围内未患有的人群按是否暴露于某因素(或具备某种特征)进行分组,随访一定的时间,比较两组的发病率或死亡率,以研究某因素或某特征是否与某疾病发生或死亡存在着关系。目标人群目标人群 未患某研究未患某研究 疾病疾病代表代表性样性样本本 NoYes No暴露组暴露组非暴露组非暴露组时间顺序时间顺序 是否暴露某个危险因子是否暴露某个危险因子结局(疾病)结局(疾病)队列研究的结构模式图队列研究的结构模式图Yes时间顺序时间顺序 过去过去 现在现在 将来将来 历史性队列双向性队列前瞻性队列v观察法观察法 v设立对照设立对照

19、 v由因到果,符合时间顺序由因到果,符合时间顺序 v确证暴露和结局因果关系确证暴露和结局因果关系v追踪两组间的发病或死亡率差异追踪两组间的发病或死亡率差异特 点队列研究优点:优点:从原因(病因)到结果(疾病)从原因(病因)到结果(疾病)可直接进行因果推断可直接进行因果推断可进行一因多果研究可进行一因多果研究缺点:缺点:所需人数较多,时间较长,易产生失访偏倚所需人数较多,时间较长,易产生失访偏倚研究实例P236探讨超重/肥胖与糖尿病的关系确定暴露因素超重:24体重指数28肥胖:体重指数28结局随访观察中将出现的预期结果事件,即研究者希望追踪观察的时间糖尿病确定研究现场一个或多个社区代表性:研究人

20、群能够反映目标人群的情况可行性:人力、物力的耗费,研究现场的工作基础,研究对象的依从性确定研究人群超重组、肥胖组对照组(体重正常组)要求:三组人群?糖尿病除了体重外,其他各种影响因素或人群特征都应尽可能地相同,即具有可比性估算样本量资料收集与随访:随访的方法、内容、时间间隔、观察终点及随访者基线资料和随访资料:问卷调查、体格检查和实验室检查随访周期:每年1次分析指标超重组、肥胖组和对照组的可比性及资料的可靠性分析计算两组的糖尿病的发病率、病死率和年发病率等指标计算超重或肥胖与糖尿病的关联强度评估研究过程中可能存在的各种偏倚失访偏倚信息偏倚混杂偏倚病例对照研究在疾病发生之后,以现在患有该病的病人

21、为一组在疾病发生之后,以现在患有该病的病人为一组(病例组),以未有该病但其它条件如性别、年龄(病例组),以未有该病但其它条件如性别、年龄与病人相同的人为另一组(对照组),通过询问,与病人相同的人为另一组(对照组),通过询问,化验比较或复查病史,按其既往各种可疑致病因素化验比较或复查病史,按其既往各种可疑致病因素或验证病因假说。或验证病因假说。调查方向:收集回顾性资料调查方向:收集回顾性资料 比较比较 人数人数 暴露暴露 疾病疾病病例病例对照对照+acbd)(caa)(dbb特特 点点v 观察性研究观察性研究v 设立对照设立对照v 由果推因由果推因v 不能证实暴露与疾病的因果关系不能证实暴露与疾

22、病的因果关系v 只能推测判断暴露与疾病是否有关联只能推测判断暴露与疾病是否有关联病例对照研究优点:优点:回顾性,需要人力、物力较小回顾性,需要人力、物力较小所需样本量不大,资料易于收集所需样本量不大,资料易于收集缺点:缺点:易于产生偏倚易于产生偏倚研究实例P237实验性研究实验性研究 将来自同一总体的研究人群随机分为实验组和对照将来自同一总体的研究人群随机分为实验组和对照组,研究者对实验组人群施加某种干预措施后,随组,研究者对实验组人群施加某种干预措施后,随访并比较两组人群的发病(死亡)情况或健康状况访并比较两组人群的发病(死亡)情况或健康状况有无差别及差别大小,从而判断干预措施效果的一有无差

23、别及差别大小,从而判断干预措施效果的一种前瞻性、实验性研究方法。种前瞻性、实验性研究方法。实验流行病学特点:特点:前瞻性前瞻性必须施加一种或多种干预处理必须施加一种或多种干预处理研究对象来自同一个总体的抽样人群研究对象来自同一个总体的抽样人群分组按照随机分配原则分组按照随机分配原则必须有平行的实验组和对照组,两者具有可比性必须有平行的实验组和对照组,两者具有可比性分 类现场试验现场试验临床试验临床试验个体试验个体试验社区试验社区试验 临床试验研究临床试验研究的结构示意图的结构示意图临床试验临床试验(clinical trial)无无效效无无效效有效有效有效有效 现场试验研究现场试验研究的结构示

24、意图的结构示意图无无效效无无效效有效有效有效有效个体试验基本单位:个人管理对象:未患病人群、高危人群、患病人群某社区卫生服务中心想了解非药物的生活方式干预在糖尿病防治中的效果确定研究对象糖尿病患者估计样本量随机分组干预组:综合干预组(常规治疗+健康教育+个体针对性指导)发放糖尿病健康知识材料、糖尿病专题讲座、组织患者交流讨论饮食、运动、用药指导、自我监测指导对照组:常规治疗组确定干预时间随访收集资料资料分析:两组基线资料的均衡性分析干预的有效性分析:两组各自干预前后的对比分析干预组的效果?对照组的效果两组变化情况的对比分析社区干预试验对象:社区尽可能相似的两个社区某学校的班级或某个年龄组的人群

25、基线调查随机选择干预组和对照组干预结束后对两个社区进行随访调查干预效果:比较两个社区的疾病和危险因素的暴露水平的差异诊断试验诊断试验 筛检试验筛检试验 诊断试验诊断试验 对象不同 健康人或无症状的病人 病人 目的不同 把病人及可疑病人与无病者区分开来 病人与可疑有病但实际无病的人区分开来 要求不同 快速、简便、高灵敏度 科学性、准确性 费用不同 简单、廉价 一般花费较贵 处理不同 阳性者须进一步作诊断试验以便确诊 结果阳性者要随之以治疗 筛检试验与诊断试验的区别筛检试验与诊断试验的区别指 标客观指标:如体温计测定的体温主观指标:如疼痛半客观指标:根据诊断者的主观感知判断 (如肿物的硬度、大小)

26、受试者工作特性曲线受试者工作特性曲线(RECEIVER OPERATOR(RECEIVER OPERATOR CHARACTERISTIC CURVE,ROC)CHARACTERISTIC CURVE,ROC)是用真阳性率和假阳性率作图得出的曲是用真阳性率和假阳性率作图得出的曲线,它可表示灵敏度和特异度之间的关系线,它可表示灵敏度和特异度之间的关系糖尿病血糖试验的糖尿病血糖试验的ROC曲线曲线(李立明李立明 2002)ROCROC曲线常用来决定最佳临界点,通常曲线常用来决定最佳临界点,通常最接近左上角那一点,可定为最佳临界点最接近左上角那一点,可定为最佳临界点 ROCROC曲线也可用来比较两种

27、和两种以上曲线也可用来比较两种和两种以上诊断试验的诊断价值,从而帮助临床医师作诊断试验的诊断价值,从而帮助临床医师作出最佳选择。出最佳选择。评价指标评价指标(一)真实性(validity)测量值与实际值相符合的程度,亦称效度。包括灵敏度与假阴性率灵敏度与假阴性率特异度与假阳性率特异度与假阳性率似然比似然比正确诊断指数正确诊断指数(二)可靠性二)可靠性(RELIABILITY)(RELIABILITY)又称信度,指某一筛检方法在相同条件下重复测又称信度,指某一筛检方法在相同条件下重复测量同一受试者时,所获结果的一致性。量同一受试者时,所获结果的一致性。变异系数 符合率 诊断试验的一致性分析 (三

28、)收益(三)收益 阳性预测值(阳性预测值(positive predictive positive predictive valuevalue):是指试验阳性者患目标疾病的可是指试验阳性者患目标疾病的可能性能性 阴性预测值(阴性预测值(negative predictive negative predictive valuevalue):是指试验阴性者不患目标疾病是指试验阴性者不患目标疾病的可能性的可能性%100BAA阳性预测值%100DCD阴性预测值提高诊断质量的方法:提高诊断质量的方法:选择患病率高的人群选择患病率高的人群 采用联合试采用联合试 串联:全部串联:全部筛检试验结果均为阳性者才

29、定为阳性。筛检试验结果均为阳性者才定为阳性。该法可以提高特异度。该法可以提高特异度。并联:只要有任何一项筛检试验结果为阳性就可定并联:只要有任何一项筛检试验结果为阳性就可定为阳性。该法可以提高灵敏度。为阳性。该法可以提高灵敏度。定 义 运用数理统计的运用数理统计的基本原理基本原理和和方法方法对预防医学和公共卫对预防医学和公共卫生领域中的科学研究进行生领域中的科学研究进行设计设计,以及研究资料的,以及研究资料的收集收集、整整理理和和分析分析的一门应用科学。的一门应用科学。统计设计调查设计实验设计:研究对象接受了某种干预(或处理)后获得的数据例:某研究者为了解螺旋藻的保健功能对患有糖尿病的小鼠作降

30、血糖实验,按初始血糖浓度将20只小鼠随机分为两组,一组为空白对照,另一组给螺旋藻,然后观察血糖是否有变化。:为了对某个特定人群的现状作调查而进行的研究设计例:2005年某地区小学生营养膳食调查统计分析统计分析统计描述统计描述统计指标统计指标统计图表统计图表统计分布统计分布平均数指标平均数指标变异指标变异指标相对数指标相对数指标统计表统计表统计图统计图正态分布正态分布t t 分布分布F F 分布分布2 2分布分布统计分析统计分析统计推断统计推断参数估计参数估计点估计点估计区间估计区间估计 假设检验:比较它们的样本均数或样本率假设检验:比较它们的样本均数或样本率2 2统计资料的类型统计资料的类型

31、常指单个反应变量的数据类型。常指单个反应变量的数据类型。计量资料计量资料 计数资料计数资料 等级资料等级资料 计量、计数和等级资料间可相互转化。计量、计数和等级资料间可相互转化。计数资料是先将观察单位按某种属性或类别分成若干组,再清点各组观察单位个数所得到的资料。如:检验结果-用阳性或阴性反应表示,又如 型,按A、B、AB、O四型分型。计数资料每个观察单位之间没有量的差别,但各组之间具有质的不同,不同性质的观察单位不能归入一组。对这类资料通常是先计算百分比或率等相对数,需要时做百分比或率之间的比较,也可做两事物之间相关的相关分析。计量资料是用仪器、工具或其它定量方法对每个观察单位的某项标志进行

32、测量,并把测量结果用数值大小表示出来的资料,一般带有度量衡或其它单位。如检查一批应征青年体重,需要磅秤测量,通常以公斤为单位,测得许多大小不一的体重值。其它如身长(cm)、血压mmHg)、脉搏(次分)、红细胞(万/mm3)转氨酶(单位)等,都属于计量资料。每个观察单位的观测值之间有量的区别,但同一批观察单位必须是同质的。对这类资料通常先计算平均数与标准差等指标,需要时做各均数之间的比较或各变量之间的分析。等级资料或半定量资料还有一些资料,也是将观察单位按某种属性或某个标志分组,然后清点各组观察单位个数得来的,但所分各组之间具有等级顺序。这些资料既具有计数资料的特点,又兼有半定量的性质,称为等级

33、资料或半定量资料。例如对一批急性病毒性肝炎患者作麝香草酚絮状试验,将试验结果按-、+、+、+、+分组,显然各组之间既有等级顺序,又有程序与量的差别。又如某病住院病人的治疗结果,按治愈、好转、无效、死亡分组,同样各组之间具有顺序与程度之别。分析等级资料常用的统计指标有比和率,常用的统计方法有秩和检验、参照单位分析等。统计工作的步骤统计工作的步骤 设计设计(design)(design)收集资料收集资料(collection of data)(collection of data)整理资料整理资料(Sorting data)(Sorting data)分析资料分析资料(analysis of da

34、ta)(analysis of data)1.1.设计设计(design)(design)资料收集、整理、分析全过程的设想和安排。资料收集、整理、分析全过程的设想和安排。(制定周密的研究计划制定周密的研究计划)选题:目的、意义、假说;选题:目的、意义、假说;确定观察对象和观察单位:普查、抽样调查;确定观察对象和观察单位:普查、抽样调查;收集资料指标和方法:报表、专项调查;收集资料指标和方法:报表、专项调查;分析指标和方法;分析指标和方法;质控:误差、偏倚控制;质控:误差、偏倚控制;经费预算;经费预算;组织;组织;预期成果;预期成果;2.2.收集资料收集资料 (collection of dat

35、a)(collection of data)统计报表;统计报表;资料来源资料来源 经常性工作记录;经常性工作记录;专题调查或实验。专题调查或实验。完整、准确和及时完整、准确和及时 资料要求资料要求 有足够数量,即有足够数量,即 n n 够大够大 代表性及可比性代表性及可比性3.3.整理资料整理资料 (Sorting data)(Sorting data)资料核查、录入、分组、汇总。资料核查、录入、分组、汇总。4.4.分析资料分析资料 (analysis of data)(analysis of data)计算相关指标,阐明事物的内在联系和规律。计算相关指标,阐明事物的内在联系和规律。统计描述统

36、计描述 (descriptive statistics)(descriptive statistics)统计推断统计推断 (inferential statistics)(inferential statistics)医学统计学的重要概念总体总体 (population)(population)根据研究目的确定的同质根据研究目的确定的同质观察单位观察单位的全体。的全体。(同质的所有观察单位某种变量值的集合)(同质的所有观察单位某种变量值的集合)例:调查某地2004年20岁健康男大学生的身高 了解某市某年三级甲等医院的病床数 样本与随机抽样样本与随机抽样(1)(1)样本样本 (sample)(s

37、ample)从总体中随机抽取有代表性的一部分个体,从总体中随机抽取有代表性的一部分个体,其测量值(观察值)的集合。其测量值(观察值)的集合。(2)(2)随机抽样(随机抽样(random samplingrandom sampling)总体中每个体都有均等机会被抽取,抽到总体中每个体都有均等机会被抽取,抽到谁具有一定的偶然性。谁具有一定的偶然性。包括:单纯随机抽样、整群抽样、系统抽样、分包括:单纯随机抽样、整群抽样、系统抽样、分层抽样等层抽样等例:要了解某地2004年所有20岁健康男大学生的 身高。我们从总体中抽取一部分观察单位加以实际观察或调查研究,根据对这一部分观察单位的观察研究结果,再去推

38、论和估计总体情况。观察样本的目的在于推论总体,这就是样本与总体的辩证关系。为了使样本能够正确反映总体情况,对总体要有明确的规定;总体内所有观察单位必须是同质的;在抽取样本的过程中,必须遵守随机化原则;样本的观察单位还要有足够的数量。变量与变量值变量与变量值 (1)(1)变量(变量(variable)variable):观察单位(或个体)观察单位(或个体)的某种属性或标志。的某种属性或标志。(2)(2)变量值变量值(value of variable):(value of variable):对变量进对变量进 行测量或观察的值。即测量值或观察值。行测量或观察的值。即测量值或观察值。例1:调查某市

39、某年三级甲等医院的病床数例2:调查某地成年人的高血压患病情况(年龄、性别、职业、文化程度、体重、血压等)同质与变异同质与变异(1)(1)同质同质(homogeneity)(homogeneity):研究对象具有相同的背景、条件、属研究对象具有相同的背景、条件、属性。性。(2)(2)变异变异(variation)(variation):同一性质的事物,其个体观察同一性质的事物,其个体观察值(变量值)之间的差异。值(变量值)之间的差异。生物因素及其他综合因素、偶然性生物因素及其他综合因素、偶然性个体差异个体差异同同质单位的各个体指标的差异质单位的各个体指标的差异例1:调查某地2004年所有20岁健

40、康男大学生的 身高例2:研究某种新药治疗胃溃疡的效果 参数与统计量参数与统计量(1)(1)参数参数(parameter)(parameter):总体指标。总体指标。凡是来自总体的指标均称之。凡是来自总体的指标均称之。(2)(2)统计量:统计量:样本指标。样本指标。从总体中随机抽取的样本所算得的指标值。从总体中随机抽取的样本所算得的指标值。例:某地2002年全部正常成年男子的平均红细胞数,从该总体中随机抽取的144名正常成年男子的平均红细胞数误差误差(error)(error):测量值与真值,样本指测量值与真值,样本指标与总体指标之差。标与总体指标之差。(1)(1)系统误差系统误差(system

41、atic error)(systematic error)由于测量系统失准所导致的误差。由于测量系统失准所导致的误差。a.a.操作方法不正确或对调查问卷理解有误操作方法不正确或对调查问卷理解有误b.b.医生掌握疗效标准偏高或偏低医生掌握疗效标准偏高或偏低c.c.周围环境的改变:室温、作用时间等周围环境的改变:室温、作用时间等d.d.仪器不准或试剂不合格仪器不准或试剂不合格例:测血压特点:有倾向性。特点:有倾向性。通过校正、培训等可避免,但不通过校正、培训等可避免,但不 能用统计方法解决。能用统计方法解决。(2)(2)随机测量误差随机测量误差 (random error)(random erro

42、r)偶然机遇所致,无方向性。偶然机遇所致,无方向性。无法避免,只要将误差控制在允无法避免,只要将误差控制在允许范围内,数据仍可用。许范围内,数据仍可用。(3)(3)抽样误差抽样误差(sampling error)(sampling error)在抽样研究中,即使消除了系在抽样研究中,即使消除了系统误差,控制了随机测量误差,样统误差,控制了随机测量误差,样本统计指标和总体参数间仍会存在本统计指标和总体参数间仍会存在差别。差别。由抽样引起,是个体变异造成,由抽样引起,是个体变异造成,无倾向性。无倾向性。无法避免,但有规律可循,用无法避免,但有规律可循,用统计方法估计或增大样本使其减少。统计方法估计

43、或增大样本使其减少。例:假定已知某年某地所有13岁女大学生身高的总体均数是155.4cm,总体标准差是5.3cm。在此有限总体中多次重复抽样,每次均抽取100例组成一个样本,可算出每一个样本的平均身高。得到的样本均数可能是153.6、153.1、154.9,158.7等。概率与频率概率与频率(1)(1)概率概率(probability)(probability)某随机事件发生的可能性大小的数值。某随机事件发生的可能性大小的数值。随机事件的概率在随机事件的概率在0 0与与1 1之间,即之间,即P1P1。P P越接近越接近1 1,表明事件发生可能性越大,表明事件发生可能性越大,P P越接近越接近0

44、 0,表明事件发生可能性越小。,表明事件发生可能性越小。P 0.05P 0.05或或P 0.01P 0.01称为小概率事件,称为小概率事件,表示在一次实验或观察中某事件发生的可能表示在一次实验或观察中某事件发生的可能性很小,可以视为很可能不发生。性很小,可以视为很可能不发生。(2)(2)频率频率(frequency)(frequency)一次试验结果计算得到的样本率。一次试验结果计算得到的样本率。例:某药治疗200个病人,其治愈率为80%;经过多次试验和许多人的治疗,其治愈率稳 定在80%。统计描述统计描述连续型定量变量的频数分布表连续型定量变量的频数分布表 1.1.求全距求全距 (极差,极差

45、,range)R=range)R=最大值最小值最大值最小值 2.2.定组数、组距、组段定组数、组距、组段 i=R/k ki=R/k k为组段数为组段数(8(81515组组)3.3.列表归纳列表归纳 第一组下限含最小值第一组下限含最小值(略小于最小值略小于最小值),末组上限含最大值末组上限含最大值(略大于最大值略大于最大值),组中值组中值=(相邻两组下限之和)(相邻两组下限之和)/2/2,列出各组频数,列出各组频数,计算各组频率、累积频数、累积频率。计算各组频率、累积频数、累积频率。举例举例 1.1.计量资料的频数分布表计量资料的频数分布表 例例1 1 某市某市19951995年对年对11011

46、0名名7 7岁男孩测量身高岁男孩测量身高(cm)(cm)资料。资料。R=134.5-110.2=24.3(cm)R=134.5-110.2=24.3(cm)i=24.3/10 i=24.3/10 2(cm)2(cm)注意:分组可等距或不等距。注意:分组可等距或不等距。表表1 1101 110名名7 7岁男孩身高频数岁男孩身高频数组段组段 组中值组中值 频数频数 频率频率 累积频数累积频数 累积频率累积频率 X f f%X f f%f (f (f)%f)%110 111 1 0.91 1 0.91110 111 1 0.91 1 0.91112 113 3 2.73 4 3.64112 113

47、3 2.73 4 3.64114 115 9 8.18 13 11.82114 115 9 8.18 13 11.82116 117 9 8.18 22 20.00116 117 9 8.18 22 20.00118 119 15 13.64 37 33.64118 119 15 13.64 37 33.64120 121 18 16.36 55 50.00120 121 18 16.36 55 50.00122 123 21 19.09 76 69.09122 123 21 19.09 76 69.09124 125 14 12.73 90 81.82124 125 14 12.73 90

48、81.82126 127 10 9.09 100 90.91126 127 10 9.09 100 90.91128 129 4 3.64 104 94.55128 129 4 3.64 104 94.55130 131 3 2.73 107 97.27130 131 3 2.73 107 97.27132 133 2 1.82 109 99.09132 133 2 1.82 109 99.09134-136 135 1 0.91 110 100.00134-136 135 1 0.91 110 100.00合计合计 110 100.00 110 100.00 直方图直方图 (histogra

49、m)(histogram)(本图为近似对称分布本图为近似对称分布)111 113 115 117 119 121 123 125 127 129 131 133 111 113 115 117 119 121 123 125 127 129 131 133 135 135 身身高高(cm)(cm)图图1 1 某市某市110110名名7 7岁男骇身高的频数分布岁男骇身高的频数分布05101520人人数数定量变量的特征数定量变量的特征数 集中趋势(集中趋势(central tendencycentral tendency)离散趋势(离散趋势(tendency of dispersiontenden

50、cy of dispersion)(一一)描述集中趋势的统计指标描述集中趋势的统计指标 算术均数算术均数(均数均数)常用常用 (样本样本)、(总体总体)指标指标 几何均数几何均数G G 中位数中位数MMx常用指标常用指标 1.1.均数均数 (mean)(mean)算术均数算术均数 (arithmetic mean)(arithmetic mean)条件:观察值呈正态分布或近似正态分布条件:观察值呈正态分布或近似正态分布 (对称或近似对称分布对称或近似对称分布)的资料的资料 公式:直接法公式:直接法 加权法加权法 x x0 0为组中为组中值值 特性:特性:nxnxxxxniin/)(/)(121

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 医疗、心理类
版权提示 | 免责声明

1,本文(流行病与卫生统计学基本知识综述课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|