第十五章 人群健康研究的统计学方法-PPT课件.ppt

上传人(卖家):三亚风情 文档编号:2731395 上传时间:2022-05-22 格式:PPT 页数:165 大小:4.39MB
下载 相关 举报
第十五章 人群健康研究的统计学方法-PPT课件.ppt_第1页
第1页 / 共165页
第十五章 人群健康研究的统计学方法-PPT课件.ppt_第2页
第2页 / 共165页
第十五章 人群健康研究的统计学方法-PPT课件.ppt_第3页
第3页 / 共165页
第十五章 人群健康研究的统计学方法-PPT课件.ppt_第4页
第4页 / 共165页
第十五章 人群健康研究的统计学方法-PPT课件.ppt_第5页
第5页 / 共165页
点击查看更多>>
资源描述

1、3 1 概述概述 统计学中的几个基本概念统计学中的几个基本概念2 统计资料的类型统计资料的类型3 3 统计工作的基本步骤统计工作的基本步骤4某小儿科教授通过多年的观察,发现他治疗的某小儿科教授通过多年的观察,发现他治疗的小儿巨结肠病人中,天门市占的比例最大。小儿巨结肠病人中,天门市占的比例最大。该教授据此认为天门市小儿巨结肠发病率最高该教授据此认为天门市小儿巨结肠发病率最高问:此结论是否正确?问:此结论是否正确?问:乙疗法的效果真的比甲疗法好吗?问:乙疗法的效果真的比甲疗法好吗? 如何判断药物的疗效?(假设检验) 明天是否下雨?体育彩票能否中奖?(概率论) 子女为什么象父母,其强度有多大?(相

2、关与回归) 美国的民意测验是如何进行的?(设计,抽样) 中国的市场调查的可信性有多大?(现场调查) 例如,向上抛一枚硬币,由于受到地心引力的作用,例如,向上抛一枚硬币,由于受到地心引力的作用,硬币上升到某一高度后必定会下落我们把这类现象称硬币上升到某一高度后必定会下落我们把这类现象称为确定性现象(或必然现象)水在为确定性现象(或必然现象)水在2会结冰,会结冰,肯定肯定不发生称不发生称不可能事件不可能事件。 抛掷一枚硬币,当硬币落在地面上时,可能抛掷一枚硬币,当硬币落在地面上时,可能是正面(有国徽的一面)朝上,也可能是反是正面(有国徽的一面)朝上,也可能是反面朝上,在硬币落地前我们不能预知究竟哪

3、面朝上,在硬币落地前我们不能预知究竟哪一面朝上我们把这类现象称为一面朝上我们把这类现象称为随机现象随机现象(或偶然现象)(或偶然现象)同样,自动机床加工制造同样,自动机床加工制造一个零件,可能是合格品,也可能是不合格一个零件,可能是合格品,也可能是不合格品;射击运动员一次射击,可能击中品;射击运动员一次射击,可能击中10环,环,也可能击中也可能击中9环环8环环甚至脱靶等等也都是甚至脱靶等等也都是随机现象随机现象 医学医学统计学统计学是以医学理论为指是以医学理论为指导,运用统计学原理和方法导,运用统计学原理和方法,研究研究医学领域中居民健康状况以及卫生医学领域中居民健康状况以及卫生服务领域中服务

4、领域中有关数据的搜集、整理有关数据的搜集、整理、分析的一门应用性科学、分析的一门应用性科学。 是是研究研究随机现象随机现象的的统计规律性统计规律性的的一门科学一门科学。1. 1. 同质与变异同质与变异2. 2. 总体与样本总体与样本3. 3. 变量及变量及变量变量值值4. 4. 参数与统计量参数与统计量5. 5. 抽样与误差抽样与误差6. 6. 概率概率同质同质变异变异是指统计研究中,是指统计研究中,给观察单位规定给观察单位规定一些相同的因素一些相同的因素情况(性质相同情况(性质相同或相近的事物)或相近的事物)是指同质的是指同质的个体之间的个体之间的差异差异 例例1 调查调查2003年西安市年

5、西安市7岁男童的身岁男童的身高和体重高和体重同质同质:2003年、西安市、年、西安市、7岁男童岁男童变异变异:身高和体重各不相同:身高和体重各不相同 例例2 研究某降压药的疗效研究某降压药的疗效同质同质:高血压患者、用某药治疗:高血压患者、用某药治疗变异变异:疗效各不相同:疗效各不相同总体总体样本样本是指根据研究目是指根据研究目的而确定的同质的而确定的同质观察单位的全体观察单位的全体是从总体中随是从总体中随机抽取的部分机抽取的部分有有代表性代表性的观的观察单位察单位, 某指某指标的实测值即标的实测值即构成了样本。构成了样本。有限总体:有限总体:指总体所包指总体所包含的个体是含的个体是有限的有限

6、的无限总体:无限总体:指总体所包指总体所包含的个体是含的个体是无限的无限的总体总体十堰市全部十堰市全部十岁男童十岁男童随机抽取有代表性人群部分部分1010岁岁男童男童十堰市10岁男童身高情况为了保证样本的为了保证样本的可可靠性靠性和和代表性代表性,需,需要采用随机的抽样要采用随机的抽样方法(在总体中每方法(在总体中每个个体具有个个体具有相同的相同的机会机会被抽到)。被抽到)。参数参数:描述描述总体总体特征特征的统的统计指标,如总体均数、标计指标,如总体均数、标准差,采用希腊字母分别准差,采用希腊字母分别记为记为 ( (为为固定的常固定的常数数) 样本样本抽取部分观察单位抽取部分观察单位 推断推

7、断统计量统计量:样本样本的统计指标,如样本均数、标准差,采用拉的统计指标,如样本均数、标准差,采用拉丁字母分别记为丁字母分别记为 。 (参数附近波动的随机变量参数附近波动的随机变量)SX、实际实际观察值观察值与客观与客观真实值真实值之差之差误差误差过失误差过失误差随机误差随机误差系统误差系统误差在一定的实验条件下,由于某种未被发现的固定偏差造成测定值具有倾向性的误差概念原因仪器初使状态未调整到零、标准试剂未经校正、掌握疗效的标准偏高或偏低等特点特点具有明显规律性如果已发现,要尽量查明原因,予以纠正处理处理 随机测量误差随机测量误差随机抽样误差随机抽样误差在相同条件下多次在相同条件下多次测量同一

8、变量时,测量同一变量时,观察值之间的差别观察值之间的差别从同一总体中抽从同一总体中抽样,得到某变量样,得到某变量值的统计量与参值的统计量与参数之间的差别数之间的差别个体差异造成抽样误差,这是随机误差个体差异造成抽样误差,这是随机误差的的主要原因主要原因一些暂时无法控制的微小因素或未知因一些暂时无法控制的微小因素或未知因素引起的偶然误差素引起的偶然误差 在单次测定中,随机误差的大小和方向无法预在单次测定中,随机误差的大小和方向无法预言。但在大量重复测定中,它呈正态分布,均值为言。但在大量重复测定中,它呈正态分布,均值为零。零。 在控制影响因素与消除系统误差和杜绝过失误在控制影响因素与消除系统误差

9、和杜绝过失误差条件下,绝大部分的实验误差来自随机误差中的差条件下,绝大部分的实验误差来自随机误差中的抽样误差。抽样误差。处理处理通过实验设计加以控制通过实验设计加以控制指实验者因粗枝大叶或未遵守操作指实验者因粗枝大叶或未遵守操作规程等主观因素错误而造成的误差规程等主观因素错误而造成的误差(3)过失误差:概念概念记录不正确与计算或抄写错误记录不正确与计算或抄写错误往往表现为实验结果远离均值或出现反常变化在科研中必须杜绝过失在科研中必须杜绝过失误差误差处理处理概念概念描述某事件发生可能性大小的度量描述某事件发生可能性大小的度量其值介于其值介于0和和1之间之间 确确定性现象定性现象:在一定条件下,:

10、在一定条件下,一定一定会发生或一定不会发会发生或一定不会发生的现象。生的现象。其表现结果为两种事件:肯定发生某种结果的叫其表现结果为两种事件:肯定发生某种结果的叫必然事必然事件件;肯定不发生某种结果的叫肯定不发生某种结果的叫不可能事件不可能事件。随机现象随机现象:在同样条件下:在同样条件下可能可能会出现两种或多种结果,会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。其表现结果称为究竟会发生哪种结果,事先不能确定。其表现结果称为随机事件随机事件。 随机事件的特征:随机事件的特征:随机性随机性;规律性规律性:每次发生的可能性的大小是确定的。每次发生的可能性的大小是确定的。必然事件必然事件

11、P P= 1 = 1 不可能事件不可能事件 P P=0 =0 随机事件随机事件 00P P11 P P 0.05 0.05(5 5)或)或P P 0.01 0.01(1 1)称为称为小概率事件小概率事件( (习惯习惯) ),统计学上认为在一次,统计学上认为在一次实验或观察中该事件发生的可能性很小,可视实验或观察中该事件发生的可能性很小,可视为很可能不发生。为很可能不发生。变量变量变量值变量值观察对象的特征或指标,如:性别、年龄、身高、体重、职业观察对象的特征或指标测量的结果称为变量值,男、女160cm, 56kg工人、学生数值变量资料数值变量资料分类变量资料分类变量资料 等级资料等级资料 根据

12、是否定量根据是否定量体重(体重(kg)、)、身高身高(cm)、血浆血浆胆固醇(胆固醇(mmol/L)等等用定量方法对观察单位进行测量得到用定量方法对观察单位进行测量得到的资料,一般用度量衡单位表示的资料,一般用度量衡单位表示概念概念 先将观察对象的观察指标按性质或类先将观察对象的观察指标按性质或类别进行分组,然后清点各组该观察指别进行分组,然后清点各组该观察指标的数目所得的资料标的数目所得的资料性别、血型、职业等性别、血型、职业等概念概念分类资料各类之间有程度的差别,给人以“半定量”的概念概念概念疗效(治愈、好转、无效、死亡)、大便隐血试验(-、+、+、+、+)、受教育程度等 例:一组例:一组

13、20 40岁成年人的血压岁成年人的血压以以12kPa12kPa为界分为正常与异常两组,统计每组例数为界分为正常与异常两组,统计每组例数 8 低血压低血压 8 8 正常血压正常血压 1212 轻度高血压轻度高血压 1515 中度高血压中度高血压 1717 重度高血压重度高血压计量资料计量资料等级资料等级资料计数资料计数资料统计设计统计设计搜集资料搜集资料整理资料整理资料分析资料分析资料将头脑中关于研究的题目、研究将头脑中关于研究的题目、研究动机与意义、研究目的和方法、动机与意义、研究目的和方法、步骤与进度、科研条件、预期结步骤与进度、科研条件、预期结果等内容用书面形式表示出来果等内容用书面形式表

14、示出来分为调查设计和实验设计分为调查设计和实验设计资料的来源资料的来源搜集资料的原则搜集资料的原则搜集资料的方式搜集资料的方式统计报表或报告卡;统计报表或报告卡; 日常医疗卫生工作记录和报告日常医疗卫生工作记录和报告卡卡; 专题调查和实验性研究资料专题调查和实验性研究资料准确、完准确、完整、及时整、及时直接观察、直接观察、采访、填表采访、填表和通信和通信方法方法步骤步骤根据研究设计者整理分析计划的根据研究设计者整理分析计划的要求要求,将资料进行分组与汇总将资料进行分组与汇总, 使使其条理化、系统化其条理化、系统化, 以便分析以便分析1、检查核对、检查核对2、设计分组、设计分组 a、质量分组质量

15、分组 b、数量分组数量分组3、归纳汇总、归纳汇总结合专业知识给出恰如其分的专业结论结合专业知识给出恰如其分的专业结论包括统计描述和统计推断包括统计描述和统计推断分析资料分析资料 统计描述:将计算出的统计指标与统统计描述:将计算出的统计指标与统计图表相结合,全面描述计图表相结合,全面描述样本样本资料的资料的数量特征及分布规律数量特征及分布规律 统计推断:利用样本信息推断总体特统计推断:利用样本信息推断总体特征(总体参数的估计和假设性检验)征(总体参数的估计和假设性检验)1、统计学上所说的样本是指(、统计学上所说的样本是指( ) A、按研究者要求取总体中有意义的部分、按研究者要求取总体中有意义的部

16、分 B 随意抽取总体中任意部分随意抽取总体中任意部分 C有意识地选择总体中典型部分有意识地选择总体中典型部分 D 按随按随机原则抽取总体中有代表性部分机原则抽取总体中有代表性部分 E总体中总体中的每一个个体的每一个个体2抽样误差是由(抽样误差是由( ) A 测量引起的测量引起的 B 个体差异造成的个体差异造成的 C计算引起的计算引起的 D 采样结果不准确引起的采样结果不准确引起的 E试剂、仪器试剂、仪器未校正引起的未校正引起的3已知某地出生男婴平均体重已知某地出生男婴平均体重3.2公斤,从该地随公斤,从该地随机抽取名机抽取名 出生男婴,测得体重均数为出生男婴,测得体重均数为3.3公公斤则斤则3

17、.3公斤与公斤与3.2公斤不同公斤不同,主要原因是主要原因是( ) A 个体变异个体变异 B 抽样误差抽样误差 C样本均数样本均数不同不同 D 随机测量误差随机测量误差4研究某地正常成年男子血压情况,用未经校正研究某地正常成年男子血压情况,用未经校正的血压计测定的血压计测定 200名正常成年人的血压值名正常成年人的血压值,所得资料可出现(,所得资料可出现( ) A系统误差系统误差 B 随机测量误差随机测量误差 C 抽样误差抽样误差 D个体差异个体差异 E 偶然误差偶然误差5、为了了解某地、为了了解某地2029岁健康女性血红蛋白岁健康女性血红蛋白的正常值范围,现随机调查了该地的正常值范围,现随机

18、调查了该地2000名名2029岁的健康女性,并对其血红蛋白进行岁的健康女性,并对其血红蛋白进行测量,请问本次调查的总体是(测量,请问本次调查的总体是( ) A该地所有该地所有2029的健康女性的健康女性 B该地所有该地所有2029的健康女性的血红蛋白的健康女性的血红蛋白测量值测量值 C抽取的这抽取的这2000名名2029岁女性岁女性 D抽取的这抽取的这2000名名2029岁女性的血红蛋白岁女性的血红蛋白测量值测量值 B1型题型题 A、计数资料(无序分类变量)、计数资料(无序分类变量) B、计量资料、计量资料 (数值变量)(数值变量) C、等级资料(有序分类变量)、等级资料(有序分类变量) D、

19、总体中的、总体中的个体个体6、身高是(、身高是( ) 7、脉搏数(次、脉搏数(次/分)是(分)是( )8、血型是(、血型是( )9、疗效是(、疗效是( )第二节第二节 数值变量资料数值变量资料的统计分析的统计分析统计描述统计描述(一) 、频数分布表频数分布:指观察值在某组段出现的次数;频数表:为了解一组同质观察值的分布规律,在观察值个数(即样本含量,n)较多时,可编制频数分布表,简称频数表。 (1)求计算全距:即最大值与最小值之差,又称为)求计算全距:即最大值与最小值之差,又称为极差极差。用用R表示表示 本例极差:本例极差: R=37.536.5=1.0(C)(2) 决定决定组距组距、组数组数

20、:组距用组距用 i 表示表示。组距。组距=极差极差/组数组数,组数组数通常分通常分10-15个组,为方便计,组距参考极差的十个组,为方便计,组距参考极差的十分之一分之一, 再略加调整。再略加调整。 本例本例 i = R /10=1.0/10=0.1(C)(3) 列出组段:第一组段应包含列出组段:第一组段应包含最小值最小值,最后一个组段,最后一个组段上限必须包含最大值上限必须包含最大值,其它组段上限值忽略。,其它组段上限值忽略。(4) 统计频数统计频数:用划记法将所有数据归纳到各组段,得:用划记法将所有数据归纳到各组段,得到各组段的频数。到各组段的频数。 (5)确定频率与累计频率。确定频率与累计

21、频率。均数3779.8/10237.06C人数集中趋势:变量值集中位置。本例在组段集中趋势:变量值集中位置。本例在组段“37.0”。 平均水平指标平均水平指标离散趋势离散趋势:变量值围绕集中位置的分布情况变量值围绕集中位置的分布情况。离。离“中心中心”位置越远,频数越小;且围绕位置越远,频数越小;且围绕“中心中心”左右对称。左右对称。变异水平指标变异水平指标从不同角度说明被研究的事物。从不同角度说明被研究的事物。 正态分布正态分布:集中位置在正中,左右两侧基本对称:集中位置在正中,左右两侧基本对称,也叫高斯分布,是最常见、,是最常见、最重要的一种连续型分布。最重要的一种连续型分布。 偏态分布偏

22、态分布:集中位置偏向一侧,频数分布不对称。:集中位置偏向一侧,频数分布不对称。正偏态分布正偏态分布 负偏态分布负偏态分布 分布类型不同,采用的统计方法不同。分布类型不同,采用的统计方法不同。图12-1 160名正常成年女子的血清甘油三酯的频数分布图05101520250.50 0.70 0.90 1.10 1.30 1.50 1.70 1.90血清甘油三酯(mmol/L)频数10246810121416181224364860728496108 120潜伏期(h)病例数图2-3 101名正常人的血清肌红蛋白含量051015202505101520253035404550肌红蛋白含量(ug/mL

23、)人数正态分布:中间高、正态分布:中间高、两边低、左右对称两边低、左右对称正偏态分布:正偏态分布:长尾向长尾向右右延伸延伸负偏态分布:负偏态分布:长尾向长尾向左左延伸延伸iikkkffXffffXffXfXXfX3213211为求和符号,读成sigma意义:一组性质相同(同质)的观察值在数量上的平均水平。意义:一组性质相同(同质)的观察值在数量上的平均水平。表示表示 (总体)总体) X(样本)(样本)计算:直接法、加权法(间接法)、计算机计算:直接法、加权法(间接法)、计算机特征:特征: ( X- X)=0 估计误差之和为估计误差之和为0。应用:正态分布或近似正态分布应用:正态分布或近似正态分

24、布注意:合理分组,才能求均数,否则没有意义注意:合理分组,才能求均数,否则没有意义。 X X1 1+X2+X3+.+Xn+X2+X3+.+Xn =-=/n =-=/n n n nXXnXXXXnXXXXXGnGnnGlglglg)lglg(lg1lg12121为正值,为底的反对数表示以为底的对数;表示以010lg10lg1X几何均数:变量几何均数:变量对数值的算术均对数值的算术均数的反对数。数的反对数。 适用条件适用条件:呈倍数关系的等比资料或对数正态分:呈倍数关系的等比资料或对数正态分布(正偏态)资料;如抗体滴度资料布(正偏态)资料;如抗体滴度资料意义:意义:N个数值的乘积开N次方即为这N个

25、数的几何均数。表示:表示:G 例如:血清的抗体效价滴度的倒数分别为:10、100、1000、10000、100000,求几何均数。1000510lg10lg10lg10lg10lglg543211G此例的算术均数为此例的算术均数为22222,显然不能代表滴度的,显然不能代表滴度的平均水平。同一资料,几何均数平均水平。同一资料,几何均数 时,表示在时,表示在H0成立的条件下,出现等于及成立的条件下,出现等于及大于现有统计量的概率不是小概率,现有样本信息还不足以拒绝大于现有统计量的概率不是小概率,现有样本信息还不足以拒绝H0。 拒绝拒绝检验假设:检验假设: 若若P ,表示在,表示在H0成立的条件下

26、,出现等于及大于现有统计量的成立的条件下,出现等于及大于现有统计量的概率是小概率,按小概率事件原理现有样本信息不支持概率是小概率,按小概率事件原理现有样本信息不支持H0,因,因而拒绝而拒绝H0。因此,因此,当当P时,按所取时,按所取检验水准,拒绝检验水准,拒绝H0,接,接受受H1。 正确理解结论的概率性(都隐含着犯错误的可能性)。正确理解结论的概率性(都隐含着犯错误的可能性)。 单样本单样本t检验检验适用于样本均数适用于样本均数X与已知总体与已知总体均数均数o的比较,目的是推断样本的比较,目的是推断样本均数均数X所代表所代表的未知总体均数的未知总体均数 与已知总体均数与已知总体均数 0有无差别

27、。有无差别。 例:据大量调查知,健康成年男子脉搏的均数为72次/分,某医生在山区随机调查了25名健康成年男子,其脉搏均数为74.2次/分,标准差为6.5次/分,能否认为该山区成年男子的脉搏高于一般人群?(1)建立检验假设,确定检验水准H0:=0山区成年男子平均脉搏数与一般人群相等H1:0山区成年男子平均脉搏数与一般人群不等双侧=0.05(2)计算统计量:(3)确定P值,作出统计推断查附表9,t界值表,t0.05,24=2.064,t0.05,按=0.05水准,拒绝H1,可认为该山区健康成年男子的脉搏均数与一般健康成年男子的脉搏均数无差别。nsXsXtX-=-=目的:目的:由两个样本均数的差别推

28、断两样本由两个样本均数的差别推断两样本 所代表的总体均数间有无差别。所代表的总体均数间有无差别。 方法方法:1). 两个小样本均数比较的两个小样本均数比较的t 检验检验 2). 两个大样本均数比较的两个大样本均数比较的u 检验检验 要保证组间的可比性 要根据研究目的、设计类型和资料类型选用适当的检验方法 正确理解差别有无显著性的统计学意义 结论不能绝对化 单、双侧检验应事先确定 叙述相对数的概念和常用种类叙述相对数的概念和常用种类 能计算及应用常用相对数指标能计算及应用常用相对数指标 说出相对数应用时的注意事项说出相对数应用时的注意事项 叙述率的抽样误差和总体率的估计叙述率的抽样误差和总体率的

29、估计(一)计数资料计数资料常见的常见的数据形式是绝对数数据形式是绝对数,如某病的出院人,如某病的出院人数、治愈人数、死亡人数等。数、治愈人数、死亡人数等。但绝对数通常不具有可比性:但绝对数通常不具有可比性:1、如甲、乙两个医院某病出院人数不同时,比较两、如甲、乙两个医院某病出院人数不同时,比较两医院该病的死亡人数没有意义医院该病的死亡人数没有意义2、如、如00级七年制一、二大班学生人数不同时,比较级七年制一、二大班学生人数不同时,比较两班医学统计学的及格人数没有意义两班医学统计学的及格人数没有意义因此需要在绝对数的基础上计算相对数因此需要在绝对数的基础上计算相对数。相对数相对数:指几个相关数据

30、或指标之比值指几个相关数据或指标之比值 ( (二二) )常用的相对数指标常用的相对数指标1.率:指现象或事件发生的率:指现象或事件发生的强度强度甲地人口甲地人口30003000,某年高血压患者,某年高血压患者300300人,患病率人,患病率10%10%;乙地人口乙地人口10001000,同年高血压患者,同年高血压患者250250人,患病率人,患病率25%25%。l 何处高血压流行情况严重?何处高血压流行情况严重?l 哪处高血压医治工作量较大?哪处高血压医治工作量较大?l 观察疾病防治工作的效果,应观察什么?观察疾病防治工作的效果,应观察什么?率:说明某现象发生的频率或强度。常以百分率(%)、千

31、分率()、万分率(1/万)、十万分率(1/10万)等表示,计算公式为: 某时期内发生某现象的观察单位数率比例基数 同期可能发生某现象的观察单位总数(1 1)计划生育统计指标)计划生育统计指标 1)出生率出生率(birth rate): 某年出生人数某年出生人数同年平均人口数同年平均人口数出生率出生率 = = 1000 1000 2 2)人口自然增长率:)人口自然增长率: 人口自然增长率人口自然增长率 = = 出生率死亡率出生率死亡率生育率生育率 = = 1000 1000 某年出生人数某年出生人数同年平均育龄妇女数同年平均育龄妇女数3 3)生育率()生育率(fertility rate):):

32、 (2 2)疾病统计指标疾病统计指标 1 1)发病率()发病率(incidence rate):):发病率(年)发病率(年)= = 1000 1000 年内新发生病例总数年内新发生病例总数年平均人口数年平均人口数上年末人口数上年末人口数 + + 本年末人口数本年末人口数2 2年均人口数年均人口数 = =某病发病率(年)某病发病率(年)= = K K 某年内某病新发生病例数某年内某病新发生病例数同年暴露人口数同年暴露人口数(式中(式中k k可为可为100%,1000 ,1100%,1000 ,1万万/1/1万万。)。)某一时点新旧病例数某一时点新旧病例数该时点观察人口数该时点观察人口数时点患病率

33、时点患病率= = K K2)患病率患病率 (prevalence rate)年患病率年患病率 = = K K某年内的新旧病例数某年内的新旧病例数同年平均人口数同年平均人口数3)感染率:(感染率:(infectious rate) 感染率感染率 = = K K受检阳性人数受检阳性人数受检总人数受检总人数4)罹患率罹患率:(attack rate) 表达一次疾病流行期内的发病(患病)表达一次疾病流行期内的发病(患病)情况。常用于描述疾病的暴发流行情况。情况。常用于描述疾病的暴发流行情况。罹患率罹患率 = = K K观察期内病例数观察期内病例数同期暴露人口数同期暴露人口数1 1)死亡率)死亡率 (

34、(mortality rate) ):某年地区全部死亡数某年地区全部死亡数年均人口数年均人口数 l总死亡率总死亡率= = 10001000某年地区因某病死亡数某年地区因某病死亡数年均人口数年均人口数 l某病死亡率某病死亡率= = 10001000l婴儿死亡率婴儿死亡率: : 表示某年平均每表示某年平均每10001000名出生人数中未活满一周岁的死亡名出生人数中未活满一周岁的死亡数。数。l孕产妇死亡率孕产妇死亡率: : 指年内直接因妊娠、指年内直接因妊娠、分娩及产后疾病死亡的妇女分娩及产后疾病死亡的妇女人数与同年活产数的人数与同年活产数的比值。比值。2 2)某病病死率()某病病死率(case f

35、atality rate) 指某类死因的死亡数占总死亡数的百分比。指某类死因的死亡数占总死亡数的百分比。某病病死率某病病死率= = 100 %100 %某时期内因某病死亡人数某时期内因某病死亡人数同期患该病人数同期患该病人数3 3)死因构成:)死因构成:1 1)治愈率()治愈率(cure rate) 治愈率治愈率 = = 100 %100 %治愈病人数治愈病人数受治病人数受治病人数治疗有效人数治疗有效人数 受治病人数受治病人数 有效率有效率 = = 100 %100 %2 2)有效率()有效率(efficiency rate) 3 3)生存率()生存率(survival rate) 随访满随访

36、满n n年仍存活的病例数年仍存活的病例数 随访病例数随访病例数 存活率存活率 = = 100 %100 % 重点掌握发病率、患病率、死亡率的应用意重点掌握发病率、患病率、死亡率的应用意义,主要包括:义,主要包括:p 反映人群的健康状况,反映人群的健康状况,p 反映人群的卫生服务需求,反映人群的卫生服务需求,p 反映疾病对人群健康的威胁程度,反映疾病对人群健康的威胁程度,p 用于评价疾病防治效果,用于评价疾病防治效果,p 描述疾病的三间分布等,用于探讨病因。描述疾病的三间分布等,用于探讨病因。2.2.构成比:指事物内部各部分所占的构成比:指事物内部各部分所占的比重比重特点:各部分构成比之和等于特

37、点:各部分构成比之和等于1 1(即(即100%100%) 资料能说明产业女工最易早产,文教卫生其次吗?资料能说明产业女工最易早产,文教卫生其次吗?100%(5-2)某一组成部分的观察单位数构成比 同一事物各组成部分的观察单位总数3.相对比:相关且相对独立的相对比:相关且相对独立的=( 100%)甲指标相对比乙指标n式中两指标可以是绝对数、相对数或平均数。某年某社区年均人口数为某年某社区年均人口数为8 8万,万,6060岁及以上人口岁及以上人口2 2万。万。年内共死亡年内共死亡120120人,其中人,其中6060岁及以上死亡岁及以上死亡8080人;在全人;在全部死亡者中,因肿瘤死亡共部死亡者中,

38、因肿瘤死亡共8080人,其中肺癌死亡人,其中肺癌死亡3232人。人。年内发现肺癌患者共年内发现肺癌患者共5050人。该社区年内共出生人。该社区年内共出生100100人。人。以年为单位完成下列计算:以年为单位完成下列计算:(1 1)年总死亡率()年总死亡率()(2 2)6060岁及以上年死亡率(岁及以上年死亡率()(3 3)肿瘤死亡率()肿瘤死亡率()(4 4)肺癌死亡率()肺癌死亡率(/ /十万)十万)(5 5)肺癌年患病率()肺癌年患病率(/ /万)万)(6 6)肺癌病死率()肺癌病死率(% %)(7 7)出)出 生生 率(率()(8 8)人口自然增长率()人口自然增长率()1、用统一的内部

39、构成,然后计算标准化率的用统一的内部构成,然后计算标准化率的方法,称为方法,称为标准化法标准化法。2、标准化法的标准化法的基本思想基本思想是:采用某影响因素是:采用某影响因素的统一标准构成以消除构成不同对合计率的影的统一标准构成以消除构成不同对合计率的影响,使通过标准化后的标准化合计率具有可比响,使通过标准化后的标准化合计率具有可比性。性。 1 1、计算标准人数、计算标准人数2 2、将原各组患病、将原各组患病 率依旧率依旧计算及合计预计算及合计预 期患病人数期患病人数算出新的总率算出新的总率12001200 80080045454545乙厂乙厂预期患病预期患病 患病率患病率 人人 数数 (甲厂

40、甲厂预期患病预期患病 患病率患病率 人人 数数 () 标准人数年龄组(岁)某年两厂工人的石棉肺患情况比较 (经标化)标准人数是怎样组成标准人数是怎样组成找出表中的找出表中的“标化率标化率”?表中那些数据是表中那些数据是“虚拟虚拟”的?的? 甲厂石棉肺总患病率究竟是甲厂石棉肺总患病率究竟是22.022.0还是还是95%95%可信区间可信区间 意义:意义: 表示表示位于该数值区间的可能性为位于该数值区间的可能性为95%95%。 计算公式:计算公式: P P1.96Sp1.96Sp(n100n100时)时)例:某社区调查例:某社区调查3535岁以上岁以上10001000人,高血压患病率人,高血压患病

41、率20%20%,95%95%总体率可信区间总体率可信区间为:为:若该社区若该社区3535岁以上人口有岁以上人口有3 3万,则全社区该年龄万,则全社区该年龄段的高血压患者估计为段的高血压患者估计为5250525067506750人。人。四、卡方检验(四、卡方检验(X X2 2检验)检验)z 掌握掌握四格表四格表、配对资料卡方检验方法、配对资料卡方检验方法z 熟悉行熟悉行X X列表卡方检验方法列表卡方检验方法 X X2 2检验用途广泛,常用的有三种。检验用途广泛,常用的有三种。四格表X X2 2检验:检验:用于比较两个样本率或构成比用于比较两个样本率或构成比 行行列表列表X X2 2检验:检验:用

42、于比较多个样本率或构成比用于比较多个样本率或构成比 配对配对X X2 2检验:检验:用于配对资料比较用于配对资料比较例例7-32:问吸烟者与不吸烟者的慢性支气管炎患病率有无问吸烟者与不吸烟者的慢性支气管炎患病率有无差别?差别?Nbdac合计合计cddc乙乙abba甲甲合计合计34927356合计合计134205合计合计疗法疗法12113不吸不吸16243吸烟吸烟未患未患患患简表示意简表示意1、计算理论数:、计算理论数: T Tn nR Rn nC CN N(二)判断能否作检验,是否需要校正(二)判断能否作检验,是否需要校正n nR R 为行合计数为行合计数n nC C 为列合计数为列合计数N

43、N 为总合计数为总合计数205563491、计算理论数:、计算理论数: T T(二)判断能否作检验,是否需要校正(二)判断能否作检验,是否需要校正2052833491、计算理论数:、计算理论数: T T5656134134349349(二)判断能否作检验,是否需要校正(二)判断能否作检验,是否需要校正1、计算理论数:、计算理论数: T T134134283283349349(二)判断能否作检验,是否需要校正(二)判断能否作检验,是否需要校正1、计算理论数:、计算理论数: T Tn nR Rn nC CN N(二)判断能否作检验,是否需要校正(二)判断能否作检验,是否需要校正本例四个理论数均本例

44、四个理论数均5 5,总合计数,总合计数4040(二)判断能否作检验,是否需要校正(二)判断能否作检验,是否需要校正根据最小理论数和总合计数判断根据最小理论数和总合计数判断若所有格子的若所有格子的 T T5 5,且,且 N N4040,可检验不必校正,可检验不必校正若有若有1 1T T5 5,且,且 N N4040,可检验需用校正公式,可检验需用校正公式若若有有T T1 1或或 N N4040时,不可作四格表卡方检验时,不可作四格表卡方检验22(), ()(1)A TT行数-1 列数A为实际频数(为实际频数(actual frequency) T为理论频数(为理论频数(theoretical f

45、requency)22(0 .5 )cATT22()2()()()()cn|ad -bc|-n=a+b c+d a+c b+d22()()()()()ad bc na b a c b d c d例二:为比较槟榔煎剂和阿的平驱绦虫的效果,例二:为比较槟榔煎剂和阿的平驱绦虫的效果,对对4545名绦虫患者进行治疗,结果如下表,问两药名绦虫患者进行治疗,结果如下表,问两药疗效是否相同?疗效是否相同?451134合计合计18810乙乙27324甲甲合计合计一、准备工作一、准备工作(1 1)(2 2)T Tminmin1111181845454.44.41Tmin 5,故用校正公式,故用校正公式(ab)(

46、cd)(ac)(bd)X2451134合计合计18810乙乙27324甲甲合计合计(adbcN2)2 N(248103452)245271834114.82(ab)(cd)(ac)(bd)X23 3、1X20.05(1)3.84 3.84 P 0.054 4、可以认为两药疗效不同,、可以认为两药疗效不同,槟榔煎剂疗效较好槟榔煎剂疗效较好。(adbcN2)2 N(248103452)245271834114.820 3.8495 适用于两个以上的率或构成比的比较适用于两个以上的率或构成比的比较 R RC C表卡方检验对资料的要求:表卡方检验对资料的要求: 任何格子的任何格子的T T1 1。 1

47、1T T5 5的格子数不得超过总格子数的的格子数不得超过总格子数的1/51/5。 如果出现上述任何一种情况,可采用下列措施如果出现上述任何一种情况,可采用下列措施 扩大样本继续调查,直至扩大样本继续调查,直至T T符合要求。符合要求。 将性质相近的邻行或邻列合并,使将性质相近的邻行或邻列合并,使T T符合要求符合要求 将将T T不符合要求的行或列去除不符合要求的行或列去除 例:胡氏等某年在北京进行住宅日照卫生标准研例:胡氏等某年在北京进行住宅日照卫生标准研究,对究,对214214幢楼房婴幼儿幢楼房婴幼儿712712人体检,检出轻度佝偻病人体检,检出轻度佝偻病患儿患儿379379例,列表如下,请

48、分析儿童佝偻病与房屋朝例,列表如下,请分析儿童佝偻病与房屋朝向有无关系。向有无关系。71230333原资料原资料T不符合不符合X2分析要求,先经相关行合并分析要求,先经相关行合并Tmin14.03符合检验要求符合检验要求333 98 nR nC 1、H0:居室朝向不同居室朝向不同佝偻病患病率相同佝偻病患病率相同 H1:居室朝向不同居室朝向不同佝偻病患病率不同佝偻病患病率不同0.052、X2N(A21)712(1802379 380 2002333380 3321)1、H0:居室朝向不同居室朝向不同佝偻病患病率相同佝偻病患病率相同 H1:居室朝向不同居室朝向不同佝偻病患病率不同佝偻病患病率不同0

49、.052、333 98 nR nC X2N(A21)712(1802379 380 2002333380 3321)X215.081、H0:居室朝向不同居室朝向不同佝偻病患病率相同佝偻病患病率相同 H1:居室朝向不同居室朝向不同佝偻病患病率不同佝偻病患病率不同0.052、X215.083、= (R1)()(C1)=(41)()(21)= 3 查表得查表得X20.05(3)= 7.81 X2X20.05 P0.054、可认为居室朝向不同,儿童的佝偻病患病率不同。、可认为居室朝向不同,儿童的佝偻病患病率不同。 某厂在冠心病普查中研究冠心病与眼底动脉硬某厂在冠心病普查中研究冠心病与眼底动脉硬化的关系

50、,资料如下,问两者之间是否存在一定的化的关系,资料如下,问两者之间是否存在一定的关系?关系?5883144513合计合计 6 1 2 31331818 97 92 613 73357 6113400合计合计冠心病冠心病可疑可疑正常正常眼底动脉眼底动脉硬化级别硬化级别冠心病诊断结果冠心病诊断结果计算理论数,有两格计算理论数,有两格T T1 1, 一格一格1 1T T5 5,其他其他T T均均5 5。 6 1 2 31331818 97 92 613 73357 6113400合计合计冠心病冠心病可疑可疑正常正常眼底动脉眼底动脉硬化级别硬化级别5883144513合计合计冠心病诊断结果冠心病诊断结

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第十五章 人群健康研究的统计学方法-PPT课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|