[医学]医学统计学课件.ppt

上传人(卖家):晟晟文业 文档编号:5153277 上传时间:2023-02-15 格式:PPT 页数:100 大小:728KB
下载 相关 举报
[医学]医学统计学课件.ppt_第1页
第1页 / 共100页
[医学]医学统计学课件.ppt_第2页
第2页 / 共100页
[医学]医学统计学课件.ppt_第3页
第3页 / 共100页
[医学]医学统计学课件.ppt_第4页
第4页 / 共100页
[医学]医学统计学课件.ppt_第5页
第5页 / 共100页
点击查看更多>>
资源描述

1、首都医科大学附属北京安定医院首都医科大学附属北京安定医院2023-1-122 医学统计学医学统计学 第一章第一章 概论概论 第二章第二章 集中趋势与离散趋势的统计描述集中趋势与离散趋势的统计描述 第三章第三章 t t检验检验 第四章第四章 方差分析方差分析 第五章第五章 卡方检验卡方检验 第六章第六章 非参数检验非参数检验 第七章第七章 相关与回归相关与回归2023-1-123第一章第一章 概论概论 第一节第一节 医学统计学的意义医学统计学的意义 第二节第二节 医学统计工作中的内容和资料类型医学统计工作中的内容和资料类型 第三节第三节 医学统计中的基本概念医学统计中的基本概念2023-1-12

2、4第一节第一节 医学统计学的意义医学统计学的意义 统计分析是科研工作中的一种有力工具。它同统计分析是科研工作中的一种有力工具。它同科研的总体设计、资料采集、资料整理、资料科研的总体设计、资料采集、资料整理、资料分析直到最后作出结论都有密切关系。掌握了分析直到最后作出结论都有密切关系。掌握了这个工具可以使用较少的人力、物力和时间获这个工具可以使用较少的人力、物力和时间获得比较可靠的结果。得比较可靠的结果。只有正确运用统计分析方法,才不致于造成不只有正确运用统计分析方法,才不致于造成不应有的缺陷或得出错误的结论。应有的缺陷或得出错误的结论。2023-1-125第二节第二节 医学统计工作中的内容和资

3、料类型医学统计工作中的内容和资料类型 医学统计工作的内容医学统计工作的内容 资料的类型资料的类型2023-1-126医学统计工作中的内容医学统计工作中的内容 收集资料收集资料 收集资料就是根据研究的目的,实验设计的要求,收集资料就是根据研究的目的,实验设计的要求,收集准确的、完整的、充满信息的原始资料。收集准确的、完整的、充满信息的原始资料。整理资料整理资料 整理资料就是把收集到的原始资料,有目的地进行整理资料就是把收集到的原始资料,有目的地进行科学加工,使资料系统化、条理化,以便进行统计科学加工,使资料系统化、条理化,以便进行统计分析。分析。分析资料分析资料 分析资料就是把经过统计整理的资料

4、,作一系列统分析资料就是把经过统计整理的资料,作一系列统计描述和统计推断,阐明事物的规律性。计描述和统计推断,阐明事物的规律性。2023-1-127资料的类型资料的类型 计量资料计量资料是对每个观察对象的观察指标用定量方法测定该项指标是对每个观察对象的观察指标用定量方法测定该项指标的数值大小所得的资料,一般用度量衡单位表示。的数值大小所得的资料,一般用度量衡单位表示。计数资料计数资料是先将观察对象的观察指标按性质或类别进行分组,然是先将观察对象的观察指标按性质或类别进行分组,然后计数各组该观察指标的数目所得的资料。后计数各组该观察指标的数目所得的资料。等级分组资料等级分组资料在医学实践中,有些

5、资料具有计数资料的特性,同时又在医学实践中,有些资料具有计数资料的特性,同时又兼有半定量的性质,被称为按等级分组资料。兼有半定量的性质,被称为按等级分组资料。2023-1-128第三节第三节 医学统计中的基本概念医学统计中的基本概念 变异变异 总体和样本总体和样本 抽样抽样 配对设计与随机区组设计配对设计与随机区组设计 误差误差 概率概率2023-1-129变变 异异 医学研究的对象是有机的生命体,其机能是十医学研究的对象是有机的生命体,其机能是十分复杂的。不同的个体在相同的条件下,对外分复杂的。不同的个体在相同的条件下,对外界环境因素可以发生不同的反应。这种现象称界环境因素可以发生不同的反应

6、。这种现象称只为个体差异或称为变异。只为个体差异或称为变异。由于医学统计研究的对象是有变异的事物,因由于医学统计研究的对象是有变异的事物,因此,用观察此,用观察12例的结果来推论出一般规律是例的结果来推论出一般规律是不恰当的。科学研究工作的主要任务就是要从不恰当的。科学研究工作的主要任务就是要从表现为偶然的大量数据中,分析出其中必然性表现为偶然的大量数据中,分析出其中必然性的规律。的规律。2023-1-1210抽抽 样样 代表性代表性 就是要求样本中的每一个个体必须符合总体的规定。就是要求样本中的每一个个体必须符合总体的规定。随机性随机性 抽签法抽签法 机械抽样法机械抽样法 分层抽样分层抽样

7、随机数字表随机数字表 可靠性可靠性 指对实验的结果要有可重复性,即由科研课题的样本的结果指对实验的结果要有可重复性,即由科研课题的样本的结果推论总体的结论有较大的可靠性。推论总体的结论有较大的可靠性。可比性可比性 如果进行两个或多个样本之间的比较,那么要求每两个样本如果进行两个或多个样本之间的比较,那么要求每两个样本之间应具有可比性,也称为齐性对比原则。之间应具有可比性,也称为齐性对比原则。2023-1-1211配对设计与随机区组设计配对设计与随机区组设计 完全随机设计完全随机设计 是将受试对象随机分配到各个处理组或对照组,或是将受试对象随机分配到各个处理组或对照组,或分别从不同总体中随机抽样

8、进行研究。分别从不同总体中随机抽样进行研究。配对设计配对设计 它是将受试对象按一定条件配成对子,称为配对样它是将受试对象按一定条件配成对子,称为配对样本,将它们随机分到两个组中,分别给以不同处理。本,将它们随机分到两个组中,分别给以不同处理。随机区组设计随机区组设计 它也称为配伍组设计,是配对设计的扩展。配对设它也称为配伍组设计,是配对设计的扩展。配对设计的每一计的每一“对子对子”分别随机分到两个处理中,而配分别随机分到两个处理中,而配伍设计中的每个伍设计中的每个“配伍组配伍组”,包含有多个受试对象,包含有多个受试对象,要将它们分别随机分到各处理组。要将它们分别随机分到各处理组。2023-1-

9、1212误误 差差 系统误差系统误差 在收集资料过程中,由于仪器初始状态未调到零、标准试剂在收集资料过程中,由于仪器初始状态未调到零、标准试剂未经效正、医生掌握疗效标准偏高或偏低等原因,可使观察未经效正、医生掌握疗效标准偏高或偏低等原因,可使观察结果造成倾向性的偏大或偏小,叫做系统误差。结果造成倾向性的偏大或偏小,叫做系统误差。随机测量误差随机测量误差 在收集资料过程中,由于各种偶然因素的影响而造成同一对在收集资料过程中,由于各种偶然因素的影响而造成同一对象多次测定结果的不完全一致。这种误差往往没有固定的倾象多次测定结果的不完全一致。这种误差往往没有固定的倾向,有时高有时低,被称为随机测量误差

10、。向,有时高有时低,被称为随机测量误差。抽样误差抽样误差 个体之间存在变异,而抽样有时只能抽去总体中的一小部分个体之间存在变异,而抽样有时只能抽去总体中的一小部分作为样本。作为样本。2023-1-1213概概 率率 概率是描述某一事件发生的可能性大小的一个量度。概率是描述某一事件发生的可能性大小的一个量度。用用A表示某一事件,表示某一事件,P表示该事件可能发生的概率。表示该事件可能发生的概率。在一定条件下,肯定发生的事件称为必然事件,概率在一定条件下,肯定发生的事件称为必然事件,概率为为1;肯定不发生的事件称为不可能事件,概率为;肯定不发生的事件称为不可能事件,概率为0;可能发生也可能不发生的

11、事件称为随机事件或偶然事可能发生也可能不发生的事件称为随机事件或偶然事件,其概率介于件,其概率介于0与与1之间。之间。在统计学上,习惯将在统计学上,习惯将P0.05或或P 0.01称为小概率事件,称为小概率事件,表示该事件发生的可能性很小。表示该事件发生的可能性很小。在医学研究中,常把在医学研究中,常把P 0.05作为事物差别有统计学意作为事物差别有统计学意义义,P 0.01作为事物差别有高度统计学意义的界限作为事物差别有高度统计学意义的界限.2023-1-1214第二章第二章 集中趋势与离散趋势的统计描述集中趋势与离散趋势的统计描述 第一节第一节 集中趋势的描述统计集中趋势的描述统计这一部分

12、的主要内容涉及统计图表和描述平均水平这一部分的主要内容涉及统计图表和描述平均水平和集中趋势的统计量,目的在于有效地组织、整理和集中趋势的统计量,目的在于有效地组织、整理和表现统计资料的信息。和表现统计资料的信息。第二节第二节 离散趋势的描述统计离散趋势的描述统计衡量变异程度大小的指标有多种,但大体可以分为衡量变异程度大小的指标有多种,但大体可以分为两类:一类是按间距计算,有极差和四分位数间距;两类:一类是按间距计算,有极差和四分位数间距;另一类则按平均差距计算,有离均差平方和、均方另一类则按平均差距计算,有离均差平方和、均方差、标准差和变异系数等。差、标准差和变异系数等。2023-1-1215

13、第一节第一节 集中趋势的描述统计集中趋势的描述统计 频率分布频率分布 平均数平均数 算术均数算术均数 几何均数几何均数 中位数中位数 百分位数百分位数2023-1-1216频率分布频率分布 类型类型 频率表频率表 直方图直方图 用途用途 作为陈述资料的形式,可以代替繁复的原始资料,作为陈述资料的形式,可以代替繁复的原始资料,便于进一步分析。便于进一步分析。便于观察数据的分布类型。便于观察数据的分布类型。便于发现资料中某些远离群体的特大或特小的可疑便于发现资料中某些远离群体的特大或特小的可疑值。值。当样本含量比较大时,可用各组段的频率作为概率当样本含量比较大时,可用各组段的频率作为概率的估计值。

14、的估计值。2023-1-1217算术均数算术均数 直接法直接法 加权法加权法nXnXXXXXn.321nfxnxfxfxfxfXkk.3322112023-1-1218几何均数几何均数 通用式:通用式:直接法:直接法:分组法:分组法:nnXXXXG.321)lg(lg)lg.lglg(lg1211nXnXXXGn)lg(lg).(lg122111nxfnxfxfxfGkk2023-1-1219中位数中位数 直接法直接法 当观察例数为奇数时:当观察例数为奇数时:M=XM=X(n+1n+1)/2/2 当观察例数为偶数时:当观察例数为偶数时:M=M=(X Xn/2n/2+X+Xn/2+1n/2+1)

15、分组法分组法 其中其中L L、i iM M、f fM M、分别为所在组段的下限、组距和频数,、分别为所在组段的下限、组距和频数,f fL L为为M M所在组之前各组段的累积频数。所在组之前各组段的累积频数。MMLiffnLM)5.0(2023-1-1220百分位数百分位数 百分位数用符号百分位数用符号Px表示,表示,x即百分位,所谓百分位数即百分位,所谓百分位数Px是指在一组数据中找到这样一个值,全部观察值的是指在一组数据中找到这样一个值,全部观察值的x%小于小于Px,而其余(,而其余(100-x)%大于大于Px。其中其中L L、ixix、fxfx、分别为、分别为PxPx所在组段的下限、组距和

16、频所在组段的下限、组距和频数,数,f fL L为为PxPx所在组之前各组段的累积频数。所在组之前各组段的累积频数。xXLxiffxnLP)%.(2023-1-1221第二节第二节 离散趋势的统计描述离散趋势的统计描述 极差和四分位数间距极差和四分位数间距 平均偏差平均偏差 离均差平方离均差平方 方差方差 标准差标准差 变异系数变异系数2023-1-1222积差和四分位数间距积差和四分位数间距 积差积差也称全距,即一组观察值中最大值和最小值之差,也称全距,即一组观察值中最大值和最小值之差,符号为符号为R R,是变异指标中最简单的一种。,是变异指标中最简单的一种。四分位数间距四分位数间距将所有的观

17、察值排序后,分成四个数目相等的段落,将所有的观察值排序后,分成四个数目相等的段落,每个段落的观察值数目各占总例数的每个段落的观察值数目各占总例数的25%25%,去掉两,去掉两端的端的25%25%,取中间,取中间50%50%观察值的数值范围即为四分位观察值的数值范围即为四分位数间距。数间距。四分位数间距用符号四分位数间距用符号Q Q表示,它可以通过计算百分表示,它可以通过计算百分位数位数P P7575和和P P2525之差得到,即之差得到,即Q=PQ=P7575-P-P25252023-1-1223平均偏差平均偏差 计算各观察值偏离平均数的平均差距,为了避免正负抵消,将每个观察值与均数之差的绝对

18、值相加,然后取平均,称作平均偏差,它可以表示为:平均偏差是一个很直观的变异量度,但由于用了绝对值,在数学上不便于继续处理,使它在应用上受到很大限制,实际中很少使用。nXX平均偏差2023-1-1224离均差平方和离均差平方和 为了克服平均偏差使用绝对值不便进一步运算的缺点,可以不通过取绝对值,而是通过取平方来避免正负抵消,即使用离均差平方和,其公式为:它描述了每个观察值相对于集中位置“均数”的分散程度。通过计算可化为下式:2)(XXnXXXX222)()(2023-1-1225方方 差差 将离均差平方和再取平均,其结果称作均方差,将离均差平方和再取平均,其结果称作均方差,简称方差。简称方差。需

19、要注意的是,对于样本资料,在对离均差平需要注意的是,对于样本资料,在对离均差平方和取平均时分母用方和取平均时分母用n-1代替代替n,于是有:,于是有:式中式中s2为样本方差,分母为样本方差,分母n-1称为自由度。称为自由度。1)(22nXXs2023-1-1226标准差标准差 在统计分析中为了方便,通常将方差取平方根,在统计分析中为了方便,通常将方差取平方根,还原成与原始观察值单位相同的变异量度,即还原成与原始观察值单位相同的变异量度,即标准差,计算公式如下:标准差,计算公式如下:也可写为:也可写为:1)(2nXXs1/)(22nnXXs2023-1-1227变异系数变异系数 在两组数据的均数

20、相差不大,单位也相同时,从标准差的大小就可以直接比较两个样本的变异程度。当均数相差较大或单位不同的几组观察值的变异程度进行比较时,标准差就不适宜了,在这种情况下可以使用变异系数,其计算公式为:%100XSCV2023-1-1228第三章第三章 t 检验检验 第一节第一节 假设检验的意义和步骤假设检验的意义和步骤 第二节第二节 单个样本单个样本 t 检验检验 第三节第三节 配对样本配对样本 t 检验检验 第四节第四节 两独立样本两独立样本 t 检验检验2023-1-1229第一节第一节 检验假设的意义和步骤检验假设的意义和步骤 检验假设的基本概念检验假设的基本概念 检验假设是对估计的总体首先提出

21、一个假设,然后通过样本检验假设是对估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设。如果拒绝,认为该样本很可数据去推断是否拒绝这一假设。如果拒绝,认为该样本很可能不是来自这个总体;否则,很可能来自这个总体。能不是来自这个总体;否则,很可能来自这个总体。建立检验假设和确定检验水平建立检验假设和确定检验水平 假设:无效假设(假设:无效假设(H0)/被择假设(被择假设(H1)检验水平:检验水平:选择检验方法和统计推断分析选择检验方法和统计推断分析 选择检验方法和计算检验统计量选择检验方法和计算检验统计量 确定确定P值和作出统计推断结论值和作出统计推断结论2023-1-1230第二节

22、第二节 单个样本单个样本 t 检验(检验(1)例:根据大量调查,已知健康成年男子例:根据大量调查,已知健康成年男子的脉搏均数为的脉搏均数为72次次/分,某医生在某山区分,某医生在某山区随机调查随机调查30名健康男子,求得脉搏均数名健康男子,求得脉搏均数为为74.2次次/分,标准差为分,标准差为6.5次次/分。能否认分。能否认为该山区的成年男子的脉搏均数高于一为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数?般成年男子的脉搏均数?2023-1-1231第二节第二节 单个样本单个样本 t 检验(检验(2)建立检验假设,确定检验水平建立检验假设,确定检验水平 H0:=0 H1;0=0.05计算

23、检验统计量计算检验统计量确定确定P值,做出推断结论值,做出推断结论 本例自由度本例自由度v30-1=29 查附表得查附表得t0.05(29)=2.045 今今t0.05,无统计学意义无统计学意义854.1305.6722.74/00nsXsXtX2023-1-1232第三节第三节 配对样本配对样本 t 检验(检验(1)将受试对象按某些重要特征相近的原则配成对子,每对中的两个将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理,称为随机配对设计。个体随机地给予两种处理,称为随机配对设计。配对设计资料主要有三种情况:配对设计资料主要有三种情况:两种同质受试对象分别接受两种

24、处理;两种同质受试对象分别接受两种处理;同一受试或同一样本的两个部分,分别接受两种不同处理;同一受试或同一样本的两个部分,分别接受两种不同处理;同一受试对象处理(实验或治疗)前后的结果比较。同一受试对象处理(实验或治疗)前后的结果比较。配对设计的检验统计量为:配对设计的检验统计量为:nsdsdsdtdddd/02023-1-1233第三节第三节 配对样本配对样本 t 检验(检验(2)例:有例:有12名接种卡介苗的儿童,八周后用两批不同的结核菌素,名接种卡介苗的儿童,八周后用两批不同的结核菌素,一批是标准结核菌素,一批是新制结核菌素,分别注射在儿童的一批是标准结核菌素,一批是新制结核菌素,分别注

25、射在儿童的前臂,问两种结核菌素的皮肤浸润反应性有无差别?前臂,问两种结核菌素的皮肤浸润反应性有无差别?编号编号 标准品标准品 新制品新制品 差值差值d d2 1 12.0 10.0 2.0 4.00 2 14.5 10.0 4.5 20.25 3 15.5 12.5 3.0 9.00 .12 10.5 9.5 1.0 1.00 合合 计计 39 1952023-1-1234第三节第三节 配对样本配对样本 t 检验(检验(3)建立检验假设,确定检验水平建立检验假设,确定检验水平 H0:d=0 H1;d 0=0.05计算检验统计量计算检验统计量确定确定P值,做出推断结论值,做出推断结论 自由度自由

26、度v-12-1=11,t0.05(11)=2.201 t0.01(11)=3.106 本例本例 t t0.01(11),),Pt0.05(23)=2.069,PF0.05(11,12),Pt0.05,P F0.01(2,33),P0.05故按故按=0.05水平拒绝水平拒绝H0,接受,接受H1,可以认为三组,可以认为三组NO总体水平不总体水平不同。同。2023-1-1251第第2节节 随机区组设计的方差分析(随机区组设计的方差分析(1)随机区组设计的方差分析表随机区组设计的方差分析表 变异来源 平方和 自由度 均方 F 总变异 N-1 因素A c-1 SSA/(r-1)MSA/MSe 因素B r

27、-1 SSB/(r-1)MSB/MSe 误差 (c-1)(r-1)SSe/e 其中校正项 CX2 ijijCrX/)(2 jiijCcX/)(2BAYSSSSSSNXC/)(22023-1-1252第第2节节 随机区组设计的方差分析(随机区组设计的方差分析(2)例例:将将36只雌性大白鼠按月龄相同、体重接近分为只雌性大白鼠按月龄相同、体重接近分为12组组,经一段时间注射经一段时间注射不同剂量雌激素后的子宫质量见下表。试问:不同剂量雌激素后的子宫质量见下表。试问:1.不同组的大鼠间子宫质不同组的大鼠间子宫质量是否相同?量是否相同?2.接受不同剂量注射的大鼠子宫质量是否相同?接受不同剂量注射的大鼠

28、子宫质量是否相同?区区 组组 0.2 0.4 0.8 合计合计 1 83 100 109 292 2 64 78 111 253 3 69 79 149 297 .12 62 106 114 282 合计合计 794 1092 1537 34232023-1-1253 第第2节节 随机区组设计的方差分析(随机区组设计的方差分析(3)建立检验假设建立检验假设(1)H0:1=2=3 H1:i(i=1,2,3)不同剂量组间不完全相同)不同剂量组间不完全相同(2)H0:1=2=3 H1:i(i=1,2,3)不同种属间不完全相同)不同种属间不完全相同计算统计量计算统计量75.2927425.325470

29、3547252CXSST25.32547036/)3423(/)(22NXC1667.2330225.32547012)1537()1092()794(/)(2222 ijijACrXSS4167.117925.3254703)282.()253()292(/)(2222 jiijBCcXSS1667.47934167.11791667.2330275.29274BATeSSSSSSSS2023-1-1254 第第2节节 随机区组设计的方差分析(随机区组设计的方差分析(4)方差分析表方差分析表 变异来源变异来源 平方和平方和 自由度自由度 均方均方 F 总变异总变异 29274.75 35 不

30、同剂量间不同剂量间 23302.1667 2 11651.0833 53.4769不同区组间不同区组间 1179.4167 11 107.2197 0.4921 误差误差 4793.1667 22 217.8712对关于剂量分组的假设,查附表,对关于剂量分组的假设,查附表,F0.05(2,22)=3.4453.4769,P0.4921,P0.05。按按=0.05水平不能拒绝水平不能拒绝H0。2023-1-1255第三节第三节 多个样本均数的多重比较多个样本均数的多重比较q检验法检验法 用于对多个样本均数每两个作比较,检验统计量为:用于对多个样本均数每两个作比较,检验统计量为:式中式中 为两个对

31、比组的样本均数,为两个对比组的样本均数,Mse是方差分是方差分析中的误差均方(或组内均方),析中的误差均方(或组内均方),nA、nB为两对比组为两对比组的样本例数,的样本例数,e为方差分析中误差均方的自由度。为方差分析中误差均方的自由度。)11(2)(BAeBAnnMSxxqBAxx、2023-1-1256第五章第五章 卡方检验卡方检验 第一节第一节 22表卡方检验表卡方检验 第二节第二节 行行列表卡方检验列表卡方检验 第三节第三节 配对资料卡方检验配对资料卡方检验2023-1-1257第一节第一节 22表卡方检验表卡方检验 四格表卡方检验四格表卡方检验 四格表资料卡方检验的连续性校正四格表资

32、料卡方检验的连续性校正 四格表卡方检验的精确概率检验法(略)四格表卡方检验的精确概率检验法(略)2023-1-1258四个表卡方检验(四个表卡方检验(1)使用卡方检验的基本公式使用卡方检验的基本公式 卡方检验的基本公式为:卡方检验的基本公式为:这里这里R是是Row(行)的字头,(行)的字头,C是是Column(列)的字(列)的字头,头,ARC是位于是位于R行行C列交叉处的实际频数,列交叉处的实际频数,TRC是是位于位于R行行C列交叉处的理论频数。列交叉处的理论频数。nR是是ARC所在的行的合计,所在的行的合计,nC是是ARC所在列的合计,所在列的合计,n是多个样本例数的合计。是多个样本例数的合

33、计。RCRCRCTTA22)(nnnTCRRC2023-1-1259四个表卡方检验(四个表卡方检验(2)例:某药品检验所随机抽取例:某药品检验所随机抽取574名成年人,研究某抗生名成年人,研究某抗生素的耐药性。其中素的耐药性。其中179例未曾使用该抗生素,其耐药率例未曾使用该抗生素,其耐药率为为40.78%;而在;而在395例曾使用过该药的人群中,耐药例曾使用过该药的人群中,耐药率为率为45.57%,试问两种人群的耐药率是否一样?,试问两种人群的耐药率是否一样?用药史用药史 不敏感不敏感 敏感敏感 合计合计 耐药率(耐药率(%)曾服该药曾服该药 180 215 395 45.57 未服该药未服

34、该药 73 106 179 40.78 合计合计 253 321 574 44.082023-1-1260四个表卡方检验(四个表卡方检验(3)建立检验假设建立检验假设 H0:两种人群对该抗生素的耐药率相同,即:两种人群对该抗生素的耐药率相同,即1=2 H1:两种人群对该抗生素的耐药率不相同,即:两种人群对该抗生素的耐药率不相同,即12 计算检验统计量计算检验统计量 查表及统计推断查表及统计推断 20.05(1)=3.84,本例,本例 20.05 在在=0.05的检验水准下,接受的检验水准下,接受H0。10.17457425339511T90.22057432139512T90.78574253

35、17921T10.10057432117922T15.110.100)10.100106(90.78)90.7873(90.220)90.220215(10.174)10.174180(222222023-1-1261四个表卡方检验(四个表卡方检验(4)四格表资料四格表资料 2检验专用公式检验专用公式 22表格式表格式 B1 B2 合计合计 A1 a b a+b A2 c d c+d a+c b+d n=a+b+c+d)()()()(22dcbadbcanbcad2023-1-1262四格表资料卡方检验的连续性校正(四格表资料卡方检验的连续性校正(1)在四个表资料中,当在四个表资料中,当n40

36、且某一理论值且某一理论值1T5时,须对时,须对 2值进行连续性效正。值进行连续性效正。TTA22)5.0()()()()2(22dcbadbcannbcad2023-1-1263 四格表资料卡方检验的连续性校正(四格表资料卡方检验的连续性校正(2)例:某医学院抽样调查大学四年级和五年级的学生近例:某医学院抽样调查大学四年级和五年级的学生近视眼患病情况,四年级学生的近视率为视眼患病情况,四年级学生的近视率为7.14%,五年,五年级学生的近视率为级学生的近视率为35.71%,试问大学四年级与五年级,试问大学四年级与五年级学生的近视率是否一样?学生的近视率是否一样?年级年级 近视近视 非近视非近视

37、合计合计 近视率(近视率(%)四年级四年级 2(4.67)26(23.33)28 7.14 五年级五年级 5(2.33)9(11.69)14 35.71 合计合计 7 35 42 16.672023-1-1264 四格表资料卡方检验的连续性校正(四格表资料卡方检验的连续性校正(2)建立检验假设建立检验假设 H0:四年级与五年级学生的近视眼率相同,即:四年级与五年级学生的近视眼率相同,即1=2 H1:四年级与五年级学生的近视眼率不相同,即:四年级与五年级学生的近视眼率不相同,即12 计算检验统计量计算检验统计量 查表及统计推断查表及统计推断 20.05(1)=3.84,本例,本例 20.05 在

38、在=0.05的检验水准下,接受的检验水准下,接受H0。62.3)95)(262)(926)(52(42)24252692(222023-1-1265四表格卡方检验的确切概率计算法四表格卡方检验的确切概率计算法 在四表格的卡方检验中,若遇到总例数在四表格的卡方检验中,若遇到总例数n40,或有理,或有理论值论值T20.05(2),P0.05,拒绝,拒绝H0。但究竟哪两组之间的有效。但究竟哪两组之间的有效率有差别,须进一步作两两组间率的比较。率有差别,须进一步作两两组间率的比较。017.0305.0N32)13(32)1(kkN2023-1-1269多个实验组间的两两比较(多个实验组间的两两比较(2

39、)西药与中药治疗肝炎疗效比较西药与中药治疗肝炎疗效比较 组组 别别 有效有效 无效无效 合计合计 有效率(有效率(%)西药组西药组 51 49 100 51.00 中药组中药组 35 45 80 43.75 合合 计计 86 94 180 47.78查表查表20.05(1)=3.84,而,而20.050.017,在,在0.017的的水平下不拒绝水平下不拒绝H0。94.0801009486180)35494551(222023-1-1270多个实验组间的两两比较(多个实验组间的两两比较(3)西药与中西药结合治疗肝炎疗效比较西药与中西药结合治疗肝炎疗效比较 组组 别别 有效有效 无效无效 合计合计

40、 有效率(有效率(%)西药组西药组 51 49 100 51.00中西药结合中西药结合 59 15 74 79.73 合合 计计 110 64 174 63.22查表查表20.01(1)=6.63,而,而220.01(1),则,则P0.01 20.01(1),则,则P0.0120.05(2),P 20.01(1),则,则P0.01 20.01(1),则,则P0.01 20.01(1),则,则P0.010.017,在,在0.017的的水平下拒绝水平下拒绝H0。22.779575898156)70292928(22C2023-1-1276第三节第三节 配对资料卡方检验(配对资料卡方检验(1)基本公

41、式:校正公式:当观察频数b+c40时,需要对2进行校正。cbcb22)(cbcb22)1(2023-1-1277第三节第三节 配对资料卡方检验(配对资料卡方检验(2)例;在下列资料中,例;在下列资料中,A培养基的阳性培养率为培养基的阳性培养率为36.36%,B培养基的阳性培养率为培养基的阳性培养率为34.345,试问,试问A、B两种培养两种培养基的阳性培养率是否相同?基的阳性培养率是否相同?两种培养基的培养结果两种培养基的培养结果 A培养基培养基 B培养基培养基 合计合计 +48(a)24(b)72 20(c)106(d)126 68 130 1982023-1-1278第三节第三节 配对资料

42、卡方检验(配对资料卡方检验(3)建立检验假设建立检验假设 H0:两种培养基的阳性检出率相等:两种培养基的阳性检出率相等 H1:两种培养基的阳性检出率不等:两种培养基的阳性检出率不等 计算检验统计量计算检验统计量 查表及统计推断查表及统计推断 20.05(1)=3.84,本例,本例 20.05 在在=0.05的检验水准下,接受的检验水准下,接受H0。3636.02024)2024()(222cbcb2023-1-1279第六章第六章 非参数检验方法非参数检验方法 第一节第一节 配对资料的秩和检验配对资料的秩和检验 第二节第二节 两样本比较的秩和检验两样本比较的秩和检验 第三节第三节 多个样本比较

43、的秩和检验多个样本比较的秩和检验2023-1-1280第一节第一节 配对资料的秩和检验(配对资料的秩和检验(1)一一 般般 步步 骤骤求出各对数据的差值求出各对数据的差值建立检验假设建立检验假设编秩次,求秩和编秩次,求秩和 依差值绝对值,从大到小排秩,并按差值的正负,标上正负依差值绝对值,从大到小排秩,并按差值的正负,标上正负号;号;编秩时,对正负号不同的差数中,若有绝对值相等时,则取编秩时,对正负号不同的差数中,若有绝对值相等时,则取其平均秩次;其平均秩次;分别求正负秩次之和分别求正负秩次之和T+与与T,并以绝对值较小者为统计量,并以绝对值较小者为统计量T值。值。查表,确定查表,确定P值范围

44、值范围 当当n25时,可查附表的时,可查附表的T界值表,界值表,T越小,越小,P越小。越小。当当n25时,可按近似正态分布用时,可按近似正态分布用u检验,其公式为:检验,其公式为:24/)12)(1(5.04/)1(nnnnnTu2023-1-1281第一节第一节 配对资料的秩和检验(配对资料的秩和检验(2)例:临床某医生研究白癜风病人的例:临床某医生研究白癜风病人的IL-6指标在白癜风部位与正常指标在白癜风部位与正常部位有无差异,调查的资料如下:部位有无差异,调查的资料如下:病人号病人号 白斑部位白斑部位 正常部位正常部位 d=正常正常-白斑白斑 秩次秩次 1 40.03 88.57 48.

45、54 6 2 91.13 88.00 -17.13 -3 3 80.32 123.72 43.40 4 4 25.32 39.03 13.71 2 5 19.61 24.37 4.76 1 6 14.50 92.75 78.25 8 7 49.63 121.57 71.94 7 8 44.56 89.76 45.20 5 合计合计 T+=33 T=32023-1-1282第一节第一节 配对资料的秩和检验(配对资料的秩和检验(3)建立检验假设建立检验假设 H0:差值总体的中位数为:差值总体的中位数为0 H1:差值总体的中位数不为:差值总体的中位数不为0 计算统计量计算统计量 首先计算每个对子的差

46、值首先计算每个对子的差值d,根据,根据8个个d 的绝对值,由小到大的绝对值,由小到大排秩,并根据排秩,并根据d 的正负号给予正负号。然后分别相加正负秩次,的正负号给予正负号。然后分别相加正负秩次,得到得到T+=33,T=3,取较小者为统计量,取较小者为统计量T=T=3。查表及结论查表及结论 现现n=8,查,查T值表值表T0.05(8)=333,T=3恰好落在界点上,所以恰好落在界点上,所以P0.05,按,按=0.05水准拒绝水准拒绝H0,可认为白斑部位与正常部位的可认为白斑部位与正常部位的白介素有差异。白介素有差异。2023-1-1283第二节第二节 两样本比较的秩和检验(两样本比较的秩和检验

47、(1)一一 般般 步步 骤骤建立检验假设建立检验假设编秩号,求秩和编秩号,求秩和 两样本观察值从小到大混合编秩;两样本观察值从小到大混合编秩;设设n1与与n2分别为两样本的含量,规定分别为两样本的含量,规定n1n2,含量为,含量为n1组的秩组的秩和和T1为统计量为统计量T值。值。确定确定P值值 当当n1159,超,超出范围,出范围,P 20.05(3),P0.05,按按=0.05水准拒绝水准拒绝H0,接受,接受H1,故认为四组,故认为四组DNA含量有差别。含量有差别。90.19)132(3)85.5495.12371348216()132(3212)1(3)1(1222222NnTNNHii2

48、023-1-1289第七章第七章 相关与回归相关与回归 第一节第一节 线性相关线性相关 第二节第二节 线性回归线性回归 第三节第三节 线性相关与回归的区别与联系线性相关与回归的区别与联系 第四节第四节 等级相关等级相关2023-1-1290第一节第一节 线性相关(线性相关(1)相关系数的计算方法相关系数的计算方法 皮尔森(皮尔森(Pearson)相关法)相关法 原始分数计算法原始分数计算法22)()()(YYXXYYXXrriXYYYXXXYlllr nYXXYlXY)(nXXlXX22)(nYYlYY22)(2023-1-1291第一节第一节 线性相关(线性相关(2)例:从某大学生群体中随机

49、抽取例:从某大学生群体中随机抽取12名女大学生组成样名女大学生组成样本,分别测得每个学生得身高和体重,试计算身高与本,分别测得每个学生得身高和体重,试计算身高与体重之间的相关系数。体重之间的相关系数。编号编号 身高身高(cm)体重体重(kg)XY X2 Y2 1 152 51 7752 23104 2601 2 158 46 7268 24964 2116 3 167 55 9185 27889 3025 .12 164 55 9020 26896 3025合计合计 1998 693 115885 333470 404692023-1-1292第一节第一节 线性相关(线性相关(3)解:解:这里

50、这里r为正值,表示身高与体重呈现正的相关。为正值,表示身高与体重呈现正的相关。5.500126931998115885)(nYXXYlXY803121998333470)(222nXXlXX25.4481269340469)(222nYYlYY8342.025.4488035.500YYXXXYlllr2023-1-1293第一节第一节 线性相关(线性相关(4)线性相关系数的检验假设线性相关系数的检验假设 直接查表法直接查表法 n=12,r=0.8342,自由度,自由度=12-2=10 查附表,查附表,r0.001(10)=0.823,故,故Pt0.001(10),),P0.001,结果与查结

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文([医学]医学统计学课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|