卡方检验及SPSS分析课件.pptx

上传人(卖家):晟晟文业 文档编号:4260080 上传时间:2022-11-24 格式:PPTX 页数:109 大小:4.78MB
下载 相关 举报
卡方检验及SPSS分析课件.pptx_第1页
第1页 / 共109页
卡方检验及SPSS分析课件.pptx_第2页
第2页 / 共109页
卡方检验及SPSS分析课件.pptx_第3页
第3页 / 共109页
卡方检验及SPSS分析课件.pptx_第4页
第4页 / 共109页
卡方检验及SPSS分析课件.pptx_第5页
第5页 / 共109页
点击查看更多>>
资源描述

1、Chi-Square Test预防医学教研室预防医学教研室张张杰杰 第一节:四第一节:四格表(格表(fourfold data)资料的)资料的x2检验检验*第二节:配对第二节:配对(paired data)资料的)资料的x2检验检验*第三节:第三节:RC表资料的表资料的x2检验检验*第四节:分层卡方检验第四节:分层卡方检验第五节:多第五节:多个样本率间的多重比较个样本率间的多重比较 课程小结课程小结 交叉表交叉表(Crosstabs)过程(一)四格表(fourfold data)资料的x2检验(二)配对(paired data)资料的x2检验(三)RC表资料的x2检验(四)两分类变量有无关联分

2、析及列联系数C 卡方卡方(Chi-Square)过程(五)拟合问题-比较样本与已知总体的分布第一节第一节 四格表资料的四格表资料的 检验检验 x2 test of fourfold data 2目的:目的:推断两个总体率(构成比)是否有差推断两个总体率(构成比)是否有差 别别要求要求:两样本的两分类个体数排列成四格表两样本的两分类个体数排列成四格表 资料资料一一、2 检验的基本检验的基本思想思想是是一种用途较广的一种用途较广的计数资料计数资料的假设检验的假设检验方法,属于方法,属于非参数检验非参数检验的的范畴。范畴。根本思想:根本思想:在于在于比较理论频数和实际频数比较理论频数和实际频数的吻合

3、程度或拟合优度问题。的吻合程度或拟合优度问题。x2检验:以检验:以x2分布为方法的理论基础分布为方法的理论基础 2 检验的基本公式检验的基本公式A为实际频数(为实际频数(actual frequency),),T为理论频数(为理论频数(theoretical frequency)nR是行和,是行和,nC是列和,是列和,n是四格数之和是四格数之和 2表示观察值与期望值之间的偏离程度。表示观察值与期望值之间的偏离程度。1900年由英国统计学家年由英国统计学家Karl Pearson首次提出,故被称为首次提出,故被称为Pearson 2。8 检验基本步骤检验基本步骤1.建立检验假设 H0:两总体龋患

4、率相等 H1:两总体龋患率不等 计算理论频数2.计算 x2 统计量3.确定P值,作出推论 四格表 检验的条件:1)2)3)2公式;用不校正的且2,540Tn公式;用校正的个格子且至少2,51140Tn需用确切概率法或,140TnTTA22)5.0()()()()2/(22dbcadcbanncbad校正公式:校正公式:SPSS操作过程 建立数据文件:例1.sav数据格式:包括4行3列的频数格式,3个变量即行变量(group)、列变量(effect)和频数变量(freq)。说明频数变量:数据 加权个案 Data Weight Cases x2检验:从菜单选择 分析 描述统计 交叉表 Analyz

5、e Descriptive Statistics Crosstabs 结合例1数据演示操作过程。首先建立数据文件,如下。首先建立数据文件,如下。注意:由于上表给出的不是原始数据,而是频数表数据,注意:由于上表给出的不是原始数据,而是频数表数据,应该进行预处理。应该进行预处理。*指定加权变量指定加权变量(weight cases)在在实际的统计中,经常需要计算数据的加权平均数实际的统计中,经常需要计算数据的加权平均数。例如,希望了解不用牙膏使用者的平均患龋量。例如,希望了解不用牙膏使用者的平均患龋量。如果如果仅以仅以各种牙膏的患龋量的平均数作为平均患各种牙膏的患龋量的平均数作为平均患龋量是龋量是

6、不合理不合理的的还还应考虑到应考虑到各牙膏使用者的患龋量对平均患龋量各牙膏使用者的患龋量对平均患龋量的的影响影响。因此因此,以各牙膏使用者的患龋量作为以各牙膏使用者的患龋量作为权重计算权重计算各各牙膏患龋率的牙膏患龋率的加权平均数,才是我们需要求的数加权平均数,才是我们需要求的数据据。在在SPSSSPSS处理中就需要处理中就需要将各牙膏的患龋量作为将各牙膏的患龋量作为加权变加权变量。量。不设置权重不设置权重设置权重设置权重频数变量频数变量交叉表(Crosstabs)过程 Crosstabs过程用于对分类资料和有序分类资料进行和。统计描述过程可以产生2维至n 维列联表,并计算相应的百分数指标。统

7、计推断包括了常用的x2检验、Kappa值,分层X2(X2M-H),以及四格表资料的确切概率(Fishers Exact Test)值。行变量行变量列变量列变量计算统计量计算统计量单元格单元格卡方统计量卡方统计量Kappa系数系数风险度风险度配对四格表配对四格表McNemar检验检验实际频数实际频数理论频数理论频数Crosstabs过程详解界面说明界面说明-行Rows框用于选择行列表中的行变量。-列Columns框用于选择行列表中的列变量。-层Layer框指定分层变量,即控制变量。如果要指定不同的分层变量做分析,则将其选入Layer框,并用Previous和Next钮设为不同层。-Display

8、 clustered bar charts 复选框:显示复式条图-Suppress table复选框:不在输出结果中给出行列表。Crosstabs过程详解 界面说明界面说明精确(Exact)子对话框:针对22以上的行列表设计计算确切概率的方法。统计量(Statistics)子对话框:用于定义所需计算的统计量-Chi-square 复选框:计算pearson卡方值,对四格表资料自动给出校正卡方检验和确切概率法结果。-Correlations复选框:计算行列变量的pearson相关系数和Spearman等级相关系数。Crosstabs过程详解 界面说明界面说明-Kappa复选框:计算Kappa值,

9、即内部一致性系数,介于00.7071之间;-Risk复选框:计算比数比OR值、RR值;-McNemanr复选框:进行配对卡方检验的McNemanr检验(一种非参数检验)-Cochrans and Mantel-Haenszel statistics复选框:计算X2M-H统计量、X2CMH,可在下方输出H0假设的OR值,默认为1。Crosstabs过程详解 界面说明界面说明单元格(Cells)子对话框:用于定义列联表单元格中需要计算的指标。-Counts复选框:是否输出实际观察数(Observed)和理论频数(Expected)-Percentages复选框:是否输出行百分数(Row)、列百分数

10、(Column)以及合计百分数(Total)-Residuals复选框:选择残差的显示方式格式(Format)子对话框:用于选择行变量是升序还是降序排列。v 表示含氟牙膏与一般牙膏患龋率的比较,表示含氟牙膏与一般牙膏患龋率的比较,除了观察值以外,除了观察值以外,还有期望值。还有期望值。实际频数实际频数理论频数理论频数v结论:结论:2 22.82.82 2,P P0.0930.093,按按 =0.05=0.05水准,不拒绝水准,不拒绝H0H0,尚,尚不能认为使用含氟牙膏比使用一般牙膏儿童的龋患率低。不能认为使用含氟牙膏比使用一般牙膏儿童的龋患率低。卡方卡方值值自由度自由度P值值双侧确切概率值双侧

11、确切概率值单侧确切概率值单侧确切概率值注意检查样本例数注意检查样本例数n和理论频数和理论频数T是否满足条件是否满足条件:N40且理论频数且理论频数T5。将将116例癫痫患者随机分为两组,一组例癫痫患者随机分为两组,一组70例接受常规加高压氧治疗(高压氧组),例接受常规加高压氧治疗(高压氧组),另一组另一组46例接受常规治疗(常规组例接受常规治疗(常规组),结果如下。),结果如下。问两种疗法的有效率有无差别?问两种疗法的有效率有无差别?10.005.0 P05.00H24.080.05P,(一)适用条件(一)适用条件 T1或 n40 P(二)基本思想(超几何分布)(二)基本思想(超几何分布)!)

12、!()!()!()!(ndcbadbcadcbaPi在四格表周边合计不变的条件下,直接计算表内四个数据的各种组合之概率。找出 的所有表格并将概率求和,若这些表的合计P Kappa 0.4时,表明一致性一般;时,表明一致性一般;Kappa 0.4时,表明两者一致性较差。时,表明两者一致性较差。一致性检验一致性检验P值值Kappa系数系数=0.1980.05,说明两种方法的吻合说明两种方法的吻合度度没有没有统计学意义统计学意义,且吻合度较差。,且吻合度较差。52*例例5 用A、B两种方法检查已确诊的乳腺癌患者140名,A法检出91名(65%),B法检出77名(55%),A、B两法一致的检出56名(

13、40%),问哪种方法阳性检出率更高?u计数资料的配对设计常用于的比较u特点:第三节第三节 行行列表资料的列表资料的 检验检验 test of RC table2 比较比较某市重污染区、一般市区和农村三个某市重污染区、一般市区和农村三个地区的出生婴儿的致畸率地区的出生婴儿的致畸率。以母乳、牛乳、混合三种不同方式喂养的以母乳、牛乳、混合三种不同方式喂养的新生儿体重增长的构成是否新生儿体重增长的构成是否一致一致。推断推断2个分类变量是否有关联,如:研究冠个分类变量是否有关联,如:研究冠心病与眼底动脉硬化的关系。心病与眼底动脉硬化的关系。行行列表资料列表资料 多个样本率比较时,有R行2列,称R 2表;

14、两样本的构成比比较时,有2行C列,称2C表;多个样本的构成比比较,以及双向无序分类资料关联性检验时,有行列,称R C表。检验统计量检验统计量22(1)(1)(1)RCAnn n行数列数3.1 多多个样本率的比较个样本率的比较 例6 用A、B、C三种不同方法分别处理新生儿脐带,发生感染的情况见下表,试比较3种不同方法的脐带感染率有无差异。三种脐带处理方法的脐带感染情况 脐带感染 处理组 感染 未感染 合计 感染率(%)A 76 3143 3219 2.36 B 15 2409 2424 0.62 C 2 762 764 0.26 合计 93 6314 6407 1.45 SPSS操作过程(行列表

15、卡方检验)建立数据文件:例6.sav数据格式:包括6行3列的频数格式,3个变量分别为行变量、列变量和频数变量。说明频数变量:数据 加权个案 Data Weight Cases x2检验:从菜单选择 分析 描述统计 交叉表 Analyze Descriptive Statistics Crosstabs 结合例6数据(例6.sav)演示操作及界面。结论:按结论:按=0.05检验水准拒绝检验水准拒绝H0,接受,接受H1,可以认为三,可以认为三种处理种处理脐带感染率有脐带感染率有差别。差别。3.2 两组构成比的比较 例7 为研究某种新药对尿路疼痛的止痛效果,将有尿路疼痛的患者144例随机分为两组,每

16、组72例,一组服该新药(治疗组),另一组服安慰剂(对照组)。两组患者尿路疼痛的原因见下表,问两组患者尿路疼痛原因的分布有无差异?两组患者尿路疼痛原因的分布 尿路疼痛原因 分 组 尿路感染 器械损伤 其它 合计 治疗组 34 29 9 72 对照组 29 35 8 72 合 计 63 64 17 144 2.求检验统计量和自由度。将表 9-7 数据代入公式 9-14,有 22222234299293582144(1)1.027263726472 177263726472 17(21)(31)2 3.确定 P 值,下结论。查2界值表,20.5,21.39,20.5,21.018,所以,P0.50,

17、以0.05水准不拒绝 H0,即尚不能认为两组患者尿路疼痛原因的分布有差异。结论:按结论:按=0.05检验检验水准不拒绝水准不拒绝H0,尚,尚不可认为两组患者尿路疼痛原因的分布不可认为两组患者尿路疼痛原因的分布有有差异。差异。3.4 多组构成比的比较例例8 在某项疼痛测量研究中,给在某项疼痛测量研究中,给160例手术后疼痛的患者提例手术后疼痛的患者提供四种疼痛测量量表,即直观模拟量表(供四种疼痛测量量表,即直观模拟量表(VAS),数字评估),数字评估量表(量表(NRS),词语描述量表(),词语描述量表(VDS),面部表情疼痛量表),面部表情疼痛量表(FPS),患者首选的量表以及患者的文化程度患者

18、首选的量表以及患者的文化程度见下表,见下表,问患问患者首选疼痛量表与文化程度是否有关者首选疼痛量表与文化程度是否有关?不同文化程度患者首选疼痛量表的类型 首选测痛量表 文化程度 V AS VDS NRS FPS 合计 高中以下 3(3.5)16(18.7)18(19.7)44(39.0)81 高中 0(1.6)10(8.6)9(9.0)18(17.8)37 高中以上 4(1.8)11(9.7)12(10.2)15(20.2)42 合计 7 37 39 77 160 结论:按结论:按=0.05检验检验水准不拒绝水准不拒绝H0,尚不能认为术后疼痛患者首选测痛量表类,尚不能认为术后疼痛患者首选测痛量

19、表类型与文化程度有关型与文化程度有关。3.5 双向无序分类资料的关联性检验 表中两个分类变量皆为无序分类变量的行 列表资料,又称为双向无序 表资料。注意:双向无序分类资料为两个或多个样本,做差别检验(例7);若为单样本,做关联性检验(例9)。CRCR例 9 测得某地5801人的ABO血型和MN血型结果如下表,问两种血型系统之间是否有关联?MN 血型 ABO血型 M N MN 合计 O 431 490 902 1823 A 388 410 800 1598 B 495 587 950 2032 AB 137 179 32 348 合计 1451 1666 2684 5801 (单样本,做关联性检

20、验)(单样本,做关联性检验)上表资料,可用行列表资料 检验来推断两个分类变量之间有无关系(或关联);若有关系,可计算Pearson列联系数C进一步分析关系的密切程度:22Cn 列联系数C取值范围在00.7071之间。0表示完全独立;0.7071表示完全相关。2检验步骤0H:两种血型系统间无关联 1H:两种血型系统间有关联 05.0 2222431490325801(1)1823 14511823 1666348 2684 213.16(4 1)(3 1)622213.160.18835801213.16Cn由于列联系数C=0.1883,数值较小,故认为两种血型系统间虽然有关联性,但关系不太密切

21、。SPSS操作过程 建立数据文件:例9.sav数据格式:包括12行3列的频数格式,三个变量分别为行变量、列变量和频数变量。说明频数变量:数据 加权个案 Data Weight Cases x2检验:从菜单选择 分析 描述统计 交叉表 Analyze Descriptive Statistics Crosstabs 统计量Statistics:Chi-square 名义 相依系数Contingency coefficientSPSS输出结果ABO*MN 交叉制表ABO*MN 交叉制表4314909021823456.0523.6843.51823.03884108001598399.7458.9

22、739.41598.04955879502032508.3583.6940.22032.01371793234887.099.9161.0348.014511666268458011451.01666.02684.05801.0计数期望的计数计数期望的计数计数期望的计数计数期望的计数计数期望的计数oABABABO合计MNMNMN合计卡方检验卡方检验213.162a6.000248.1436.00051.3361.0005801Pearson 卡方似然比线性和线性组合有效案例中的 N值df渐进 Sig.(双侧)0 单元格(.0%)的期望计数少于 5。最小期望计数为 87.04。a.对称度量对称度

23、量.188.0005801相依系数按标量标定有效案例中的 N值近似值 Sig.不假定零假设。a.使用渐进标准误差假定零假设。b.结论:按结论:按=0.05检验检验水准拒绝水准拒绝H0,接受,接受H1,可认为两种血型系统间有关联,但由于列,可认为两种血型系统间有关联,但由于列联系数联系数C=0.1883,数值较小,故认为两种血型系统间虽然有关联性,但关系不太密切。,数值较小,故认为两种血型系统间虽然有关联性,但关系不太密切。1行列表中的各格T1,并且1T5的格子数不宜超过1/5格子总数,否则可能产生偏性。处理方法有三种:增大样本含量以达到增大理论频数的目的(首选)。根据专业知识,删去理论频数太小

24、的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列合并。这样做会损失信息及损害样本的随机性。例如例如:不同年龄组可以合并,但不同血型就不能合并。改用双向无序RC表的Fisher确切概率法。2例例 10.某实验室为研究乙肝免疫球蛋白预防小白鼠胎儿宫内某实验室为研究乙肝免疫球蛋白预防小白鼠胎儿宫内感染感染HBV的效果,将的效果,将33例例HBsAg阳性小白鼠(孕鼠)随机分阳性小白鼠(孕鼠)随机分为预防注射组和非预防组,结果见下表。问两组新生小白鼠为预防注射组和非预防组,结果见下表。问两组新生小白鼠的的HBV总体感染率有无差别?总体感染率有无差别?组别组别阳性阳性阴性阴性合计合计感染率感染率(

25、%)预防注射组预防注射组4182218.18 非预防组非预防组5 61145.45 合计合计9243327.27第四节分层资料的卡方检验Tests of Conditional Independence 例 11.Doll和Hill以709例肺癌患者做病例,709个非肿瘤患者做对照,按性别分层,研究吸烟与肺癌的关系,调查结果如下,试做肺癌的病例对照分析。Weight cases关于OR值与RR值相对危险度相对危险度RRRR:是一个概率的比值,指试验组人群反应阳性概率:是一个概率的比值,指试验组人群反应阳性概率与对照组人群反应阳性概率的比值。数值为与对照组人群反应阳性概率的比值。数值为1 1,表

26、明试验因素与,表明试验因素与反应阳性无关联;小于反应阳性无关联;小于1 1时,表明试验因素导致反应阳性的发生时,表明试验因素导致反应阳性的发生率降低;大于率降低;大于1 1时,表明试验因素导致反应阳性的发生率增加。时,表明试验因素导致反应阳性的发生率增加。优势比优势比OROR:是一个比值的比,是反应阳性人群中试验因素有无的:是一个比值的比,是反应阳性人群中试验因素有无的比例与反应阴性人群中试验因素有无的比例之比例与反应阴性人群中试验因素有无的比例之比。暴露者的疾病比。暴露者的疾病危险度为非暴露者的多少倍。危险度为非暴露者的多少倍。OR1OR1说明疾病的危险度因暴露而增说明疾病的危险度因暴露而增

27、加,暴露与疾病为加,暴露与疾病为“正正”关联;关联;OR1OR1说明疾病的危险度因暴露而说明疾病的危险度因暴露而减少,减少,“负负”关联关联。当关注的事件发生概率比较小时(当关注的事件发生概率比较小时(0.10.1),优势比可作为相对危),优势比可作为相对危险度的近似。险度的近似。第五节多个样本率间的多重比较Multiple comparison of sample rates一、基本思想(卡方分割法)多个样本率比较的资料若经行列表2检验的结论为拒绝0H,接受1H时,可采用卡方分割法把表格分成多个独立的四格表后再进行两两比较。但必须重新规定检验水准,其目的是为保证检验假设中 I 型错误的概率不

28、变。因分析目的不同,k个样本率两两比较的次数不同,故重新规定的检验水准的估计方法亦不同。通常有两种情况:1多个实验组间的两两比较 分析目的为 k 个实验组间,任两个率均进行比较时,须进行2k次独立的四格表2检验,再加上总的行列表资料的2检验,共12 k次检验假设。故检验水准用下式估计 12=k+式中2)1()!2(!2!2kkkkk,k为样本率的个数。2实验组与同一个对照组的比较 分析目的为各实验组与同一个对照组的比较,而各实验组间不须比较。其检验水准 用下式估计 2(1)k式中k为样本率的个数。由该式估计的检验水准较保守(通常较小)。疗法 有效 无效 合计 有效率(%)物理疗法组 199 7

29、 206 96.60 药物治疗组 164 18 182 90.11 外用膏药组 118 26 144 81.94 合计 481 51 532 90.41 例12 某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见下表。问三种疗法的有效率有无差别?检验步骤0H:21,即任两对比组的总体有效率相等 1H:21,即任两对比组的总体有效率不等 05.0 本例为3个实验组间的两两比较 0.050.05/40.01253(3 1)/2 1三种疗法有效率的两两比较 例 11(2)以例11资料中的药物治疗组为对照组,物理疗法组与外用膏药组为试验组,试分析两试验组与对照组的总体有效

30、率有无差别?0H:CT,即各试验组与对照组的总体有效率相等 1H:CT,即各试验组与对照组的总体有效率不等 05.0 本例为各实验组与同一对照组的比较本例为各实验组与同一对照组的比较0125.0)13(205.0物理疗法组与药物治疗组比较:76.62,0125.0P 外用膏药组与药物治疗组比较:59.42,0125.0P SPSS进行两两比较 结果同前,但因为会损失很多信息,一般不提倡采用此方法 1、研究目的:率、研究目的:率 or 构成比的假设检验(大样本率或构成比的假设检验(大样本率或 小样本率)小样本率)2、资料类型:计数资料、资料类型:计数资料 3、基本思想:、基本思想:根本思想就是在

31、于比较理论频数和实际频数的根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。吻合程度或拟合优度问题。4、应用条件、应用条件 检验两个样本率之间差别的显著性;检验多个样本率或构成比之间差别的显著性;检验两个双向无序分类变量是否存在关联;配对计数资料的比较。(五)比较样本与已知总体的分布Chi-square test 过程 目的:目的:用于检验某分类变量的各部分所占百分比与已知的期望百分比用于检验某分类变量的各部分所占百分比与已知的期望百分比是否相同,从而推断该样本与已知总体的分布是否相同。是否相同,从而推断该样本与已知总体的分布是否相同。SPSS操作:操作:分析分析非参数检验非参数检验 卡方(卡方(chi-square)实例分析 SPSS自带文件Eployee data.sav 考察员工职务类别(jobcat)变量所在总体的构成比是否和已知总体的构成比相同?练习题:用药治疗情况有效无效合计甲241741乙203555合计4452961)如果希望分析甲乙两药对疾病治疗情况有无差别,应当选择什么分析方法,为什么?2)可以用到SPSS的什么过程实现?请给出具体的P值和分析结论。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(卡方检验及SPSS分析课件.pptx)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|