1、l 用来比较两样本所来自的总体均数或总体分布是用来比较两样本所来自的总体均数或总体分布是否相同。否相同。l 当两样本均来自正态总体且方差齐性时,首选当两样本均来自正态总体且方差齐性时,首选t 检验,可以证明,用检验,可以证明,用 t 检验比较两样本的总体均检验比较两样本的总体均数是否相同的检验功效是最高的;数是否相同的检验功效是最高的;l 当两样本均来自正态总体但方差不齐时,可采用当两样本均来自正态总体但方差不齐时,可采用校正的校正的 t 检验。检验。l 当两样本并非来自正态总体或总体分布不详时,当两样本并非来自正态总体或总体分布不详时,可采用秩和检验可采用秩和检验(rank sum test
2、)。例例6-1 为研究某种新药治疗贫血患者的疗效,将为研究某种新药治疗贫血患者的疗效,将20名贫名贫血患者随机分成两组,一组用新药治疗,另一组用常规药血患者随机分成两组,一组用新药治疗,另一组用常规药物治疗,测得血红蛋白增加量(物治疗,测得血红蛋白增加量(g/L)见表)见表6-1。问新药与。问新药与常规药治疗贫血患者后的血红蛋白平均增加量有无差别?常规药治疗贫血患者后的血红蛋白平均增加量有无差别?解析解析 该例目的在于比较用新药治疗的人群和用该例目的在于比较用新药治疗的人群和用常规药治疗的人群的血红蛋白平均增加量常规药治疗的人群的血红蛋白平均增加量(g/L)有无差异,其实质就是比较两个总体均数
3、是否相有无差异,其实质就是比较两个总体均数是否相同,即同,即 是否成立。是否成立。在研究设计上,该例属于在研究设计上,该例属于完全随机设计完全随机设计的两组独的两组独立样本。立样本。21l 从两个人群分别随机抽取一定数量的观察资料构从两个人群分别随机抽取一定数量的观察资料构成样本,测量某项指标后进行组间比较,属于成样本,测量某项指标后进行组间比较,属于平平行对照设计(成组设计)行对照设计(成组设计)。l 为了研究新生儿窒息患者与正常新生儿血浆中为了研究新生儿窒息患者与正常新生儿血浆中SOD平均含平均含量有无差异,某研究者收集了量有无差异,某研究者收集了10名正常新生儿和名正常新生儿和10名新生
4、名新生儿窒息患者的血浆,测得儿窒息患者的血浆,测得SOD含量(含量(Nu/mg),请问新生),请问新生儿窒息患者和正常新生儿血浆中儿窒息患者和正常新生儿血浆中SOD平均含量有无差异?平均含量有无差异?(1)建立检验假设,确定检验水准建立检验假设,确定检验水准 :新药和常规药治疗贫血患者后血红蛋白平均:新药和常规药治疗贫血患者后血红蛋白平均增加量相同,即增加量相同,即 :新药和常规药治疗贫血患者后血红蛋白平均:新药和常规药治疗贫血患者后血红蛋白平均增加量不同,即增加量不同,即(2)计算检验统计量)计算检验统计量0H1H)11(21221nnSXXtc211212221212nnnSnSSc)()
5、(当当 为真时为真时,两个样本所属的总体均数相等,两个样本所属的总体均数相等,即即 ,此时两个样本资料来自相同的总体,此时两个样本资料来自相同的总体,两个样本均数都是该总体均数的点估计值,样本两个样本均数都是该总体均数的点估计值,样本均数与总体均数的差是样本均数的抽样误差,故均数与总体均数的差是样本均数的抽样误差,故两个样本均数均随机地出现在两个样本均数均随机地出现在 附近,附近,仅是样本均数的抽样误差,这时相应的成组仅是样本均数的抽样误差,这时相应的成组 t 检检验统计量验统计量 一般也很小或比较小;一般也很小或比较小;0H121212XXt 当当 非真时,两个样本的总体均数不相等,即,非真
6、时,两个样本的总体均数不相等,即,,两个样本均数分别为两个总体均数的点两个样本均数分别为两个总体均数的点估计值,它们均随机地出现在各自的总体均数附估计值,它们均随机地出现在各自的总体均数附近,由于两个总体均数不等,故此时两个样本均近,由于两个总体均数不等,故此时两个样本均数差异相对较大,其相应的成组数差异相对较大,其相应的成组 t 检验统计量检验统计量 一般会较大或很大。一般会较大或很大。0H12t137.4)11(21221nnSXXtc(3)查)查t界值表,得界值表,得P50),样本均数近似地服从正态),样本均数近似地服从正态分布,故满足成组检验关于正态分布的要求;分布,故满足成组检验关于
7、正态分布的要求;但当样本例数较小时,需要对每组资料进行正态性检验。但当样本例数较小时,需要对每组资料进行正态性检验。常用的正态性检验方法是常用的正态性检验方法是矩法矩法检验和检验和w检验检验(Shapiro-Wilk W test),矩法检验比较保守,矩法检验比较保守,w检验比较灵敏。此外,还检验比较灵敏。此外,还有有K-S检验(检验(Kolmogorov-Smirnov test)和)和D检验(检验(D test)等。等。正态性检验的无效假设为资料服从正态分布,备择假设为正态性检验的无效假设为资料服从正态分布,备择假设为资料不服从正态分布资料不服从正态分布。例例6-3 某医师为研究血铁蛋白与
8、肺炎的关系,随某医师为研究血铁蛋白与肺炎的关系,随机抽查了肺炎患者和正常人若干名,并测得血铁机抽查了肺炎患者和正常人若干名,并测得血铁蛋白(蛋白(g/L)含量,问肺炎患者与正常人平均血)含量,问肺炎患者与正常人平均血铁蛋白含量有无差别?铁蛋白含量有无差别?肺炎患者肺炎患者 31 68 237 174 457 492 199 515 599 238 正常人正常人 177 172 34 47 132 54 47 52 47 294 68 43 277 44 43 95正常人组正常人组 正态性的W检验结果P=0.010 在统计推断方法中,凡是在已知总体分布的前提下在统计推断方法中,凡是在已知总体分布
9、的前提下对总体参数进行估计或检验的方法,称为对总体参数进行估计或检验的方法,称为参数统计参数统计(parametric statistics)。但在实际工作中,有时总体的分布不易确定,或分但在实际工作中,有时总体的分布不易确定,或分布不符合要求的条件,则需要应用一种不依赖于总布不符合要求的条件,则需要应用一种不依赖于总体分布类型的统计推断方法,称为非参数统计体分布类型的统计推断方法,称为非参数统计(nonparametric statistics)。)。Wilcoxon秩和检验属秩和检验属于非参数检验中的一种,可以用于完全随机化设计于非参数检验中的一种,可以用于完全随机化设计两组独立样本的比较
10、。两组独立样本的比较。在不知总体分布的情况下如何利用数据所包含的在不知总体分布的情况下如何利用数据所包含的信息呢?一组数据的最基本信息是次序,将数值信息呢?一组数据的最基本信息是次序,将数值按大小次序排队,每个数值在整个数据中均有相按大小次序排队,每个数值在整个数据中均有相应的位置和次序,称为该数据的秩(应的位置和次序,称为该数据的秩(rank)。)。在一定的假设下,这些秩及其统计量的分布是可在一定的假设下,这些秩及其统计量的分布是可以求出来的,且与原来的总体分布无关,可进行以求出来的,且与原来的总体分布无关,可进行所需要的统计推断。所需要的统计推断。(1)建立检验假设建立检验假设 :肺炎患者
11、与正常人的血铁蛋白总体分布相同:肺炎患者与正常人的血铁蛋白总体分布相同 :肺炎患者与正常人的血铁蛋白总体分布不同:肺炎患者与正常人的血铁蛋白总体分布不同 =0.05(2)计算检验统计量计算检验统计量T值值编秩将两组数据合起来由小到大统一编秩,即从小到大编号,最小的编秩将两组数据合起来由小到大统一编秩,即从小到大编号,最小的数据的秩为数据的秩为1,第二小的,第二小的数据的秩为数据的秩为2,依此类推。编秩时如遇有相同数据,且相同数据在不,依此类推。编秩时如遇有相同数据,且相同数据在不同组时,要取其平均秩次同组时,要取其平均秩次(3)确定确定P值,作出统计推断结论值,作出统计推断结论 0H1H 查表
12、法查表法 T界值表(两样本比较的秩和检验用),先从左侧找到较界值表(两样本比较的秩和检验用),先从左侧找到较小的样本量,本例较小的样本量为小的样本量,本例较小的样本量为n1=10;再从表上方找;再从表上方找两组例数的差,本例,两组例数的差,本例,n2-n1=6;在两者纵横交叉处即为;在两者纵横交叉处即为T的界值。的界值。将检验统计量将检验统计量T1值与值与T界值相比,若界值相比,若T值位于界值范围内,值位于界值范围内,其其P值大于相应的概率;若值大于相应的概率;若T值等于界值或在界值范围外,值等于界值或在界值范围外,其其P值等于或小于相应的概率。值等于或小于相应的概率。正态近似法正态近似法 1
13、2/)1(5.02/)1(211NnnNnTZ tj为第为第j(j=1,2)个相持所含的个体数个相持所含的个体数 cZZc/)/()(133NNttcjj 秩次在一定程度上反映了等级的高低;秩次在一定程度上反映了等级的高低;秩和在一定程度上反映了等级的分布位置,这样,对观察秩和在一定程度上反映了等级的分布位置,这样,对观察值的分析就转化为对秩次的分析。值的分析就转化为对秩次的分析。当当H0为真时,两个样本来自相同的总体,对于样本量为为真时,两个样本来自相同的总体,对于样本量为n1和和n2而言,每个数据的秩均有相同的机会取值为而言,每个数据的秩均有相同的机会取值为1,2,n1n2,因此每个数据的
14、秩次期望值为(,因此每个数据的秩次期望值为(n1+n2+1)/2。第。第一组的一组的n1个数据的秩和个数据的秩和T1应随机地出现在其期望值应随机地出现在其期望值 n1(n1+n2+1)/2 附近。附近。H0为真时,第一组的秩和为真时,第一组的秩和T1在其期望值在其期望值n1(n1+n2+1)/2处呈对称分布,并且当样本量较大处呈对称分布,并且当样本量较大时,统计量秩和时,统计量秩和T1近似服从均数为近似服从均数为n1(n1+n2+1)/2,方差为方差为n1n2(n1+n2+1)/12的正态分布;的正态分布;H0非真时,在大多数情况下统计量秩和非真时,在大多数情况下统计量秩和T1将远离将远离其期
15、望值,利用秩和其期望值,利用秩和T1借助借助Wilcoxon秩和检验的秩和检验的临界值表或近似正态分布的检验统计量实现假设临界值表或近似正态分布的检验统计量实现假设检验检验 配对设计是将受试对象按一定条件配成对子(同配对设计是将受试对象按一定条件配成对子(同种属、同体重、同年龄、同性别等),再随机分种属、同体重、同年龄、同性别等),再随机分配每对中的两个受试对象到不同的处理组。配每对中的两个受试对象到不同的处理组。其实施的主要形式有:其实施的主要形式有:将受试对象按一定条件将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到配成对子,再随机分配每对中的两个受试对象到不同的处理组;不同
16、的处理组;同一受试对象分别接受两种不同一受试对象分别接受两种不同处理,其目的是推断两种处理的效果有无差别。同处理,其目的是推断两种处理的效果有无差别。例例6-4 为研究某种抗癌新药对小白鼠移植性肉瘤为研究某种抗癌新药对小白鼠移植性肉瘤S180的抑的抑瘤效果,将瘤效果,将20只小白鼠按性别、体重、窝别配成对子。每只小白鼠按性别、体重、窝别配成对子。每对中随机抽取一只服用抗癌新药扶正消瘤汤,另一只作为对中随机抽取一只服用抗癌新药扶正消瘤汤,另一只作为阴性对照,服用生理盐水,观察其对小白鼠移植性肉瘤阴性对照,服用生理盐水,观察其对小白鼠移植性肉瘤S180的抑瘤效果,经过一定时间,测得小白鼠瘤重如表的
17、抑瘤效果,经过一定时间,测得小白鼠瘤重如表6-3所示。问小白鼠服用抗癌新药和生理盐水后平均瘤重有所示。问小白鼠服用抗癌新药和生理盐水后平均瘤重有无不同?无不同?对子内部相减之后,得到的差值资料实际上是一对子内部相减之后,得到的差值资料实际上是一个样本,因此配对设计资料的假设检验类似于单个样本,因此配对设计资料的假设检验类似于单样本检验,即检验差值的均数或中位数是否等于样本检验,即检验差值的均数或中位数是否等于零。零。对于配对设计定量资料的统计分析,若差值服从对于配对设计定量资料的统计分析,若差值服从正态分布,可采用配对正态分布,可采用配对 t 检验(检验(paired t test););否则
18、,采用配对资料的符号秩和检验(否则,采用配对资料的符号秩和检验(signed rank sum test)。)。首先计算出各对差值首先计算出各对差值d的均数的均数 ,当两种处理平,当两种处理平均效应是相同的,则差值来自的总体均数均效应是相同的,则差值来自的总体均数 应该应该为为0,故可将配对设计资料的,故可将配对设计资料的 t检验视为样本均数检验视为样本均数 所来自的未知总体均数与已知总体均数所来自的未知总体均数与已知总体均数 0的比较。的比较。小样本资料小样本资料:ddddddtsn1 nv(3)确定确定P值,作出统计推断结论值,作出统计推断结论 查查t界值表,得界值表,得P0.20,在,在
19、=0.05水平上不能拒绝水平上不能拒绝H0。所以。所以尚不能认为两法测定结果不同。尚不能认为两法测定结果不同。771.012/01497.000033.0/0nSdtd 例例6-5 留取留取15名在医用仪表厂工作的工人尿液,名在医用仪表厂工作的工人尿液,分成两份,一份用离子交换法,另一份用蒸馏法分成两份,一份用离子交换法,另一份用蒸馏法测得尿汞值如下,问两种方法测得尿汞平均含量测得尿汞值如下,问两种方法测得尿汞平均含量有无差别?有无差别?解析解析 本研究属于配对设计的定量资料,首先判断本研究属于配对设计的定量资料,首先判断是否符合配对设计是否符合配对设计t检验的检验的适用条件适用条件,即差值是
20、否,即差值是否来自正态分布。通过对差值进行正态性检验,发来自正态分布。通过对差值进行正态性检验,发现差值不是来自正态总体现差值不是来自正态总体(W检验:检验:P=0.010),所,所以用配对资料的符号秩和检验(以用配对资料的符号秩和检验(Wilcoxon matched-samples signed rank sum test)进行统计)进行统计分析分析。如果两种检测方法的平均效应相同,这些配对数值之差应如果两种检测方法的平均效应相同,这些配对数值之差应服从于以服从于以0为中心的对称分布,也就相当于把这些差值按为中心的对称分布,也就相当于把这些差值按其绝对值大小编秩并标上原来的符号后,正秩和与
21、负秩和其绝对值大小编秩并标上原来的符号后,正秩和与负秩和在理论上应是相等的(都等于在理论上应是相等的(都等于n(n+1)/4,n为有效对为有效对子数),对于样本的正秩和与负秩和之间的差异是一些随子数),对于样本的正秩和与负秩和之间的差异是一些随机因素造成的抽样误差、这些差异一般不会太大。如果差机因素造成的抽样误差、这些差异一般不会太大。如果差别太大,超出了规定的范围,就拒绝别太大,超出了规定的范围,就拒绝H0,接受,接受H1,认为,认为差值的总体中位数不等于差值的总体中位数不等于0。(1)建立假设,确定检验水准建立假设,确定检验水准H0:两种方法测得的尿汞含量差值的总体中位数为零,即:两种方法
22、测得的尿汞含量差值的总体中位数为零,即 =0H1:两种方法测得的尿汞含量差值的总体中位数不等于零,即:两种方法测得的尿汞含量差值的总体中位数不等于零,即 0 =0.05(2)计算检验统计量计算检验统计量T值值求差值求差值 见表见表6-5的第(的第(4)列。)列。编秩编秩 将差值按绝对值大小从小到大编秩,并按差值的正负给秩次加上将差值按绝对值大小从小到大编秩,并按差值的正负给秩次加上正负号。若差值的绝对值相等,则取其平均秩次,编秩时如遇差值为正负号。若差值的绝对值相等,则取其平均秩次,编秩时如遇差值为0,则舍去不计。则舍去不计。求秩和求秩和 分别求出正、负秩次之和,正秩和以分别求出正、负秩次之和
23、,正秩和以T+表示,负秩和以表示,负秩和以T-表示,表示,取两者中较小的秩和为统计量取两者中较小的秩和为统计量T dMdM(3)确定)确定P值,作出统计学结论值,作出统计学结论 查表法查表法 查查T界值表(配对比较的符号秩和检验界值表(配对比较的符号秩和检验用),若检验统计量用),若检验统计量T值在上、下界值范围内,值在上、下界值范围内,其其P值大于表上方相应概率水平;若值大于表上方相应概率水平;若T值在上、下值在上、下界值上或范围外,则界值上或范围外,则P值等于或小于相应的概率值等于或小于相应的概率水平。水平。正态近似法正态近似法 若若n25,超出,超出T界值表的范围,可界值表的范围,可用正
24、态近似法作检验。若用正态近似法作检验。若H0为真,则秩和检验统为真,则秩和检验统计量计量T近似服从。近似服从。48)(24)12)(1(5.04/)1(3jjcttnnnnnTZ相持较多时(不包括差值为0者)医学研究中常涉及到对两个医学研究中常涉及到对两个Poisson分布总体均分布总体均数的比较,当每个样本的观察值之和都大于数的比较,当每个样本的观察值之和都大于20时,时,Poisson分布近似正态分布,可考虑应用分布近似正态分布,可考虑应用Z检验检验对其总体均数进行推断。对其总体均数进行推断。例例6-6 两种培养液配方各在两种培养液配方各在3个平皿中制成固体培养基,个平皿中制成固体培养基,
25、各放入各放入1 ml含幽门螺杆菌充分混匀的胃液。培养含幽门螺杆菌充分混匀的胃液。培养72小时后小时后清点幽门螺杆菌菌落数如下,问两种培养基菌落数差别有清点幽门螺杆菌菌落数如下,问两种培养基菌落数差别有无统计学意义?无统计学意义?甲甲 14,21,16 乙乙 12,10,8 当两个当两个Poisson分布的参数相等时,统计量分布的参数相等时,统计量 近似服从标准正态分布。近似服从标准正态分布。2121XXXXZ 例例6-7 用同位素方法独立地测量两份标本的放射性,标用同位素方法独立地测量两份标本的放射性,标本的制备方法相同,但测量时间不同,第一份标本测量了本的制备方法相同,但测量时间不同,第一份
26、标本测量了10分钟,测得质点数为分钟,测得质点数为1500,第二份标本测量了,第二份标本测量了20分钟,分钟,测得质点数为测得质点数为2400。问如果在相同时间长度内测量,两份。问如果在相同时间长度内测量,两份标本发放质点的总体均数是否相等?标本发放质点的总体均数是否相等?221121nXnXXXZ统计描述统计描述:包括样本含量和统计描述指标;包括样本含量和统计描述指标;统计推断统计推断:包括采用的统计方法、检验统计量、单包括采用的统计方法、检验统计量、单侧还是双侧检验、检验水准、确切的侧还是双侧检验、检验水准、确切的P值和置信值和置信区间。区间。在在=0.10检验水准下,新药组和常规检验水准
27、下,新药组和常规药物组血红蛋白增加量均服从正态药物组血红蛋白增加量均服从正态分布(分布(W检验:检验:P1=0.466,P20.482)且两总体方差齐()且两总体方差齐(F1.345,P=0.261);采用两独立样本的);采用两独立样本的t检检验:验:t=4.137,=18,P=0.001。结果。结果表明:在表明:在=0.05(双侧双侧)检验水准下,检验水准下,可以认为两药疗效不同,新药治疗可以认为两药疗效不同,新药治疗的患者血红蛋白平均增加量高于常的患者血红蛋白平均增加量高于常规药治疗的患者。的规药治疗的患者。的95%置信区间置信区间(3.829,11.731)也表明新药治疗的患也表明新药治
28、疗的患者血红蛋白平均增加量高。者血红蛋白平均增加量高。The data of two samples were adequately normally distributed(Shapiro-Wilk test:P1=0.466;P20.482)and the two population variances were equal at the significant level 0.10(F1.345;P=0.261),so two independent samples t test was used(t=4.137;df=18;P=0.001).The results indicated
29、 a statistically significant difference between effects of two drugs at two-tailed significant level 0.05 and the average increase of concentration of Hb was higher in patients taking the new drug,which could also be observed from the 95%confidence interval of the difference of two population means(3.829,11.731).两样本定量资料的假设检验
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。