1、 我们在掌握了单样本检验与估计的有关方法与原理我们在掌握了单样本检验与估计的有关方法与原理之后,把视野投向双样本检验与估计是很自然的。双样之后,把视野投向双样本检验与估计是很自然的。双样本统计,除了有大样本、小样本之分外,根据抽样之不本统计,除了有大样本、小样本之分外,根据抽样之不同,还可分为同,还可分为独立样本独立样本与与配对样本配对样本。独立样本独立样本,指指双样本是在两个双样本是在两个总体中相互独立总体中相互独立地抽取的地抽取的。配对样本,指只有一配对样本,指只有一个总体,双样本是由于样个总体,双样本是由于样本中的个体两两匹配成对本中的个体两两匹配成对而产生的。配对样本相互而产生的。配对
2、样本相互之间不独立。之间不独立。第1页,共50页。为了把单样本检验推广到能够比较两个样本的均值的检验,必须为了把单样本检验推广到能够比较两个样本的均值的检验,必须再一次运用中心极限定理。下面是一条由中心极限定理推广而来的重再一次运用中心极限定理。下面是一条由中心极限定理推广而来的重要定理:如果从要定理:如果从 和和 两个总体中分别抽取容量为两个总体中分别抽取容量为n1和和n2 的独立随机样本,那么两个样本的均值差的独立随机样本,那么两个样本的均值差 的抽样分的抽样分布就是布就是 。与单样本的情况相同,在大样本的。与单样本的情况相同,在大样本的情况下情况下(两个样本的容量都超过两个样本的容量都超
3、过50),这个定理可以推广应用于任何具,这个定理可以推广应用于任何具有均值有均值1和和2以及方差以及方差 和和 的两个总体。当的两个总体。当n1和和n2逐渐变大逐渐变大时,时,的抽样分布像前面那样将接近正态分布。的抽样分布像前面那样将接近正态分布。21),(211N)(21XX),(222N)(21XX),(22212121nnN22第2页,共50页。1大样本均值差检验大样本均值差检验 (1)零假设:)零假设:(2)备择假设:)备择假设:单侧单侧 双侧双侧 或或(3)否定域:单侧)否定域:单侧 双侧双侧(4)检验统计量)检验统计量(5)比较判定)比较判定0211:DH0210:DH222121
4、210nnDXXZ0211:DH0211:DHZ2/Z第3页,共50页。例例为了比较已婚妇女对婚后生活的态度是否因婚为了比较已婚妇女对婚后生活的态度是否因婚龄而有所差别,将已婚妇女按对婚后生活的态度分为龄而有所差别,将已婚妇女按对婚后生活的态度分为“满满意意”和和“不满意不满意”两组。从满意组中随机抽取两组。从满意组中随机抽取600名妇女,名妇女,其平均婚龄为其平均婚龄为8.5年,标准差为年,标准差为2.3年;从不满意组抽出年;从不满意组抽出500名妇女,其平均婚龄为名妇女,其平均婚龄为9.2年,标准差年,标准差2.8年。试问在年。试问在0.05显著性水平上两组是否存在显著性差异?显著性水平上
5、两组是否存在显著性差异?样本样本人数人数均值均值标准差标准差满意组满意组6008.52.3不满意组不满意组5009.22.8第4页,共50页。第5页,共50页。2大样本成数差检验大样本成数差检验(1)零假设:)零假设:(2)备择假设:)备择假设:单侧单侧 双侧双侧 或或(3)否定域:单侧)否定域:单侧 双侧双侧(4)检验统计量)检验统计量0211:DppH0210:DppH22211121)(210210)()(nqpnqpDppDppZpp0211:DppH0211:DppHZ2/Z 其中其中:为总体为总体1的的 样本成数样本成数 为总体为总体2的的 样本成数。样本成数。222nXp 111
6、nXp 第6页,共50页。当当p1和和p2未知,须用样本成数未知,须用样本成数 和和 进行估算时,分以下两进行估算时,分以下两种情况讨论:种情况讨论:若零假设中两总体成数的关系为若零假设中两总体成数的关系为 ,这时两总体可看作成数,这时两总体可看作成数P 相同的总体,它相同的总体,它们的点估计值为们的点估计值为 此时上式中检验此时上式中检验统计量统计量 Z 可简化为可简化为 若零假设中两总体成数若零假设中两总体成数 ,那么它们的点估计值有,那么它们的点估计值有 此时上式中此时上式中 检验统计量检验统计量Z为为21212121210)(nnnnqpppnqpnqpppZ11pp212211212
7、1nnpnpnnnXXp22pp21pp 222111021)(nqpnqpDppZ21pp(5)判定)判定1p2p第7页,共50页。例例有一个大学生的随机样本,按照性格有一个大学生的随机样本,按照性格“外向外向”和和“内向内向”,把他们分成两类。结果发现,新生中有,把他们分成两类。结果发现,新生中有73属属于于“外向外向”类,四年级学生中有类,四年级学生中有58属于属于“外向外向”类。样本类。样本中新生有中新生有171名,四年级学生有名,四年级学生有117名。试问,在名。试问,在0.01水平水平上,两类学生有无显著性差异?上,两类学生有无显著性差异?外向外向内向内向四年级四年级58%(117
8、)42%一年级一年级73%(171)27%第8页,共50页。解解 据题意据题意 新生组的抽样结果为:新生组的抽样结果为:0.73,0.27,n1171 四年级学生组的抽样结果为四年级学生组的抽样结果为:0.58,0.42,n2117 H0:p1p2D00 H1:p1p2D00 计算检验统计量计算检验统计量 确定否定域确定否定域 因为因为0.01,因而有,因而有 Z/2Z0.0052.582.66 因而否定零假设,即可以认为在因而否定零假设,即可以认为在0.01显著性水平上,两类学生在显著性水平上,两类学生在性格上是有差异的。性格上是有差异的。2q1p2q2p669.011717158.0117
9、73.01712121nnXXp66.2117171117171331.0669.058.073.0212121nnnnqpppZ第9页,共50页。与对单总体小样本假设检验一样,我们对两与对单总体小样本假设检验一样,我们对两总体小样本假设检只讨论总体满足正态分布的情总体小样本假设检只讨论总体满足正态分布的情况。况。1.小样本均值差假设检验小样本均值差假设检验 (1)当当 和和 已知时,小样本均值差已知时,小样本均值差检验,与上一节所述大样本总体均值差检验完全检验,与上一节所述大样本总体均值差检验完全相同,这里不再赘述。相同,这里不再赘述。2122第10页,共50页。现又因为现又因为未知,所以要
10、用它的未知,所以要用它的无偏估计量无偏估计量 替代它。由于两个样替代它。由于两个样本的方差基于不同的样本容量,因而本的方差基于不同的样本容量,因而可以用加权的方法求出可以用加权的方法求出的无偏估计的无偏估计量,得量,得 注意,上式的分母上减注意,上式的分母上减2,是因为,是因为根据根据 和和 计算计算S1和和S2时,分别损时,分别损失了一个自由度,一共损失了两个自由失了一个自由度,一共损失了两个自由度,所以全部自由度的数目就成为度,所以全部自由度的数目就成为(n1+n22)。于是有于是有S1X21222121nnnnS)21(XX)21(XX 21212111nnnnnn)21(XX 2212
11、22211nnSnSnS2X第11页,共50页。这样,对小样本正态总体,这样,对小样本正态总体,和和 未知,但未知,但12,其均值差的检验步骤如下其均值差的检验步骤如下:(1)零假设:)零假设:(2)备择假设:)备择假设:单侧单侧 双侧双侧 或或(3)否定域:单侧)否定域:单侧 双侧双侧(4)检验统计量)检验统计量(5)比较判定)比较判定0211:DH0210:DH)(21210XXDXXt0211:DH0211:DH)2(21nnt)2(212/nnt2121212222110212)(nnnnnnSnSnDXX2122第12页,共50页。例例为研究某地民族间家庭规模是否有所不同,各做为研究
12、某地民族间家庭规模是否有所不同,各做如下独立随机抽样:如下独立随机抽样:民族民族A:12户,平均人口户,平均人口6.8人,标准差人,标准差1.5人人 民族民族B:12户,平均人口户,平均人口5.3人,标准差人,标准差0.9人人 问:能否认为问:能否认为A民族的家庭平均人口高于民族的家庭平均人口高于B民族的家民族的家庭平均人口(庭平均人口(=0.05)?(假定家庭平均人口服从正态)?(假定家庭平均人口服从正态分布,且方差相等)分布,且方差相等)t=2.97 例例 某市对儿童体重情况进行调查,抽查某市对儿童体重情况进行调查,抽查8岁的女孩岁的女孩20人,平均体重人,平均体重22.2千克,标准差千克
13、,标准差2.46千克;抽查千克;抽查8岁的岁的男孩男孩18人,平均体重人,平均体重21.3千克,标准差千克,标准差1.82千克。若男女千克。若男女儿童体重的总体方差相等,问在显著性水平儿童体重的总体方差相等,问在显著性水平5%上,该年上,该年龄男女儿童之体重有无显著差异龄男女儿童之体重有无显著差异?第13页,共50页。解解 据题意,据题意,女孩组的抽样结果为:女孩组的抽样结果为:22.2(千克千克),S12.46(千克千克),n120(人人)男孩组的抽样结果为:男孩组的抽样结果为:21.3(千克千克),S21.82(千克千克),n218(人人)H0:12D00 H1:120 计算检验统计量计算
14、检验统计量 确定否定域确定否定域 因因0.05,因而有,因而有t 0.025(36)2.0281.24 故不能否定故不能否定H0,即可认为男女儿童平均体重无显著性差异。,即可认为男女儿童平均体重无显著性差异。24.1182018202182082.11846.2203.212.22221X2X2121212222110212)(nnnnnnSnSnDXXt第14页,共50页。例例 用上式重新求解前例题。用上式重新求解前例题。解解 用上式,检验统计量的计算为用上式,检验统计量的计算为 可以看出,求算用可以看出,求算用(10.8)式和式和(10.10)式,得出的结果差别不大。式,得出的结果差别不大
15、。121/nS)1/(121nS22)21(XX 222/n21256.111882.112046.23.212.22221122212121nSnSXXt)1/(222nS11222121nSnS)21(XX 第15页,共50页。设两总体分别满足正态分布设两总体分别满足正态分布 和和 。现从这两。现从这两个总体中分别独立地各抽取一个随机样本,并具有容量个总体中分别独立地各抽取一个随机样本,并具有容量n1,n2和方差和方差 ,。根据第八章。根据第八章(8.22)式,对两总体样本方差的抽样分布分别有式,对两总体样本方差的抽样分布分别有 )1(1221211nSn),(222N21S22S),(2
16、22N)1(2222222nSn第16页,共50页。根据本书第八章第四节根据本书第八章第四节F分布中的分布中的(8.25)式有式有 由于由于 ,所以简化后,检验方差比所所以简化后,检验方差比所用统计量为用统计量为 当零假设当零假设H0:12时,时,上式中的统计量又简化为上式中的统计量又简化为)11(/2122222121nnFSS,221SnnS)11()1/()1/(21222222121211nnFnSnnSn,)11(212221nnFSSF,第17页,共50页。这样一来,小样本正态总体方差比检验的步骤有这样一来,小样本正态总体方差比检验的步骤有 (1)零零 假假 设设H0:备择假设备择
17、假设H1:单侧单侧 双侧双侧 H1:H1:H1:(2)检验统计量检验统计量 ()()()2221SS2221SSF22212221222122212221SSF2221SSF2122SS2221SS单侧单侧双侧双侧第18页,共50页。(3)(3)否定域否定域(参见下图参见下图)单侧单侧 F F(n n1 111,n n2 211),双侧),双侧F F/2 2(n n1 111,n n2 211)方差比检验,比起前面所介绍的检验有一个不同点,那就是无方差比检验,比起前面所介绍的检验有一个不同点,那就是无论是单侧检验还是双侧检验,论是单侧检验还是双侧检验,F F 的临界值都只在右侧。其原因是我的临
18、界值都只在右侧。其原因是我们总是把和中的较大者放在分子上,以便使用者掌握。因此有们总是把和中的较大者放在分子上,以便使用者掌握。因此有 1 1 或者或者 112221SSF2122SSF第19页,共50页。22S21S第20页,共50页。解解 据题意,据题意,对男性青年样本有对男性青年样本有n n1 1 1010,30.8(30.8(厘米厘米2 2)对女性青年样本有对女性青年样本有n n2 2 8 8,27.8(27.8(厘米厘米2 2)H H0 0 :H H1 1 :计算检验统计量计算检验统计量 确定否定域,因为确定否定域,因为0.050.05,F F/2 2(n n1 111,n n2 2
19、11)F F0.0250.025(9,7)(9,7)4.824.821.081.08 因而不能否定零假设,即在因而不能否定零假设,即在0.050.05水平上,我们不能说男性青年身水平上,我们不能说男性青年身高的方差和女性青年身高的方差有显著性差异。高的方差和女性青年身高的方差有显著性差异。21S08.18.312.342221SSF22S222122212.348.30110101211121SnnS8.318.271881222222SnnS第21页,共50页。配对样本,是两个样本的单位两两匹配成配对样本,是两个样本的单位两两匹配成对,它实际上只能算作一个样本,也称关联样对,它实际上只能算作
20、一个样本,也称关联样本。因此对它的检验,用均值差检验显然是不行本。因此对它的检验,用均值差检验显然是不行的。因为的。因为2 n个样本单位个样本单位(每个样本每个样本n个个)不是全部不是全部独立抽取的。而如果把每一配对当作一个单位,独立抽取的。而如果把每一配对当作一个单位,在符合其他必要的假定条件下,统计检验与单样在符合其他必要的假定条件下,统计检验与单样本检验相差无几。本检验相差无几。第22页,共50页。1单一实验组的假设检验单一实验组的假设检验 对于单一实验组这种对于单一实验组这种“前前后后”对比型配对样对比型配对样本的假设检验,我们的做法是,不用均值差检验,本的假设检验,我们的做法是,不用
21、均值差检验,而是求出每一对观察数据的差,直接进行一对一的而是求出每一对观察数据的差,直接进行一对一的比较。如果采用比较。如果采用“前测前测”“”“后测后测”两个总体无差异的零两个总体无差异的零假设,也就是等于假定实验刺激无效。于是,问题假设,也就是等于假定实验刺激无效。于是,问题就转化为每对观察数据差的均值就转化为每对观察数据差的均值d 0的单样本假的单样本假设检验了。求每一对观察值的差,直接进行一对一设检验了。求每一对观察值的差,直接进行一对一的比较。的比较。第23页,共50页。设配对样本的样本单位前测与后测的观察数据分别设配对样本的样本单位前测与后测的观察数据分别是是X 0i与与X 1i,
22、其差记作,其差记作di d i X 1iX 0i 如果假设两总体前测与后测无显著性差别,即如果假设两总体前测与后测无显著性差别,即1 0 或者或者 。那么对取自这两。那么对取自这两个总体的配对大样本有个总体的配对大样本有001Ndid),0(2nNnddi第24页,共50页。t n1t 22)(1ddnSid)1(1/0ntnSdtd第25页,共50页。第26页,共50页。023.513328)(22nddSd76.2113/023.50.41/0nSdtd0.41352nddi第27页,共50页。练习一:练习一:以下是经济体制改革后,某厂以下是经济体制改革后,某厂8个个车间竞争性测量的比较。
23、问改革后,竞争性有无车间竞争性测量的比较。问改革后,竞争性有无增加?(增加?(取取=0.05)t=3.176 改革后改革后 86 87 56 93 84 93 75 79 改革前改革前 80 79 58 91 77 82 74 66 练习二:练习二:为了了解职工的企业认同感,根据为了了解职工的企业认同感,根据男性男性1000人的抽样调查,其中有人的抽样调查,其中有52人希望调换工人希望调换工作单位;而女性作单位;而女性1000人的调查有人的调查有23人希望调换工人希望调换工作,能否说明男性比女性更期望职业流动?作,能否说明男性比女性更期望职业流动?(取取=0.05)第28页,共50页。2一实验
24、组与一控制组的假设检验一实验组与一控制组的假设检验 单一实验组实验的逻辑,是把实验对象前测单一实验组实验的逻辑,是把实验对象前测后测之间的变化全部归因于实验刺激。在社会现后测之间的变化全部归因于实验刺激。在社会现实生活进行的实际实验中,对象前测后测之间的实生活进行的实际实验中,对象前测后测之间的变化,有时除了受到实验刺激外,还受到其他社变化,有时除了受到实验刺激外,还受到其他社会因素的作用。因而,配对样本的一实验组与一会因素的作用。因而,配对样本的一实验组与一控制组之假设检验,要设法把实验变量的作用和控制组之假设检验,要设法把实验变量的作用和额外变量的作用区分开来,然后就像对待单一实额外变量的
25、作用区分开来,然后就像对待单一实验组实验一样,把问题转化为零假设验组实验一样,把问题转化为零假设d0的单的单样本检验来处理。样本检验来处理。第29页,共50页。在一实验组与一控制组的实验设计之中,对前测后在一实验组与一控制组的实验设计之中,对前测后测之间的变化,消除额外变量影响的基本做法如下:测之间的变化,消除额外变量影响的基本做法如下:(1)前测:对实验组与控制组分别度量;前测:对实验组与控制组分别度量;(2)实验刺激:只对实验组实行实验刺激;实验刺激:只对实验组实行实验刺激;(3)后测:对实验组与控制组分别度量;后测:对实验组与控制组分别度量;(4)求算消除了额外变量影响之后的求算消除了额
26、外变量影响之后的 d i 后测实验组后测实验组前测实验组前测后测差实验组前测实验组前测后测差实验组 后测控制组后测控制组前测控制组前测后测差控制组前测控制组前测后测差控制组 实验效应实验效应d di i 前测后测差实验组前测后测差实验组前测后测差控制组前测后测差控制组第30页,共50页。第31页,共50页。46.810716)(22nddSd13.2110/46.80.61/0nSdtd0.61060nddi第32页,共50页。3对实验设计与相关检验的评论对实验设计与相关检验的评论 有了独立样本和非独立样本的认识,读者自有了独立样本和非独立样本的认识,读者自然会提出什么时候使用配对样本以及什么
27、时候不然会提出什么时候使用配对样本以及什么时候不使用配对样本的问题。很显然,匹配样本损失了使用配对样本的问题。很显然,匹配样本损失了自由度,使用配对样本相当于减小了一半样本容自由度,使用配对样本相当于减小了一半样本容量。这样做是不是得不偿失呢量。这样做是不是得不偿失呢?答案是要看我们答案是要看我们能否恰当地配对。能否恰当地配对。在配对过程中,最好用掷硬币的方式决定在配对过程中,最好用掷硬币的方式决定“对对”中的哪一个归入实验组,哪一个归入控制中的哪一个归入实验组,哪一个归入控制组。从而使组。从而使“对对”内随机化。内随机化。第33页,共50页。)(21XX),(22212121nnN1),(0
28、)()(2221210121NnnXXZ2221第34页,共50页。)(21XX)(21)(21XX)(21XX)(2221212/21nnZXX)(21,)(2221212/21nnZXX第35页,共50页。2122第36页,共50页。212X1X,10902012096.1)670840(2210902012096.1)670840(第37页,共50页。)(2122212121222221S22S,)2()()21(212/21XXnntXX)2()()21(212/21XXnntXX第38页,共50页。)21(XX 22212121212222112nnnnnnSnSn2121nnnn)
29、21(XX)21(XX 第39页,共50页。第40页,共50页。2X1X)21(XX 728.0182018202182082.11846.220222121212222112nnnnnnSnSn第41页,共50页。)21(XX 11222121nSnS2221)21(XX 第42页,共50页。2X)21(XX 1X2.161242.491208.542211222121nSnS第43页,共50页。与单样本成数的区间估计一样,成数差区间估计与单样本成数的区间估计一样,成数差区间估计可以被看作均值差的特例来处理可以被看作均值差的特例来处理(但它适用于各种量度但它适用于各种量度层次层次)。即对给定
30、的置信水平(。即对给定的置信水平(1),得两总体成数),得两总体成数差差(p1p2)之估计区间为之估计区间为,)(2221112/21nqpnqpZpp)(2221112/21nqpnqpZpp第44页,共50页。当当p1和和p2未知,须用样本成数未知,须用样本成数 和和 进行估算,同时分以下两进行估算,同时分以下两种情况讨论:种情况讨论:若能假设若能假设 ,上式变为,上式变为 式中式中:若不能假设若不能假设 ,上式变为,上式变为 ,)()(21212/21nnnnqpZpp212211nnpnpnp21pp 1p2p)()(21212/21nnnnqpZpp,)(2221112/21nqpn
31、qpZpp21pp)(2221112/21nqpnqpZpp第45页,共50页。第46页,共50页。1q,11742.058.017127.073.058.2)58.073.0(2q1p2p11742.058.017127.073.058.2)58.073.0(第47页,共50页。)1(1/ntnSdtdd1)1(,1)1(2/2/nSntdnSntddd第48页,共50页。第49页,共50页。得在得在95的置信水平上,两种催眼药平均药效之差的置信水平上,两种催眼药平均药效之差d的置信区间为的置信区间为1.15土土0.97(小时小时),即,即 0.18(小时小时)d 2.12(小时小时)。小时)(15.182.9nddi087.1)82.9(804.20)()(22222ndndnddSd18087.1365.215.1,18087.1365.215.1 第50页,共50页。