1、第三章 两总体均值和比例的统计推断3.1 两总体均值之差的推断:两总体均值之差的推断:1和和2已知已知3.2 两总体均值之差的推断:两总体均值之差的推断:1和和2未知未知3.3 两总体均值之差的推断:匹配样本两总体均值之差的推断:匹配样本3.4 两总体比例之差的推断两总体比例之差的推断问题:新药是否具有疗效?新药是否具有疗效?儿童观看暴力节目是否会增加暴力行为?儿童观看暴力节目是否会增加暴力行为?学生在网上学习是否比在课堂上学到更多学生在网上学习是否比在课堂上学到更多的东西?的东西?新的生产线是否能够提高产量?新的生产线是否能够提高产量?3.1 两总体均值之差的推断:1和2已知 令 1表示总体
2、表示总体1的均值,的均值,2表示总体表示总体2的均的均值,本节内容即是研究两均值之差(值,本节内容即是研究两均值之差(1-2)的统计推断。的统计推断。从总体从总体1抽取一个含抽取一个含n1个单位的简单随机样个单位的简单随机样本,从总体本,从总体2抽取一个含抽取一个含n2个单位的另一个简个单位的另一个简单随机样本。由于这两个样本是相互独立抽单随机样本。由于这两个样本是相互独立抽取的,因此被称为取的,因此被称为独立简单随机样本独立简单随机样本。(一)两(一)两总体均值之差的区间估计总体均值之差的区间估计需要注意的问题:需要注意的问题:总体分布总体分布样本容量样本容量(二(二)1-2的假设检验的假设
3、检验假设的提出:假设的提出:1.H0:1-2=D0,H1:1-2 D0 双侧检验双侧检验2.H0:1-2 D0,H1:1-2 D0 右侧右侧检验检验在许多应用中,在许多应用中,D0=0那么,那么,1-2 的假设检验的检验统计量应该是什么?的假设检验的检验统计量应该是什么?试试着推导一下着推导一下例题:为评价两个培训中心教育质量差异,例题:为评价两个培训中心教育质量差异,对两个中心的学员进行了一次标准化考试。对两个中心的学员进行了一次标准化考试。用考试平均分数的差异来评估两个中心教育用考试平均分数的差异来评估两个中心教育质量的差异。具体数据参见质量的差异。具体数据参见ExamScores.xls
4、ExamScores.xls。在许多情形下,以前所进行的标准化测试总在许多情形下,以前所进行的标准化测试总能导致考试分数有近能导致考试分数有近1010分的标准差。规定该分的标准差。规定该研究的显著性水平为研究的显著性水平为0.050.05。问题:两个培训。问题:两个培训中心教育质量差异的区间估计?两个培训中中心教育质量差异的区间估计?两个培训中心的教育质量有差异吗?心的教育质量有差异吗?3.2 两总体均值之差的推断:1和2未知(二(二)1-2的假设检验的假设检验假设的提出:假设的提出:1.H0:1-2=D0,H1:1-2 D0 双侧检验双侧检验2.H0:1-2 D0,H1:1-2 D0 右侧右
5、侧检验检验在许多应用中,在许多应用中,D0=0那么,那么,1-2 的假设检验的检验统计量应该是什么?的假设检验的检验统计量应该是什么?试试着推导一下着推导一下例:为评价新开发软件包的优点,抽取了由例:为评价新开发软件包的优点,抽取了由2424名系统分析员组成的随机样本。发给每个名系统分析员组成的随机样本。发给每个分析员一张假定的信息系统的说明书。指定分析员一张假定的信息系统的说明书。指定其中其中1212名分析员使用当前技术来开发该信息名分析员使用当前技术来开发该信息系统,另外系统,另外1212名分析员先接受软件包的培训,名分析员先接受软件包的培训,然后用新软件包来开发该信息系统。新软件然后用新
6、软件包来开发该信息系统。新软件包能使平均项目完成时间缩短吗?包能使平均项目完成时间缩短吗?1=2的情况的情况练习:假设在制造业抽取了由练习:假设在制造业抽取了由1515名参加工会名参加工会的女工和由的女工和由2020名未参加工会的女工组成的两名未参加工会的女工组成的两个独立简单随机样本,获得的小时工资率数个独立简单随机样本,获得的小时工资率数据参见据参见Union.xlsUnion.xls(1 1)求两总体小时工资之差的点估计量)求两总体小时工资之差的点估计量(2 2)求两总体均值之差的)求两总体均值之差的95%95%的置信区间的置信区间(3 3)这两组成员的平均工资率有差异吗?请)这两组成员
7、的平均工资率有差异吗?请说明说明3.3 两总体均值之差的推断:匹配两总体均值之差的推断:匹配样本样本 假设一家制造厂的员工可用两种方法完假设一家制造厂的员工可用两种方法完成一项生产任务。为了使产品产量最大化,成一项生产任务。为了使产品产量最大化,该公司想找出总体平均完成时间较短的方法。该公司想找出总体平均完成时间较短的方法。在不知道哪种方法更好的条件下,暂时假设在不知道哪种方法更好的条件下,暂时假设两种方法具有相同的平均完成时间。两种方法具有相同的平均完成时间。H0:1-2=0,H1:1-2 0抽样方法的两种选择方案:抽样方法的两种选择方案:独立样本方案:随机抽取两个简单随机样本,独立样本方案
8、:随机抽取两个简单随机样本,各自采用一种方法;各自采用一种方法;匹配样本方案:仅抽取一个简单随机样本,匹配样本方案:仅抽取一个简单随机样本,分别采用两种方法。分别采用两种方法。哪一种方法更好?哪一种方法更好?工人工人方法方法1的完成时间的完成时间/分分方法方法2的完成时间的完成时间/分分完成时间的差值完成时间的差值(di)16.05.40.625.05.2-0.237.06.50.546.25.90.356.06.00.066.45.80.6表表3.1 3.1 匹配样本方案的任务完成时间匹配样本方案的任务完成时间适用于匹配样本的两总体均值之差的区间估适用于匹配样本的两总体均值之差的区间估计应该
9、是什么呢?计应该是什么呢?试着做出例题的答案,这两种方法有差异吗?试着做出例题的答案,这两种方法有差异吗?练习:对某一团体的会员进行一次调查,以练习:对某一团体的会员进行一次调查,以确定其会员花在看电视上的时间是否比花在确定其会员花在看电视上的时间是否比花在看书上的时间多。具体数据见看书上的时间多。具体数据见TVRead.xls。对于显著性水平对于显著性水平0.05,你能得出该团体的会,你能得出该团体的会员每周看电视的时间比看书的时间多的结论员每周看电视的时间比看书的时间多的结论吗?吗?3.4 两总体比例之差的推断两总体比例之差的推断两个总体比例之差(两个总体比例之差(p1-p2)的假设检验:
10、)的假设检验:(一)假设的提出(一)假设的提出1.H0:p1-p2=0,H1:p1-p2 0 双侧检验双侧检验2.H0:p1-p2 0,H1:p1-p2 0 右侧检验右侧检验那么,那么,p1-p2的假设检验的检验统计量应该是什么?的假设检验的检验统计量应该是什么?试着推导一下试着推导一下由于由于p未知,合并两个样本点估计量,以得到未知,合并两个样本点估计量,以得到如下如下p的单一点估计量,的单一点估计量,112212n pn ppnn p1-p2的假设检验的检验统计量的假设检验的检验统计量:1212()11(1)()ppzppnn练习:某税务机构想要比较两个地区办事处练习:某税务机构想要比较两个地区办事处的工作质量。根据随机抽取的每个办事处预的工作质量。根据随机抽取的每个办事处预备好的纳税申报单样本,并对这些样本申报备好的纳税申报单样本,并对这些样本申报单的准确度进行核实,该税务机构可以估计单的准确度进行核实,该税务机构可以估计出每个办事处预备好的申报单的出错比例,出每个办事处预备好的申报单的出错比例,具体数据参见具体数据参见TaxPrep.xlsTaxPrep.xls。两个地区办事处。两个地区办事处的工作质量是否有差异呢?的工作质量是否有差异呢?