1、第 6 章 假设检验o 6.1 假设检验的基本问题假设检验的基本问题 o 6.2 一个总体参数的检验一个总体参数的检验o 6.3 两个总体参数的检验两个总体参数的检验假设检验在统计方法中的地位o 统计方法统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验6.1 假设检验的基本问题一、假设的陈述一、假设的陈述二、两类错误与显著性水平二、两类错误与显著性水平三、统计量与拒绝域三、统计量与拒绝域四、利用四、利用P值进行决策值进行决策一、假设的陈述1、假设和假设检验、假设和假设检验 假设假设是对总体参数的具体数值所作的陈述n 总体参数包括总体均值总体均值、比率比率、方差方差等n
2、分析之前之前必须陈述假设检验:假设检验:先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程有参数检验和非参数检验逻辑上运用反证法,统计上依据小概率原理假设检验的基本思想m m = 50假设检验的过程我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 拒绝假设拒绝假设 别无选择别无选择! 小概率原理o 什么小概率?什么小概率?o 1.在一次试验中,一个几乎不可能发生的事件发生的概率o 2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设o 3.小概率由研究者事先确定2、原假设与备择假设p 原假设原假设(null hypothesis) :研究者想收集证据
3、予以反对的假设。表示为H0nH0 : m = , 或 某一数值 n例如, H0 : m 10cmp 备择假设备择假设(alternative hypothesis):研究者想收集证据予以支持的假设。表示为H1 H1: m , 或 某一数值 例如, H1 : m 10cm, ”或“”的假设检验,称为单侧检验或单尾检验(one-tailed test)n备择假设的方向为“”,称为右侧检验右侧检验 双侧检验与单侧检验 (假设的形式)二、假设检验中的两类错误o 1.第第类错误类错误(弃真错误弃真错误)n原假设为真时拒绝原假设n第类错误的概率记为o被称为显著性水平o 2.第第类错误类错误(取伪错误取伪错
4、误)n原假设为假时未拒绝原假设n第类错误的概率记为 (Beta) 错误和 错误的关系你不能同时减你不能同时减少两类错误少两类错误!显著性水平 (significant level)1. 原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域2. 它是事先指定的犯第类错误概率的最大允许值3. 常用的 值有0.01, 0.05, 0.104. 由研究者事先确定5. 拒绝原假设,则表明检验的结果是显著的 不拒绝原假设,表明检验的结果是不显著的三、检验统计量与拒绝域根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量对样本估计量的标准化结果n原假设H0为真n点估计量的抽样分布
5、点估计量的抽样标准差假设值点估计量标准化检验统计量显著性水平和拒绝域(双侧检验 ) /2 显著性水平和拒绝域(双侧检验 ) 显著性水平和拒绝域(双侧检验 ) 显著性水平和拒绝域(双侧检验 ) 显著性水平和拒绝域(单侧检验 )显著性水平和拒绝域(左侧检验 )显著性水平和拒绝域(左侧检验 )显著性水平和拒绝域(右侧检验 )显著性水平和拒绝域(右侧检验 )决策规则给定显著性水平,查表得出相应的临界值z或z/2, t或t/2将检验统计量的值与 水平的临界值进行比较作出决策n双侧检验:统计量 临界值,拒绝H0n左侧检验:统计量 临界值,拒绝H0四、利用 P 值 进行决策什么是P 值?(P-value)在
6、原假设为真的条件下,检验统计量大于、小于或等于其计算值的概率n双侧检验为分布中两侧面积的总和反映实际观测到的数据与原假设H0之间不一致的程度决策规则:若p值, 拒绝 H0双侧检验的P 值左侧检验的P 值右侧检验的P 值假设检验步骤的总结陈述原假设和备择假设从所研究的总体中抽出一个随机样本确定一个适当的检验统计量,并利用样本数据算出其具体数值确定一个适当的显著性水平,并计算出其临界值,指定拒绝域将统计量的值与临界值进行比较,作出决策n统计量的值落在拒绝域,拒绝H0,否则不拒绝H0n也可以直接利用P值值作出决策6.2 一个总体参数的检验一、总体均值的检验一、总体均值的检验二、总体比率的检验二、总体
7、比率的检验三、总体方差的检验三、总体方差的检验一个总体参数的检验z 检验检验(单尾和双尾单尾和双尾) t 检验检验(单尾和双尾单尾和双尾)z 检验检验(单尾和双尾单尾和双尾) 2 2 检验检验(单尾和双尾单尾和双尾)均值均值一个总体一个总体比率比率方差方差一、总体均值的检验p检验统计量确定的因素:检验统计量确定的因素:1、样本容量的大小2、总体分布形状3、总体方差是否已知p总体均值检验统计量主要有:总体均值检验统计量主要有:1、z检验统计量2、t检验统计量总体均值的检验 (大样本)1. 假定条件n正态总体或非正态总体大样本(n30)使用 z检验统计量n 2 已知:2. 2 未知:) 1 , 0
8、(0Nnxzm) 1 , 0(0Nnsxzm总体均值的检验( 2 已知)(例题分析)o【例】【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05 ,检验该天生产的饮料容量是否符合标准要求?总体均值的检验( 2 已知)(例题分析)oH0 :m m = 255oH1 :m m 255o = 0.05on = 40o临界值临界值(Zc):01. 14052558 .2550nxzm总体均值的检验(z检验) (P 值的计算与应用)o第第1步:
9、步:进入Excel表格界面,直接点击“f(x)”(粘贴 函数)o第第2步:步:在函数分类中点击“统计”,并在函数名的 菜单下选择“NORMSDIST”,然后确定o第第3步:步:将 z 的绝对值1.01录入,得到的函数值为 0.843752345 P值=2(1-0.843752345)=0.312495 P值远远大于,故不拒绝H0总体均值的检验( 2 未知)(例题分析)o【例】【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本
10、数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低? (=0.01) 总体均值的检验( 2 未知)(例题分析)oH0 : m m 1.35oH1 : m m 1.35o = 0.01on = 50o临界值临界值(c):6061. 250365749. 035. 13152. 1z总体均值的检验(z检验) (P 值的计算与应用)o第第1步:步:进入Excel表格界面,直接点击“f(x)”o第第2步:步:在函数分类中点击“统计”,并在函数名的菜单下选择“ZTEST”,然后确定o第第3步:步:在所出现的对话框Array框中,输入原始数据所在区 域 ;在X后输入参数的某一假定值(这里为
11、1.35);在 Sigma后输入已知的总体标准差(若未总体标准差未 知则可忽略不填,系统将自动使用样本标准差代替) o第第4步:步:用1减去得到的函数值0.995421023 即为P值 P值=1-0.995421023=0.004579 P值 5200o = 0.05on = 36o临界值临界值(c):75. 33612052005275z总体均值的检验(z检验) (P 值的图示)总体均值的检验 (大样本检验方法的总结)nxzm0nsxz0m2/zz zzzz P总体均值的检验 (小样本)o 1. 假定条件n总体服从正态分布n小样本(n 30)检验统计量n 2 已知:2. 2 未知:) 1 ,
12、 0(0Nnxzm) 1(0ntnsxtm总体均值的检验 (小样本检验方法的总结)nxzm0nsxt0m) 1(2/ntt) 1( ntt) 1( nttP总体均值的检验 (例题分析)o【例】【例】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求? 总体均值的检验 (例题分析)oH0 : m m = 12oH1 : m m 1
13、2o = 0.05odf = 10 - 1 = 9o临界值临界值(c):7035. 0104932. 01289.11t总体均值的检验( t 检验) (P 值的计算与应用)o第第1步:步:进入Excel表格界面,直接点击“f(x)”(粘贴 函数)o第第2步:步:在函数分类中点击“统计”,并在函数名的 菜单下选择“TDIST”,然后确定o第第3步:步:在出现对话框的X栏中输入计算出的t的绝对值 0.7035,在Deg-freedom(自由度)栏中输入 本例的自由度9,在Tails栏中输入2(表明是双 侧检验,如果是单测检验则在该栏输入1) o第第4步:步:P值= 0.499537958 P值=0
14、.05,故不拒绝H0 是否已是否已知知样本容量样本容量n 是否已是否已知知 t 检验检验nsxt0mz 检验检验nsxz0mz 检验检验 nxzm0z 检验检验nxzm0二、总体比率检验假定条件n总体服从二项分布n可用正态分布来近似(大样本)检验的 z 统计量) 1 , 0()1 (000Nnpz总体比率的检验 (检验方法的总结)P2/zz npz)1(000zzzz 总体比率的检验 (例题分析)o【例】【例】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平 =0
15、.05和 =0.01 ,检验该杂志读者群中女性的比率是否为80%?它们的值各是多少?总体比率的检验 (例题分析)oH0 : = 80%oH1 : 80%o = 0.05on = 200o临界值临界值(c):475. 2200)80. 01 (80. 080. 073. 0z总体比率的检验 (例题分析)oH0 : = 80%oH1 : 80%o = 0.01on = 200o临界值临界值(c):475. 2200)80. 01 (80. 080. 073. 0z三、总体方差的检验 ( 2检验) p 检验一个总体的方差或标准差p 假设总体近似服从正态分布p 使用 2分布p 检验统计量) 1() 1
16、(22022nsn总体方差的检验 (检验方法的总结)P2022) 1(sn ) 1(2212n) 1(222n) 1(222n) 1(2212n总体方差的检验(例题分析)o【例】【例】啤酒生产企业采用自动生产线灌装啤酒,每瓶的装填量为640ml,但由于受某些不可控因素的影响,每瓶的装填量会有差异。此时,不仅每瓶的平均装填量很重要,装填量的方差同样很重要。如果方差很大,会出现装填量太多或太少的情况,这样要么生产企业不划算,要么消费者不满意。假定生产标准规定每瓶装填量的标准差不应超过和不应低于4ml。企业质检部门抽取了10瓶啤酒进行检验,得到的样本标准差为s=3.8ml。试以0.10的显著性水平检
17、验装填量的标准差是否符合要求?BEERBEERBEERBEERBEER总体方差的检验(例题分析)oH0 : 2 = 42oH1 : 2 42o = 0.10odf = 10 - 1 = 9o临界值临界值(s):1225. 848 . 3) 110(2226.3 两个总体参数的检验一、两个总体均值之差的检验一、两个总体均值之差的检验二、两个总体比率之差的检验二、两个总体比率之差的检验三、两个总体方差比的检验三、两个总体方差比的检验两个总体参数的检验两个总体参数的检验两个总体参数的检验z 检验检验(大样本大样本)t 检验检验(小样本小样本)t 检验检验(小样本小样本)z 检验检验F 检验检验独立样
18、本独立样本配对样本配对样本均值均值比率比率方差方差一、两个总体均值之差的检验 (独立大样本)1. 假定条件n两个样本是独立的随机样本n正态总体或非正态总体大样本(n130和 n230)检验统计量n 12 , 22 已知:2. 12 , 22 未知:) 1 , 0()()(2221212121Nnnxxzmm) 1 , 0()()(2221212121Nnsnsxxzmm两个总体均值之差的检验 (大样本检验方法的总结)2/zz zzzz P2221212121)()(nnxxzmm2221212121)()(nsnsxxzmm两个总体均值之差的检验 (例题分析)o 两个总体均值之差的检验 (例题
19、分析)oH0 : m m 1 1- m m 2 2 = 0oH1 : m m 1 1- m m 2 2 0o = 0.05on1 = 44,n2 = 32o临界值临界值(c):002. 33225.4244647075z二、两个总体均值之差的检验 (独立小样本)1、 12, 22 已知p假定条件n两个独立的小样本n两个总体都是正态分布n 12, 22已知p检验统计量) 1 , 0()()(2221212121Nnnxxzmm2、 12,22 未知但12=2221212111)()(nnsxxtpmm2) 1() 1(212222112nnsnsnsp221nn3、 12, 22 未知且不相等1
20、222l假定条件n两个总体都是正态分布n12, 22未知且不相等,即1222n样本容量相等,即n1=n2=np检验统计量nssxxnsnsxxt222121212221212121)()()()(mmmm) 1(2221nnn4、 12, 22 未知且不相等1222p假定条件n两个总体都是正态分布n12,22未知且不相等,即1222n样本容量不相等,即n1n2p检验统计量2221212121)()(nsnsxxtmm1122222121212222121nnsnnsnsnsv两个总体均值之差的检验 (例题分析)两个总体均值之差的检验 (例题分析)oH0 :m m1 1- m m2 2 = 0o
21、H1 :m m1 1- m m2 2 0o = 0.05on1 = 8,n2 = 7o临界值临界值(c):855. 0/1/1)(2121nnsxxtp两个总体均值之差的检验 (用Excel进行检验)o第第1步:步:将原始数据输入到Excel工作表格中 o第第2步:步:选择“工具”下拉菜单并选择“数据分析数据分析”选项 o第第3步:步:在“数据分析”对话框中选择 “t-检验:双样本等方差检验:双样本等方差 假设假设”o第第4步:步:当对话框出现后 在“变量1的区域”方框中输入第1个样本的数据区域 在“变量2的区域”方框中输入第2个样本的数据区域 在“假设平均差”方框中输入假定的总体均值之差 在
22、“”方框中输入给定的显著性水平(本例为0.05) 在“输出选项”选择计算结果的输出位置,然后“确定” 两个总体均值之差的估计(例题分析)两个总体均值之差的检验 (用Excel进行检验)o第第1步:步:将原始数据输入到Excel工作表格中 o第第2步:步:选择“工具”下拉菜单并选择“数据分析数据分析”选项 o第第3步:步:在“数据分析”对话框中选择 “t-检验:双样本异方差检验:双样本异方差 假设假设” o第第4步:步:当对话框出现后 在“变量1的区域”方框中输入第1个样本的数据区域 在“变量2的区域”方框中输入第2个样本的数据区域 在“假设平均差”方框中输入假定的总体均值之差 在“”方框中输入
23、给定的显著性水平(本例为0.05) 在“输出选项”选择计算结果的输出位置,然后“确定” 两个总体均值之差的检验(匹配样本) 三、两个总体均值之差的检验(匹配样本)p假定条件n两个总体配对差值构成的总体服从正态分布n配对差是由差值总体中随机抽取的 n数据配对或匹配(重复测量 (前/后)p检验统计量) 1(0ntnsddtdddniindd11)(12dniidndds匹配样本 (数据形式) 两个总体均值之差的检验(匹配样本检验方法的总结) 1(2/ntt) 1( ntt) 1( nttPddnsddt0两个总体均值之差的检验 (例题分析)两个总体均值之差的检验 (用Excel进行检验)o第第1步
24、:步:选择“工具工具”下拉菜单,并选择“数据分析数据分析”选项o第第3步:步:在分析工具中选择“t检验:平均值的成对二样本检验:平均值的成对二样本分析分析”o第第4步:步:当出现对话框后 在“变量1的区域”方框内键入数据区域 在“变量2的区域”方框内键入数据区域 在“假设平均差”方框内键入假设的差值(这里为0) 在“”框内键入给定的显著性水平o1. 假定条件n 两个总体都服从二项分布n可以用正态分布来近似p检验统计量n检验H0:1-2=0n检验H0:1-2=d0四、两个总体比率之差的检验212111)1 (nnppppz222111021)1 ()1 ()(nppnppdppz22211212
25、11nnnpnpnnxxp两个总体比率之差的检验(检验方法的总结)2/zz zzzz P212111)1 (nnppppz222111021)1 ()1 ()(nppnppdppz两个总体比率之差的检验 (例题分析)netnet两个总体比率之差的检验 (例题分析)oH0 : 1- 2 0oH1 : 1- 2 0o = 0.05on1=200 , n2=200o临界值临界值(c):72976. 120012001)31. 01 (31. 035. 027. 0z两个总体比率之差的检验 (例题分析)两个总体比率之差的检验 (例题分析)oH0 : 1- 2 8%oH1 : 1- 28%o = 0.0
26、1on1=300 , n2=300o临界值临界值(c):91229. 7300)28. 01 (28. 0300)11. 01 (11. 008. 0)28. 011. 0(z五、两个总体方差比的检验(F 检验)假定条件n两个总体都服从正态分布,且方差相等n两个独立的随机样本检验统计量) 1, 1() 1, 1(122122212221nnFssFnnFssF或两个总体方差比的 F 检验(临界值)两个总体方差比的检验(检验方法的总结) 1, 1(212/nnFF21222221ssFssF或) 1, 1(21nnFF两个总体方差比的检验 (例题分析)o【例】【例】一家房地产开发公司准备购进一批
27、灯泡,公司打算在两个供货商之间选择一家购买。这两家供货商生产的灯泡平均使用寿命差别不大,价格也很相近,考虑的主要因素就是灯泡使用寿命的方差大小。如果方差相同,就选择距离较近的一家供货商进货。为此,公司管理人员对两家供货商提供的样品进行了检测,得到的数据如右表。检验两家供货商灯泡使用寿命的方差是否有显著差异 (=0.05) 两个总体方差比的检验 (用Excel进行检验)o第第1步:步:选择“工具工具”下拉菜单,并选择“数据分析数据分析”选项o第第3步:步:在分析工具中选择“F检验双样本方差检验双样本方差”o第第4步:步:当出现对话框后 在“变量1的区域”方框内键入数据区域 在“变量2的区域”方框
28、内键入数据区域 在“”框内键入给定的显著性水平 选择输出区域 选择“确定”1、以下关于P值检验的说法正确的是( )A、P值是指样本比例值 B、如果P值很小,则无法对原假设真伪做出判断 C、P值是当原假设正确时,得到所观测值的数据的概率D、P值越大,原假设是正确的可能性越小 E、P值越小,原假设是正确的可能性越小o 南京财经大学2004年考研题:o 什么是假设检验?何谓假设检验中的第一类型错误和第二类型错误?(9分) o 某公司宣称有75%以上的消费者满意其产品的质量,一家市场调查公司受委托调查该公司此项声明是否属实。随机抽样调查625位消费者,表示满意该公司产品质量的有500人。试问在0.05的显著性水平下,该公司的声明是否属实。(10分)