1、山东农业大学 概率论与数理统计 主讲人:程述汉 苏本堂 假设检验是对总体的未知参数或总体服从的分布等,首先提出假设检验是对总体的未知参数或总体服从的分布等,首先提出某种假设,例如假设未知参数为某一常数或总体服从某已知分布某种假设,例如假设未知参数为某一常数或总体服从某已知分布等,然后由样本提供的信息,对所做假设的等,然后由样本提供的信息,对所做假设的“真实性真实性”做出否定做出否定还还是不否定,即拒绝还是接受的判定。是不否定,即拒绝还是接受的判定。假设检验问题分为如下两大类:假设检验问题分为如下两大类:参数假设检验:参数假设检验:对总体中某个数字特征或分布中的参数提出假对总体中某个数字特征或分
2、布中的参数提出假设检验设检验(见见8.18.1例例)。非参数假设检验:非参数假设检验:对总体的分布、总体间的独立性以及是否同对总体的分布、总体间的独立性以及是否同分布等方面的检验分布等方面的检验(见见8.18.1例例2)2)。本章主要介绍假设检验的基本概念、思想方法,讨论正态总体本章主要介绍假设检验的基本概念、思想方法,讨论正态总体参数的检验、频率检验、拟合优度检验参数的检验、频率检验、拟合优度检验(非参数假设检验非参数假设检验)等。等。.1.1 假设检验的假设检验的一般一般概念概念 一、假设检验的基本思想一、假设检验的基本思想 先看以下两个例子。先看以下两个例子。第八章 假设检验山东农业大学
3、 概率论与数理统计 主讲人:程述汉 苏本堂 例1 外地一良种小麦,外地一良种小麦,667m2产量产量(单位:单位:kg)服从正态分布服从正态分布N(400,252),引入本地试种,收获时任取,引入本地试种,收获时任取n=5块地,测得其块地,测得其667m2产量分别为产量分别为400、425、390、450、410,假定引种后,假定引种后667m2产量产量X也服从正态分布,试问:也服从正态分布,试问:(1)若方差不变,即)若方差不变,即X N(,252),本地平均产量,本地平均产量 与原产地与原产地的平均产量的平均产量 0=400kg有无显著变化?有无显著变化?(2)若)若X N(,252),本
4、地平均产量是否比原产地平均产量高,本地平均产量是否比原产地平均产量高(或低)?(或低)?(3)本地引种后,)本地引种后,667m2产量的波动情况与原产地产量的波动情况与原产地667m2产量产量的波动情况有无显著不同?的波动情况有无显著不同?例例2 2 检查检查200箱食品,用箱食品,用X表示一箱食品中变质食品的数量表示一箱食品中变质食品的数量(单位:包),(单位:包),n表示有表示有X包变质食品的箱数,检验结果如下:包变质食品的箱数,检验结果如下:X01234n132432032试问变质食品包数试问变质食品包数X是否服从泊松分布?是否服从泊松分布?山东农业大学 概率论与数理统计 主讲人:程述汉
5、 苏本堂 1.两类假设两类假设 检验是对假设而言的。假设是对事物的检验是对假设而言的。假设是对事物的某种某种“看法看法”或或“陈述陈述”,假设检验是要根据样本值,假设检验是要根据样本值去判断一个去判断一个 假设是否成立。假设分如下两种:假设是否成立。假设分如下两种:原假设原假设(或零假设或零假设)H0:通常是:通常是“相等性假设相等性假设”,例,例如如假定总体均值等于假定总体均值等于 0,总体方差等于,总体方差等于 02,总体分布为,总体分布为标准正态分布等。标准正态分布等。备择假设备择假设H1:在原假设被拒绝后可供选择的假设。备:在原假设被拒绝后可供选择的假设。备择假设择假设H1是和原假设是
6、和原假设H0不相容的。不相容的。原假设与备择假设选取以便于数学处理为宜。原假设与备择假设选取以便于数学处理为宜。假设检验的基本思想:假设检验的基本思想:带有概率特征的反证法。带有概率特征的反证法。山东农业大学 概率论与数理统计 主讲人:程述汉 苏本堂 例例1中,三个问题的假设分别表示为:中,三个问题的假设分别表示为:(1)H0:=0(=400);H1:0(=400)(2)H0:=0(=400);H1:0(=400)H0:=0(=400);H1:0(=400)(3)H0:2=02(=252);H1:2 02(=252)例例2的假设则可表示为:的假设则可表示为:H0:X服从泊松分布;服从泊松分布;
7、H1:X不服从泊松分布不服从泊松分布.下面以例下面以例1 1中问题中问题(1)(1)为例。阐明假设检验的基本思想和概念。为例。阐明假设检验的基本思想和概念。设设(x1,x2,xn)是来自总体是来自总体X的样本,则的样本,则x计,当计,当H0为真时为真时取值集中于取值集中于 0=400附近。如果附近。如果是总体均值的无偏估是总体均值的无偏估400 xk 这需要我们确定一个临界值这需要我们确定一个临界值k,使当,使当x离离 0较远,则有较远,则有理由理由怀疑怀疑H0的真实性,认为或许的真实性,认为或许H1更可靠。更可靠。时接受原假设时接受原假设H0;(1)400 xk时拒绝原假设时拒绝原假设H0接
8、受备择假设接受备择假设H1 (2)进一步,由于当进一步,由于当H0为真时,有为真时,有山东农业大学 概率论与数理统计 主讲人:程述汉 苏本堂400(0,1)25/xuNn要构造一个具有明确分布的统计量,可将要构造一个具有明确分布的统计量,可将(1)、(2)式转化为式转化为400|25/25/xkunn400|25/25/xkunn时接受原假设时接受原假设H0 (3)时拒绝原假设时拒绝原假设H0接受备择假设接受备择假设H1 (4)当当 较小时较小时,临界值,临界值u/2是小概率事件的分界线,使是小概率事件的分界线,使400|25/25/xkunn具有绝对优势具有绝对优势(即有较大概率即有较大概率
9、1-)。故取。故取225/kun山东农业大学 概率论与数理统计 主讲人:程述汉 苏本堂于是于是(3)、(4)式变为式变为2400|25/xuun2400|25/xuun时接受原假设时接受原假设H0 (5)时拒绝原假设时拒绝原假设H0,接受备择假设,接受备择假设H1 (6)分析分析(5)、(6)两式,可以这样认为:两式,可以这样认为:拒绝拒绝H0,是因为以,是因为以H0成立为出发点进行推理时,得到了不合情成立为出发点进行推理时,得到了不合情理的结论,使理的结论,使小概率事件在一次试验中发生了小概率事件在一次试验中发生了。接受接受H0,是因为以,是因为以H0成立为出发点进行推理时,成立为出发点进行
10、推理时,未发现异常未发现异常。这就是带有概率特征的反证法,这就是带有概率特征的反证法,认为小概率事件在一次试验中认为小概率事件在一次试验中不可能发生不可能发生。山东农业大学 概率论与数理统计 主讲人:程述汉 苏本堂 2.拒绝域与接受域拒绝域与接受域 称称 是是检验水平检验水平或或显著性水平显著性水平,它是我们制,它是我们制定检验标准的重要依据。常数定检验标准的重要依据。常数u/2把标准正态分布密度曲线下的把标准正态分布密度曲线下的区域分成了两大部分,其中一部分区域分成了两大部分,其中一部分 12/2(,)nx xxuu称为称为H0的的拒绝域或否定域拒绝域或否定域,当样本点落入拒绝域时,我们便拒
11、绝当样本点落入拒绝域时,我们便拒绝原假设原假设H0(同前述同前述(6)式式),另一部分,另一部分12/2(,)nx xxuu称为称为H0的的接受域接受域,当样本点落入接受域时,我们便接受原假设当样本点落入接受域时,我们便接受原假设H0(同前述同前述(5)式式)。鉴于鉴于u/2的这种特殊作用,称的这种特殊作用,称u/2为为H0的的临界值临界值(相对于例相对于例1的问的问题题(1),问题,问题(2)的的临界值临界值为为u,将在下面说明,将在下面说明)。进一步,可确定例进一步,可确定例1的问题的问题(2)中两个假设的拒绝域分别为中两个假设的拒绝域分别为12(,)nx xxuu12(,)nx xxuu
12、 与与山东农业大学 概率论与数理统计 主讲人:程述汉 苏本堂 3.双侧检验与单侧检验双侧检验与单侧检验 双侧检验双侧检验:拒绝域在接受域两侧的检验:拒绝域在接受域两侧的检验 单侧检验单侧检验:拒绝域和接受域各为一侧的检验称为。且拒绝域在:拒绝域和接受域各为一侧的检验称为。且拒绝域在接受域右边的检验,称为右边单侧检验;拒绝域在接受域左边的,接受域右边的检验,称为右边单侧检验;拒绝域在接受域左边的,称为左边单侧检验。称为左边单侧检验。4.两类错误两类错误 第一类错误:第一类错误:称为称为“弃真弃真”错误,即错误,即PH0被拒绝被拒绝/H0为真为真=第二类错误:第二类错误:称为称为“纳伪纳伪”错误,
13、即错误,即PH0被接受被接受/H0不真不真=我们希望这两类错误都很小。但可以证明,在样本容量我们希望这两类错误都很小。但可以证明,在样本容量n固定固定时,同时减小时,同时减小 和和是办不到的。当是办不到的。当 减小时必导致减小时必导致增大,反之亦增大,反之亦然。要想使然。要想使 和和同时减小,只有增大样本容量同时减小,只有增大样本容量n。一般是通过选择一般是通过选择 来控制来控制。质量要求高的检验,常选取较大的。质量要求高的检验,常选取较大的,质量要求不高的检验,可适当减小,质量要求不高的检验,可适当减小。山东农业大学 概率论与数理统计 主讲人:程述汉 苏本堂综上所述,我们可总结出假设检验的步
14、骤为:综上所述,我们可总结出假设检验的步骤为:(1)根据问题的要求提出假设,写明原假设)根据问题的要求提出假设,写明原假设H0和备择假设和备择假设H1的的具体内容。具体内容。(2)根据)根据H0的内容,建立(或选取)检验统计量并确定其分布。的内容,建立(或选取)检验统计量并确定其分布。(3)对给定(或选定)的显著性水平)对给定(或选定)的显著性水平 ,由统计量的分布查表,由统计量的分布查表或计算确定出临界值,进而得到或计算确定出临界值,进而得到H0的拒绝域和接受域。的拒绝域和接受域。(4)由样本观察值计算出统计量的值。)由样本观察值计算出统计量的值。(5)做出推断:当统计量的值满足)做出推断:当统计量的值满足“接受接受H0的条件的条件”时就接受时就接受H0,否则就拒绝,否则就拒绝H0接受接受H1。(6)完整准确地写出检验的结论。)完整准确地写出检验的结论。注注1 在双侧检验中,备择假设可以略去不写。在双侧检验中,备择假设可以略去不写。注注2 在假设检验中,当在在假设检验中,当在0.01 0.05下拒绝下拒绝H0时,通常称时,通常称差异显著,记作差异显著,记作“*”,在,在 0.01下拒绝下拒绝H0,通常称差异极显著,通常称差异极显著,记作记作“*”。