1、2022-11-19第七章 假设检验1第七章第七章 假设检验假设检验统计推论:根据样本的资料对总体的特征进行推统计推论:根据样本的资料对总体的特征进行推断。断。(1)由于样本资料来源于总体,因此样本资料)由于样本资料来源于总体,因此样本资料在某种程度上反映了总体。在某种程度上反映了总体。(2)由于抽样的结果不是唯一的,使得一次抽)由于抽样的结果不是唯一的,使得一次抽样的结果,不能恰好就等于总体的结果。样的结果,不能恰好就等于总体的结果。理论依据:概率论理论依据:概率论假设检验:通过样本对总体的某种假设进行检验。假设检验:通过样本对总体的某种假设进行检验。参数估计:用样本推论总体。参数估计:用样
2、本推论总体。2022-11-19第七章 假设检验2第一节第一节 二项分布二项分布实际中有两分变量的问题,而且二项分布简单实际中有两分变量的问题,而且二项分布简单明了,所以一般都从二项分布入手来理解统计明了,所以一般都从二项分布入手来理解统计检验。检验。一、二项分布的数学形式一、二项分布的数学形式特征:特征:1.每次试验只有两种可能结果。每次试验只有两种可能结果。2.各次试验互不影响。各次试验互不影响。3.每次试验成功的概率是固定的,已知的。每次试验成功的概率是固定的,已知的。进行进行N次实验,求次实验,求X次成功的概率次成功的概率:XnXXnqpCxXP)(2022-11-19第七章 假设检验
3、3二、二项分布讨论二、二项分布讨论1.二项分布为离散型随机变量的分布。二项分布为离散型随机变量的分布。2.当当P=0.5时二项分布的图形是对称的。时二项分布的图形是对称的。3.E(X)=np,D(X)=2=npq4.二项分布受二项分布受p和和n变化的影响,只要确定了变化的影响,只要确定了p和和n,成功次数,成功次数X的分布也随之确定。因此:的分布也随之确定。因此:B(X;n,p)5.二项分布概率值可查表求得。(附表二项分布概率值可查表求得。(附表2、3)nXpnxBXxPXF),;()()(2022-11-19第七章 假设检验4例:某特定社区人口的例:某特定社区人口的10%是少数是少数民族,现
4、随机抽取民族,现随机抽取6人,问其中恰人,问其中恰好好2人是少数民族的概率是多少?人是少数民族的概率是多少?2022-11-19第七章 假设检验5第二节第二节 统计检验的基本步骤统计检验的基本步骤如果实际抽样得到的结果偏巧就是先如果实际抽样得到的结果偏巧就是先验概率预示的最不可能的结果,我验概率预示的最不可能的结果,我们应该怎样对待?是认定纯属巧合,们应该怎样对待?是认定纯属巧合,还是对前提假设产生怀疑?还是对前提假设产生怀疑?2022-11-19第七章 假设检验6 基本思想基本思想小概率原理:小概率原理:如果对总体的某种假设是如果对总体的某种假设是的,那么不利于的,那么不利于或不能支持这一假
5、设的事件或不能支持这一假设的事件A(小概率事件)(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中几乎不可能发生的;要是,就有理由怀疑该假设的,就有理由怀疑该假设的真实性,真实性,这一假设。这一假设。总总 体体(某种假设)(某种假设)抽样抽样样样 本本(观察结果)(观察结果)检验检验(接受)(接受)(拒绝)(拒绝)小概率事件小概率事件未未 发发 生生小概率事件小概率事件发发 生生2022-11-19第七章 假设检验7假设的形式:假设的形式:H0原假设,原假设,H1备择假设备择假设 双侧检验:双侧检验:H0:=0,H1:0单侧检验:单侧检验:H0:=0,H1:0 H0:=0,H1:0
6、假设检验就是根据样本观察结果对原假设(假设检验就是根据样本观察结果对原假设(H0)进行检验,)进行检验,接受接受H0,就否定,就否定H1;拒绝;拒绝H0,就接受,就接受H1。2022-11-19第七章 假设检验8一、假设检验的基本概念:一、假设检验的基本概念:1、什么是统计假设?、什么是统计假设?先对总体的某一参数做一假设,然后用样本的统先对总体的某一参数做一假设,然后用样本的统计值去验证,以决定该假设是否为总体所接受。计值去验证,以决定该假设是否为总体所接受。2、虚无假设和研究假设:、虚无假设和研究假设:H0:(零假设)(零假设)=0;又叫原假设、无差别假;又叫原假设、无差别假设被检验的那个
7、假设。设被检验的那个假设。H1:(备择假设)(备择假设)0;根据调查资料作出的;根据调查资料作出的假设称为研究假设。这两个假设是绝对对立的。假设称为研究假设。这两个假设是绝对对立的。2022-11-19第七章 假设检验93、假设检验的基本原理:小概率原理、假设检验的基本原理:小概率原理(1)小概率事件在一次观测中是不可)小概率事件在一次观测中是不可能出现的。能出现的。(2)若一次观测中出现了小概率事件,)若一次观测中出现了小概率事件,则合理的想法是否定原事件是小概则合理的想法是否定原事件是小概率事件:推翻原假设。率事件:推翻原假设。2022-11-19第七章 假设检验104、显著性水平、显著性
8、水平:在原假设成立的条件下,统计检验中所规在原假设成立的条件下,统计检验中所规定的小概率标准。定的小概率标准。=0.05,=0.015、临界值、拒绝域、接受域、临界值、拒绝域、接受域所得结果是不太可能出现的结果,这些不所得结果是不太可能出现的结果,这些不太可能的结果称为拒绝域或否定域。太可能的结果称为拒绝域或否定域。2022-11-19第七章 假设检验116、双边检验(、双边检验(two-tailed)和单边检和单边检验验(one-tailed)H0:=0;H1:0称为双边检验问题;称为双边检验问题;拒绝域选择在变量分布的两侧。拒绝域选择在变量分布的两侧。而而 H0:=0;H1:0(或或 0)
9、,则称则称为单边检验问题;为单边检验问题;2022-11-19第七章 假设检验12 7、假设检验的两类错误:、假设检验的两类错误:(1)称)称 H0真而被拒绝的错误为第一类错误或弃真错真而被拒绝的错误为第一类错误或弃真错误;(误;(2)称称 H0假而被接受的错误为第二类错误或假而被接受的错误为第二类错误或取伪错误取伪错误 记记=p拒绝拒绝H0|H0真真;=p 接受接受H0|H0假假对于给定的一对对于给定的一对H0和和H1,总可找出许多临界域总可找出许多临界域,人们自然希望找到这种临界域人们自然希望找到这种临界域,使得犯两类错误的概使得犯两类错误的概率都很小。奈曼率都很小。奈曼皮尔逊皮尔逊(Ne
10、ymanPearson)提提出了一个原则出了一个原则“在控制犯第一类错误的概率不超过在控制犯第一类错误的概率不超过指定值指定值 的条件下的条件下,尽量使犯第二类错误尽量使犯第二类错误 小小”按这按这种法则做出的检验称为种法则做出的检验称为“显著性检验显著性检验”,称为显著称为显著性水平或检验水平。性水平或检验水平。2022-11-19第七章 假设检验13二、假设检验的步骤:二、假设检验的步骤:1.建立虚无假设和研究假设。建立虚无假设和研究假设。2.求抽样分布。求抽样分布。3.根据需要,选择适当的显著性水平,并查根据需要,选择适当的显著性水平,并查出临界值。出临界值。4.根据样本数据计算出统计值
11、。根据样本数据计算出统计值。5.将临界值与统计值的绝对值进行比较,若将临界值与统计值的绝对值进行比较,若统计值小于临界值,则接受虚无假设;若统计值小于临界值,则接受虚无假设;若统计值大于临界值,则拒绝虚无假设。统计值大于临界值,则拒绝虚无假设。2022-11-19第七章 假设检验14例:若想通过抛掷例:若想通过抛掷10次硬币的实验来检验这个硬币无次硬币的实验来检验这个硬币无偏的零假设,通过双侧检验偏的零假设,通过双侧检验0.10显著性水平,请指显著性水平,请指出否定域。如果单侧检验(出否定域。如果单侧检验(p0.4)2022-11-19第七章 假设检验15第三节第三节 正态分布正态分布不论总体
12、是否服从正态分布,只要样本不论总体是否服从正态分布,只要样本容量容量n足够大,样本平均数的抽样分布足够大,样本平均数的抽样分布就趋于正态分布。就趋于正态分布。正态分布是最重要的概率分布(正态分布是最重要的概率分布(1)许)许多自然现象和社会现象,都可用正态分多自然现象和社会现象,都可用正态分布加以叙述;(布加以叙述;(2)当样本足够大时,)当样本足够大时,都可用正态近似法解决变量的概率分布都可用正态近似法解决变量的概率分布问题;(问题;(3)许多统计量的抽样分布呈)许多统计量的抽样分布呈正态分布。正态分布。2022-11-19第七章 假设检验161.正态分布的数学形正态分布的数学形式:式:总体
13、均值和方差确总体均值和方差确定,正态分布曲定,正态分布曲线也就确定。线也就确定。222/)(21)(xexX222/)(21)(xexX2022-11-19第七章 假设检验17正态分布性质:正态分布性质:(1)正态曲线以)正态曲线以x=呈钟型对称,均值呈钟型对称,均值=中位数中位数=众数众数(2)在在x=处,概率密度最大;当区间离处,概率密度最大;当区间离越远,越远,x落在这个区间的概率越小。落在这个区间的概率越小。(3)正态曲线的外形由)正态曲线的外形由值确定。对于固定的值确定。对于固定的值,不同均值值,不同均值的正态曲线的外形完全相同,的正态曲线的外形完全相同,差别只在于曲线在横轴方向上整
14、体平移了一个差别只在于曲线在横轴方向上整体平移了一个位置位置 (4)对于固定的对于固定的值,改变值,改变值,值,值越小值越小尖、尖、越大越大平平(5)E(X)=,D(X)=22022-11-19第七章 假设检验18 2.标准正态分布标准正态分布Z分数(标准正态变量):分数(标准正态变量):一般正态分布可表示为:一般正态分布可表示为:N(,2)标准正态分布:标准正态分布:N(0,1)xz2/221)(ZeZ2022-11-19第七章 假设检验193.正态曲线下的面积:正态曲线下的面积:查标准正态分布表(查标准正态分布表(325)Z=1,2,-1例例1:设随机变量:设随机变量xN(25,25),)
15、,求(求(1)p(27x35)(2)p(x13)21)()(21xxdxxxxxpZdzzZF0)()(2022-11-19第七章 假设检验20练习:某市抽取练习:某市抽取1000户职工调查收入,户职工调查收入,分布近似服从正态分布,且知分布近似服从正态分布,且知1000户户家庭的家庭的 =925元,元,=75元,试求元,试求:(1)人均年收入在)人均年收入在850到到1000元的家元的家庭有多少户。庭有多少户。(2)半数中等收入家庭,每年收入约多)半数中等收入家庭,每年收入约多少元?少元?(3)年收入超过)年收入超过1080元的家庭有多少户?元的家庭有多少户?X2022-11-19第七章 假
16、设检验21第四节第四节 中心极限定理中心极限定理在推论统计中,作为研究对象的总体,在推论统计中,作为研究对象的总体,其分布总是未知的。中心极限定理其分布总是未知的。中心极限定理是对是对大样本均值呈正态分布性质的大样本均值呈正态分布性质的揭示揭示,为,为未知总体未知总体的研究奠定了理的研究奠定了理论基础。论基础。2022-11-19第七章 假设检验221.抽样分布抽样分布总体:总体参数,总体:总体参数,样本:统计量样本:统计量 ,s抽样分布:抽样分布:运用数理统计的方法,把抽样中具运用数理统计的方法,把抽样中具体概率赋予体概率赋予样本的所有可能结果样本的所有可能结果的一种的一种理论分布理论分布。
17、Xn2022-11-19第七章 假设检验232.正态总体的抽样分布定理:正态总体的抽样分布定理:如果从一个均值为如果从一个均值为,方差为,方差为2的的正态总体正态总体中中重复抽取一个容量为重复抽取一个容量为n的随机样本,样本均的随机样本,样本均值的抽样分布也将是正态的,并具有均值值的抽样分布也将是正态的,并具有均值和方差和方差2/n(1)虽然样本的均值和总体均值有差别,但我虽然样本的均值和总体均值有差别,但我们可期望这些样本均值聚集在总体均值周围。们可期望这些样本均值聚集在总体均值周围。(2)由于抽样分布的样本标准差为)由于抽样分布的样本标准差为所以当所以当n越大时,由样本推论总体也就越可靠。
18、越大时,由样本推论总体也就越可靠。n2022-11-19第七章 假设检验243.中心极限定理:中心极限定理:如果从一个均值为如果从一个均值为,方差为,方差为2的的总体总体中中重复抽取一个容量为重复抽取一个容量为n的随机样本,那么的随机样本,那么当当n变得很大时,样本均值的抽样分布接变得很大时,样本均值的抽样分布接近正态,并具有均值近正态,并具有均值和方差和方差2/n无论总体的分布多么异常,只要无论总体的分布多么异常,只要n足够足够大,得到的样本均值的抽样分布都接近大,得到的样本均值的抽样分布都接近正态,而我们正态,而我们在显著性检验中使用的正在显著性检验中使用的正是抽样分布是抽样分布。当当n1
19、00正态总体假设可以放宽;正态总体假设可以放宽;n50,同时表明总体分布与正态分布差异不大,同时表明总体分布与正态分布差异不大,可以使用;可以使用;n20 因为因为n小又不知小又不知值,因此用值,因此用t检验检验X5.39/3205.2310nSXT由由pT t0.05(9)=0.05,得得拒绝域为拒绝域为T t0.05(9)=1.8331因此拒绝因此拒绝H0,即可以认为在显著性水平为即可以认为在显著性水平为0.05的条件下,的条件下,该地区的初婚年龄超过该地区的初婚年龄超过20岁岁2022-11-19第七章 假设检验353.大样本成数的检验大样本成数的检验N30,np5统计量:统计量:npq
20、ppz2022-11-19第七章 假设检验36例:某地区成年男性中吸烟者占例:某地区成年男性中吸烟者占64%,经过,经过戒烟宣传后进行抽样调查,发现戒烟宣传后进行抽样调查,发现100名被名被调查者中,有调查者中,有55人是吸烟者,试问戒烟宣人是吸烟者,试问戒烟宣传是否有成效?传是否有成效?(=0.05)解:假设解:假设H0:p=0.64;H1:p0.64 单边检验单边检验,Z 0.05=1.65,故否定域为,故否定域为 计算统计值计算统计值 因此,否定零假设,即认为戒烟宣传收到了因此,否定零假设,即认为戒烟宣传收到了显著成效。显著成效。65.1z65.188.1100/36.064.064.0
21、55.0npqppz2022-11-19第七章 假设检验37练习:练习:1.为了检验统计报表的正确性,作了共为了检验统计报表的正确性,作了共50人的抽人的抽样调查,人均收入为样调查,人均收入为871元,标准差为元,标准差为21元,元,问能否证明统计报表中人均收入问能否证明统计报表中人均收入880元是正确元是正确的?的?(=0.05)2.许多人在周末睡懒觉以弥补工作日的睡许多人在周末睡懒觉以弥补工作日的睡眠不足。最佳睡眠协会的报告说,我们眠不足。最佳睡眠协会的报告说,我们之中有之中有61%的人在周末每夜睡眠多于的人在周末每夜睡眠多于7小时。从小时。从350个成年人的一组随机样本个成年人的一组随机
22、样本发现发现235人在上周末有多于人在上周末有多于7小时的睡眠。小时的睡眠。以以0.05的显著水平,这证据证明有的显著水平,这证据证明有61%以上该周末每夜多于以上该周末每夜多于7小时的睡眠吗?小时的睡眠吗?2022-11-19第七章 假设检验383.一家保险公司说,客户索赔的一家保险公司说,客户索赔的90%在在30天以内办好。天以内办好。为检验公司的这种说法,消协选取了为检验公司的这种说法,消协选取了75次公司索赔次公司索赔的一组随机样本,发现的一组随机样本,发现55次索赔在次索赔在30天内办好,他天内办好,他们有充分理由支持们有充分理由支持“在在30天内办好索赔小于天内办好索赔小于90%”
23、的论点吗?(的论点吗?(=0.05)4.通过试管受精(通过试管受精(IVF)怀孕的第一个婴儿怀孕的第一个婴儿1978年在英年在英格兰出生。在此后的格兰出生。在此后的20年间,年间,1000万妇女因为不育万妇女因为不育接受了这种护理,这种方法的平均成功率为接受了这种护理,这种方法的平均成功率为22.5%,但是随着技术的不断进步,其成功率还在不断上升。但是随着技术的不断进步,其成功率还在不断上升。假定使用假定使用IVF方法企图克服不育的方法企图克服不育的200个妇女的一项个妇女的一项最新研究证明,最新研究证明,61个是成功怀孕的。此结果证明样个是成功怀孕的。此结果证明样本的成功率比基于历史成功率所期望的更大吗?本的成功率比基于历史成功率所期望的更大吗?(=0.05)