1、2023-7-304.1 4.1 单个样本的统计假设检验单个样本的统计假设检验4.2 4.2 两个样本的差异显著性检两个样本的差异显著性检验验第四章第四章 统计推断统计推断2023-7-30 总体与样本之间的关系总体与样本之间的关系从总体到样本的研究。从总体到样本的研究。由样本推断总体:样本统计量的分由样本推断总体:样本统计量的分布规律一般是布规律一般是正态分布正态分布、t 分布分布、2 2分布分布和和F分布分布。第四章第四章 统计推断统计推断2023-7-30 对总体做统计推断的两种途径,应用时可互相参对总体做统计推断的两种途径,应用时可互相参照使用照使用先对所估计的总体做一假设,然后通过样
2、本数先对所估计的总体做一假设,然后通过样本数据推断这个假设是否接受,这种途径称为据推断这个假设是否接受,这种途径称为统计统计假设检验假设检验(statistical test of hypothesis)通过样本统计量估计总体参数,称为通过样本统计量估计总体参数,称为总体参数总体参数估计估计 (estimation of population parameter)本章重点讲解本章重点讲解统计推断统计推断的一般原理以及对总体平的一般原理以及对总体平均数及标准差的推断。均数及标准差的推断。第四章第四章 统计推断(续)统计推断(续)2023-7-304.1.1 4.1.1 一般原理及两种类型的错误一
3、般原理及两种类型的错误假设假设零假设零假设,记为,记为H0,如果假设总体的平均数,如果假设总体的平均数等于等于某一给定的值某一给定的值0,即,即-0=0=0记为记为H0:-0=0=0备择假设备择假设与零假设相对的假设记为与零假设相对的假设记为HA它是在拒它是在拒绝绝H0的情况下,可供选择的假设如的情况下,可供选择的假设如HA:0 ,HA:0 及及 HA :0。备择假设的选定。备择假设的选定视实际情况而定。视实际情况而定。4.1 单个样本的统计假设检验单个样本的统计假设检验2023-7-30在一次试验中,几乎是不会发生的,若根在一次试验中,几乎是不会发生的,若根据一定的假设条件计算出来的该事件发
4、生据一定的假设条件计算出来的该事件发生的概率很小,而在一次试验中它竟然发生的概率很小,而在一次试验中它竟然发生了,则可认为原假设条件不正确,给予否了,则可认为原假设条件不正确,给予否定。定。在生物统计的显著性检验中,在生物统计的显著性检验中,通常取通常取5%或或1%小概率为显著性水平小概率为显著性水平,记为,记为“”小概率原理小概率原理2023-7-30 例:用实验动物作实验材料,现从一批动例:用实验动物作实验材料,现从一批动物中抽取含量物中抽取含量n =10=10的样本并已经计算出的样本并已经计算出平均值为平均值为10.23 10.23 g。要求动物满足平均体。要求动物满足平均体重重 =10
5、.00 g=10.00 g,=0.4=0.4 的正态分布总体,的正态分布总体,若若 10.00 g 10.00 g 10.00 g则应淘汰则应淘汰,问此批动物材料是否合适?,问此批动物材料是否合适?小概率原理用于显著性检验小概率原理用于显著性检验2023-7-30 解:解:1 1 样本平样本平均数满足何种均数满足何种分布?分布?82.11040.000.1023.100nxu小概率原理用于显著性检验(续)小概率原理用于显著性检验(续)2 2 从正态分布表查出从正态分布表查出P=0.03438 =0.03438 0,如下左图。,如下左图。下尾检验下尾检验(lower tailed test):拒
6、绝:拒绝H0后,后,接受接受 0 0,故为上尾,故为上尾单侧检验,当单侧检验,当 0.050.05时拒绝时拒绝H0,=0.05=0.05的上侧的上侧分位数分位数 0.050.05=1.645=1.645。4 4、结论结论:因为:因为 0.050.05所有拒绝所有拒绝H H0 0,接受,接受H HA A上上述样本很可能不是抽自述样本很可能不是抽自 N N(377.2,3.3(377.2,3.32 2)的总体,的总体,抽出样本的那个总体的平均数是大于抽出样本的那个总体的平均数是大于377.2377.2的某个的某个值,即栽培条件的改善显著提高了豌豆籽粒重量。值,即栽培条件的改善显著提高了豌豆籽粒重量
7、。4.1.3 已知单个平均数显著性检验:已知单个平均数显著性检验:u检验(续)检验(续)2023-7-30母猪的怀孕期为母猪的怀孕期为114114天,今抽测天,今抽测1010头母猪的怀头母猪的怀孕期分别为孕期分别为 116116、115115、113113、112112、114114、117117、115115、116116、114114、113113(天),试检验所得样本的平均数与总体平(天),试检验所得样本的平均数与总体平均数均数114114天有无显著差异?天有无显著差异?根据题意,本例根据题意,本例应进行双侧应进行双侧t t检验检验。1 1、提出无效假设与备择假设、提出无效假设与备择假设
8、210:H21:AH4.1.4 未知时平均数显著性检验:未知时平均数显著性检验:t检验检验2023-7-302 2、计算计算t t值值 1.581s 114.5x000.15.05.010581.11145.1140 xSuxt91101 ndf 3 3、查临界查临界t t值,作出统计推断值,作出统计推断 由由=9=9,查,查t t值表(附表值表(附表3 3)得)得t t0.050.05(9 9)=2.262=2.262,因为,因为|t t|0.050.05,故不能故不能否定否定H H0 0:=114=114,表明样本平均数与总体表明样本平均数与总体平均数差异不显著,可以认为该样本取自平均数差
9、异不显著,可以认为该样本取自母猪怀孕期为母猪怀孕期为114114天的总体。天的总体。4.1.4 未知时平均数显著性检验:未知时平均数显著性检验:t检验(续)检验(续)2023-7-30 一个混杂的小麦品种一个混杂的小麦品种,株高标准差株高标准差 0=14=14cm,cm,经经提纯后随机抽取提纯后随机抽取1010株株,它们的株高为它们的株高为:90,105,:90,105,101,95,100,100,101,105,93,97,101,95,100,100,101,105,93,97,考察考察提纯后的群体是否比原群体整齐提纯后的群体是否比原群体整齐?1 1、小麦株高是服从正态分布的随机变量小麦
10、株高是服从正态分布的随机变量 2 2、提出假设提出假设00:H0:AH 关于备择假设的说明:小麦经提纯后只关于备择假设的说明:小麦经提纯后只能变得更整齐,绝不会更离散,即能变得更整齐,绝不会更离散,即 只能只能小于小于 0 0,因此,因此H HA A:0 0。4.1.5 变异性的显著性检验:变异性的显著性检验:2检验检验2023-7-30 3 3、显著性水平规定显著性水平规定 0.050.05 4 4、统计量的值统计量的值:5 5、建立的拒绝域建立的拒绝域:因:因H HA A:0 0,故为下尾,故为下尾单侧检验,当单侧检验,当 2 2 2 21-1-时拒绝时拒绝H H0 0 ,从附表,从附表6
11、 6中可中可以查出以查出 2 29,0.99 9,0.99=2.09=2.09 6 6、结论结论,因,因 2 2 2 29,0.999,0.99,拒绝,拒绝H0 ,接受,接受HA ,提纯后株高比原株高整齐。提纯后株高比原株高整齐。11.1141.218)()1(22010122022iixxsn4.1.5 变异性的显著性检验:变异性的显著性检验:2检验(续)检验(续)2023-7-30小结小结2023-7-30 单个样本的显著性检验单个样本的显著性检验需要事先能够提出合理需要事先能够提出合理的参数假设值和对参数有某种意义的备择值的参数假设值和对参数有某种意义的备择值。然而,实际工作中很难提出,
12、故限制了实际应然而,实际工作中很难提出,故限制了实际应用。用。在实际应用时,常常选用两个样本,一个作为在实际应用时,常常选用两个样本,一个作为处理,一个作为对照,在这两个样本之间作比处理,一个作为对照,在这两个样本之间作比较,判定它们之间的差异是否用偶然性解释,较,判定它们之间的差异是否用偶然性解释,若不能用偶然性解释时,则认为它们之间存在若不能用偶然性解释时,则认为它们之间存在足够显著的差异,从而判断这两个样本来自两足够显著的差异,从而判断这两个样本来自两个不同的总体。个不同的总体。4.2 两个样本的显著性差异检验两个样本的显著性差异检验2023-7-30 1.1.假定从两个正态总体中假定从
13、两个正态总体中,独立地抽取含量分别独立地抽取含量分别为为n1 1和和n2 2的两个随机样本的两个随机样本,计算出计算出s12 2和和s22 2.总体总体平均数可以相等也可以不等平均数可以相等也可以不等.2.2.零假设零假设H0:1 1=2 2.备择假设备择假设HA:1 2 若已知若已知 1不可能小于不可能小于 2。HA :1 2 若已知若已知 1不可能大于不可能大于 2。HA :1 2 包括包括 1 2 2和和 1 2。3.3.显著性水平显著性水平:经常用:经常用 0.050.05和和 0.010.01两个两个水平。水平。4.2.1 4.2.1 两个方差的检验两个方差的检验(方差齐性分析)方差
14、齐性分析)F检验检验2023-7-30 4.4.统计检验量统计检验量:Fdf1,df2=s1 12 2/s2 22 2,df1=n1-1-1 df2=n2-1-1。5.5.建立建立H0的拒绝域的拒绝域:1 1 2 2,上尾单侧检验,上尾单侧检验,F F F F 时拒绝时拒绝 1 1 2 2,下尾单侧检验,下尾单侧检验,F F F F1 1 时拒时拒绝绝 1 12,2,,双侧检验,双侧检验,F F F F/2/2 及及F F F F1 1/2/2时拒绝。时拒绝。6.6.作出结论并解释作出结论并解释。4.2.1 4.2.1 两个方差的检验两个方差的检验(方差齐性分析)方差齐性分析)F F检验检验(
15、续)(续)2023-7-30测定了测定了2020位青年男子和位青年男子和2020位老年男子的血压值(收位老年男子的血压值(收缩压缩压mmHgmmHg)如表)如表5-25-2所示。问老年人血压值个体间的所示。问老年人血压值个体间的波动是否显著高于青年人?波动是否显著高于青年人?解:根据检验的基本程序:解:根据检验的基本程序:(1 1)人类血压值是)人类血压值是服从正态分布的随机变量服从正态分布的随机变量,而且,而且上述两样本是独立获得的。上述两样本是独立获得的。(2 2)假设假设:H H0 0:1 1=2 2 H HA A:1 12 2(由于老年人的血压值波动(由于老年人的血压值波动只会大于青年
16、人,单侧)只会大于青年人,单侧)例题例题2023-7-30(3 3)显著性水平显著性水平:根据问题的要求(是否显:根据问题的要求(是否显著),选著),选=0.05=0.05。(4 4)统计量的值统计量的值:F Fdf1,df2df1,df2=S=S1 12 2/s/s2 22 2,根据表中数,根据表中数据计算可得据计算可得S S1 12 2=193.4=193.4,s s2 22 2=937.7=937.7,故,故F=0.206F=0.206。(5 5)建立建立H H0 0的拒绝域的拒绝域:由于由于H HA A:1 12 2,故为,故为下尾单侧检验,当下尾单侧检验,当FFFF0.950.95时
17、拒绝时拒绝H H0 0。查表可得。查表可得F F19,19,0.9519,19,0.95=1/F=1/F19,19,0.0519,19,0.05=0.459=0.459(6 6)结论结论:FFF 2 24.2.2 4.2.2 标准差标准差(i i)已知时,两个平均已知时,两个平均数间差异显著性的检验数间差异显著性的检验u u检验检验2023-7-30 (3 3)显著性水平:)显著性水平:=0.05=0.05。(4 4)计算统计量的值:)计算统计量的值:u u=1.80=1.80。(5 5)建立)建立H H0 0的拒绝域:因的拒绝域:因H HA A:1 1 2 2,故,故为上尾单侧检验。当为上尾
18、单侧检验。当u u u u0.050.05时拒绝时拒绝H H0 0,由附,由附表查出表查出u u0.050.05=1.645=1.645。(6 6)结论:因)结论:因uuuu0.050.05,所以接受,所以接受H H0 0。结论。结论是第一渔场的马面是第一渔场的马面鲀鲀体长显著高于第二渔场体长显著高于第二渔场的。的。4.2.2 4.2.2 标准差标准差(i i)已知时,两个平均数间差异显已知时,两个平均数间差异显著性的检验著性的检验u u检验检验(续)(续)2221212121)()(nnxxu2023-7-30 检验程序与检验程序与5.2.25.2.2基本相同,只是所使用的统基本相同,只是所
19、使用的统计量不同,当两个总体的标准差相等时,检验计量不同,当两个总体的标准差相等时,检验统计量统计量t t由下式给出。由下式给出。)11()1()1()1()1()()(21212211212122221nnnnsnsnxxtnn4.2.3 4.2.3 标准差标准差(i i)未知,但相等时,两个平未知,但相等时,两个平均数间差异显著性的检验均数间差异显著性的检验成组数据成组数据t t检验检验2023-7-30 在在H H0 0:1 1=2 2下变为下变为4.2.3 4.2.3 标准差标准差(i i)未知,但相等时,两个平均数间差异显著未知,但相等时,两个平均数间差异显著性的检验性的检验成组数据
20、成组数据t t检验检验(续)(续))11()1()1()1()1()(212122112122221nnnnsnsnxxtnn 在平均数检验中应用最为广泛。在平均数检验中应用最为广泛。先做方差齐性检验(先做方差齐性检验(F-F-双侧检验)判断双侧检验)判断i i 是否相等;是否相等;按上式计算统计量按上式计算统计量t t,进行,进行t t检验以判断检验以判断两个平均数之间差异是否显著?两个平均数之间差异是否显著?2023-7-30 例例5.10 5.10 研究两种激素类药物对肾组织切研究两种激素类药物对肾组织切片的氧消耗的影响,结果是:研究第一种片的氧消耗的影响,结果是:研究第一种药物的样本数
21、为药物的样本数为9 9,平均数为,平均数为27.9227.92,样本,样本方差为方差为8.6738.673。研究第二种药物的样本数。研究第二种药物的样本数为为6 6,平均数为,平均数为25.1125.11,样本方差为,样本方差为1.8431.843。问两种药物对肾组织切片氧消耗的影响差问两种药物对肾组织切片氧消耗的影响差异是否显著?异是否显著?4.2.3 4.2.3 标准差标准差(i i)未知,但相等时,两个平均数间差异显著未知,但相等时,两个平均数间差异显著性的检验性的检验成组数据成组数据t t检验检验(续)(续)2023-7-30 解:第一步,做方差齐性检验:解:第一步,做方差齐性检验:H
22、 H0 0:1 1=2 2,H HA A:1 12 2 ,=0.05=0.05 F F8 8,5 5=8.673/1.843=4.71=8.673/1.843=4.71,F F8 8,5 5,0.0250.025=6.757=6.757F F8 8,5 5,0.9750.975=1/4.817=0.208,=1/4.817=0.208,F F8 8,5 5,0.9750.975FFF t t0.050.05,结论是在,结论是在=0.05=0.05水平上两种药物对肾组织切片氧消耗的水平上两种药物对肾组织切片氧消耗的影响刚刚达到显著。影响刚刚达到显著。4.2.3 4.2.3 标准差标准差(i i)
23、未知,但相等时,两个平均数间差异显著未知,但相等时,两个平均数间差异显著性的检验性的检验成组数据成组数据t t检验检验(续)(续)2023-7-30 若经若经F F(双尾)检验,发现(双尾)检验,发现1 12 2可用可用Aspin-WelchAspin-Welch检验检验。检验程序类似。检验程序类似5.2.35.2.3的成的成组数据组数据t t检验。检验。该检验的临界值仍由该检验的临界值仍由 t t表查出,自由度表查出,自由度由以下公式得出:由以下公式得出:2212)1(1dfkdfkdf4.2.4 4.2.4 标准差标准差(i)(i)未知且可能不相等时,未知且可能不相等时,两个平均数间差异显
24、著性的检验两个平均数间差异显著性的检验222121121nsnsnsk222211xxxsssk2023-7-30t t检验统计量见下式检验统计量见下式4.2.4 4.2.4 标准差标准差(i)(i)未知且可能不相等时,两个平均数间差未知且可能不相等时,两个平均数间差异显著性的检验异显著性的检验(续)(续)12112122nsnsxxtt t近似服从具有近似服从具有dfdf自由度的自由度的t t分布。若样本足分布。若样本足够大,则可以认为在零假设下,上式为标准够大,则可以认为在零假设下,上式为标准化的正态变量。化的正态变量。2023-7-30 例例5.11 5.11 两组类似的大鼠,一组做对照
25、,两组类似的大鼠,一组做对照,另一组做药物处理,然后测定血糖。已另一组做药物处理,然后测定血糖。已知对照组的样本数为知对照组的样本数为1212,平均数为,平均数为109.17109.17,样本方差为,样本方差为97.43097.430。经过催产。经过催产素药物处理组的样本数为素药物处理组的样本数为8 8,平均数为,平均数为106.88106.88,样本方差为,样本方差为7.2687.268。问药物对。问药物对大鼠血糖含量的影响是否显著?大鼠血糖含量的影响是否显著?例题例题2023-7-30解:第一步,做方差齐性检验:解:第一步,做方差齐性检验:H H0 0:1 1=2=2,H HA A:1 1
26、2 2 ,=0.05=0.05 F F11,711,7=97.430/7.268=13.41=97.430/7.268=13.41,F F1111,7 7,0.0250.025=4.714=4.714(如何查?)(如何查?)FF0.025FF0.025,结论是方差不具齐性(,结论是方差不具齐性(1 12 2)第二步,做平均数之间的差异显著性检验。第二步,做平均数之间的差异显著性检验。H H0 0:1 1=2 2,H HA A:1 12 2 ,=0.05=0.05;计算计算dfdf=13.35=13.35,统计量,统计量 t t=0.76=0.76。用线性内插法(如何查?)可以求出用线性内插法(
27、如何查?)可以求出t t13.35,0.0513.35,0.05(双侧)双侧)=2.15,=2.15,t t t|t|t0.010.01(9 9),P0.01P0.01,否定,否定H H0 0,接,接受受H HA A,表明家兔注射该批注射液前后体温,表明家兔注射该批注射液前后体温差异极显著,这里表现为注射该批注射液差异极显著,这里表现为注射该批注射液可使体温极显著升高。可使体温极显著升高。(三)、查临界(三)、查临界t t值,作出统计推断值,作出统计推断例题(续)例题(续)2023-7-30 配对法比成组法更容易检出两组数据平均数配对法比成组法更容易检出两组数据平均数之间的差异。之间的差异。平
28、均数及样本含量均相同的条件下,平均数及样本含量均相同的条件下,s s愈愈小则小则t t值愈大值愈大nssxxtn222121)1(24.2.64.2.6 配对法与成组法的比较配对法与成组法的比较ddSdnSdt2221222122SSrSSSd 所以配对法比成组法更容易检出两组数据平均所以配对法比成组法更容易检出两组数据平均数之间的差异。在条件许可的情况下,尽量把数之间的差异。在条件许可的情况下,尽量把实验安排成配对法做比较。实验安排成配对法做比较。2023-7-30小结小结小结小结小结小结2023-7-30结束结束结束结束结束结束5.4 5.4 已知我国已知我国1414岁的女学生,平均体重岁
29、的女学生,平均体重为为43.38kg43.38kg。从该年龄的女生中抽取。从该年龄的女生中抽取1010名运动员,其体重名运动员,其体重(kg)(kg)分别为:分别为:3939、3636、4343、4343、4040、4646、4545、4545、4242、4141。问这些运动员的平均体重,与。问这些运动员的平均体重,与1414岁女学生平均体重的差异是否显著?岁女学生平均体重的差异是否显著?作业:作业:P822023-7-30结束结束结束结束结束结束5.7 5.7 为了判断一种新的治疗高血压药物的为了判断一种新的治疗高血压药物的疗效是否显著,选取疗效是否显著,选取2020名患者做药效名患者做药效
30、实验,首先测量每人的血压值,然后实验,首先测量每人的血压值,然后服药,经过一段时间的治疗后,再测服药,经过一段时间的治疗后,再测其血压值,结果如下(舒张压其血压值,结果如下(舒张压/mmHg),/mmHg),用成组法和配对法两种方法推断这种用成组法和配对法两种方法推断这种新药治疗高血压是否有效。新药治疗高血压是否有效。作业:作业:P822023-7-30结束结束结束结束结束结束5.75.7作业:作业:P82鼠号鼠号1 12 23 34 45 56 67 78 89 91010治疗前治疗前11411715511411910214091135114治疗后治疗后9411412598121951049
31、510692鼠号鼠号1111121213131414151516161717181819192020治疗前治疗前103140136126108142114113116121治疗后治疗后871381121149114091881061122023-7-30结束结束结束结束结束结束 5.10 5.10 给幼鼠喂以不同饲料,研究每日钙的给幼鼠喂以不同饲料,研究每日钙的留存量留存量(mg)(mg)是否有显著不同,以两种方式是否有显著不同,以两种方式设计本实验。第一种方式:同一鼠先后喂设计本实验。第一种方式:同一鼠先后喂予不同饲料。予不同饲料。作业:作业:P8鼠号鼠号1 12 23 34 45 56 6
32、7 78 89 9A A饲料饲料33.133.126.836.339.530.933.431.528.6B B饲料饲料36.728.835.135.243.825.736.535.928.72023-7-30结束结束结束结束结束结束 5.10 5.10 第二种方式,甲组第二种方式,甲组1212只喂只喂A A饲料,乙组饲料,乙组9 9只喂只喂B B饲料。饲料。作业:作业:P8 以以=0.05=0.05的水平,检验每种方式中,两种不的水平,检验每种方式中,两种不 同饲料钙的留存量差异是否显著。并同饲料钙的留存量差异是否显著。并对结果加以解释。对结果加以解释。甲甲A A饲料饲料29.726.728.
33、931.133.126.836.339.530.933.431.528.6乙乙B B饲料饲料28.728.329.332.231.130.036.236.830.0 2023-7-30一、名词解释一、名词解释假设检验(显著性检验)假设检验(显著性检验)无效假设无效假设 备备择假设择假设 显著水平显著水平 型错误型错误 型错误型错误 双侧检验(双尾检验)双侧检验(双尾检验)单侧检验(单尾单侧检验(单尾检验)检验)成组设计成组设计 配对设计配对设计习习题题2023-7-30二、简答题二、简答题1 1、显著性检验的基本步骤是什么?根据什么、显著性检验的基本步骤是什么?根据什么确定显著水平?确定显著水
34、平?2 2、什么是统计推断?为什么统计推断的结论、什么是统计推断?为什么统计推断的结论有可能发生错误?有哪两类错误?如何降有可能发生错误?有哪两类错误?如何降低犯两类错误的概率?低犯两类错误的概率?3 3、配对试验设计与成组试验设计有何区别?、配对试验设计与成组试验设计有何区别?习题习题2023-7-30三、计算题三、计算题1 1、某鸡场种蛋常年孵化率为、某鸡场种蛋常年孵化率为85%85%,现有,现有100100枚种蛋枚种蛋进行孵化,得小鸡进行孵化,得小鸡8989只,问该批种蛋的孵化结果只,问该批种蛋的孵化结果与常年孵化率有无显著差异?与常年孵化率有无显著差异?2 2、随机抽测了、随机抽测了1010只兔的直肠温度,其数据为:只兔的直肠温度,其数据为:38.738.7、39.039.0、38.938.9、39.639.6、39.139.1、39.839.8、38.538.5、39.739.7、39.239.2、38.438.4(),已知该品种兔直肠温),已知该品种兔直肠温度的总体平均数度的总体平均数=39.5=39.5(),试检验该样本平),试检验该样本平均温度与是否存在显著差异?均温度与是否存在显著差异?习题习题