1、1统计学的基本问题统计学的基本问题:样本特征样本特征 参数估计参数估计总体特征总体特征 假设检验假设检验参数估计参数估计:根据样本统计量的值估计总体参数:根据样本统计量的值估计总体参数的值。(均数,置信区间)的值。(均数,置信区间) 假设检验:假设检验:由样本间存在的差别对样本所代表由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。(均数,的总体间是否存在着差别做出判断。(均数,小概率原理)小概率原理)抽样误差抽样误差2l回答的问题不同回答的问题不同假设检验用于推断两总体均数有无假设检验用于推断两总体均数有无差别差别(即质的不同即质的不同),而可信区间用于,而可信区间用于推断总体均
2、数在哪个范围推断总体均数在哪个范围(即量的大即量的大小小)。l可信区间亦可用于回答假设检验的可信区间亦可用于回答假设检验的问题问题3l 可信区间比起假设检验还可提供一些其可信区间比起假设检验还可提供一些其它的信息,如回答它的信息,如回答有无实际意义有无实际意义等。等。l假设检验得到的值可以精确地说明结假设检验得到的值可以精确地说明结论的论的概率保证概率保证,而可信区间却不能严格,而可信区间却不能严格的提供精确的概率。的提供精确的概率。l在做出结论时在做出结论时,最好同时给出假设检验,最好同时给出假设检验的的检验统计量值检验统计量值和和p值值以及以及可信区间可信区间。4J(1) 当当拒绝拒绝 H
3、0 时时, 可能犯错误,可能可能犯错误,可能拒绝了拒绝了实际上成立的实际上成立的H0, 称为称为 类类错误错误( “弃真弃真”的错误的错误 ),),其概率大小用其概率大小用 a a 表示表示。 J(2)当)当不能拒绝不能拒绝 H0 时,也可能犯错误,时,也可能犯错误,没没有有拒绝实际上不成立的拒绝实际上不成立的H0 , 这类称为这类称为 II 类类错误错误( ”存伪存伪”的错误的错误), 其概率大小用其概率大小用 表示表示, , 值一般不能确切的知道值一般不能确切的知道。5110 0H0H1X1X26t 检验检验7lt分布分布(第六章第节)(第六章第节)l单样本均数的检验单样本均数的检验l配对
4、样本均数的检验配对样本均数的检验l两独立样本均数的检验两独立样本均数的检验l两独立样本方差的齐性检验两独立样本方差的齐性检验lt检验检验l变量代换变量代换第十章第十章8l当样本含量较大时,其均数的抽样分布将当样本含量较大时,其均数的抽样分布将趋于正态分布,如果从正态总体中抽样,趋于正态分布,如果从正态总体中抽样,英国统计学家英国统计学家W. S.Gosset导出了样本均数导出了样本均数的确切分布的确切分布- t分布。分布。l应用条件应用条件:正态分布:正态分布 方差相等方差相等(1=2)l适用对象:适用对象:检验总体标准差检验总体标准差未知未知的的小样小样本本均数均数 9l设(设(X1、X2、
5、Xn)为来自正态分布总体)为来自正态分布总体N(,)的样本,则统计量)的样本,则统计量t 服从自由度为服从自由度为(=n-1)的的t分布。分布。nSx/t_10 t t,的含义的含义t t 值表值表纵标目:自由度,纵标目:自由度, 横标目:概率。横标目:概率。p, 即曲线下阴影部分的面积即曲线下阴影部分的面积; 表中的数字:相应的表中的数字:相应的 |t | 界值界值 t t 值表规律:值表规律:(1) 自由度(自由度()一定时,一定时,p 越小,越小, t 越大越大;(2) 概率(概率(p) 一定时,一定时, 越大,越大, t 越小越小;11目的:目的:比较一个小样本均数所代表的未比较一个小
6、样本均数所代表的未知总体的均数与已知总体的均数有无差知总体的均数与已知总体的均数有无差别。别。12计算公式:计算公式: t 统计量:统计量: t = 自由度:自由度:u u = n 1, 查查 t 界值表用界值表用X 0S / (n) 1/213 适用条件:适用条件:(1) 已知一个总体均数;已知一个总体均数;(2) 可得到一个样本均数及该样本标准可得到一个样本均数及该样本标准误;误;(3) 样本量样本量小于小于100或或小于小于60 ;(4) 样本来自正态或近似正态总体。样本来自正态或近似正态总体。14例题:例题: p.152, 例例10-1已知:某地新生婴儿的体重均数已知:某地新生婴儿的体
7、重均数3.30kg, 现测得现测得某医院某医院25个难产婴儿的平均体重是个难产婴儿的平均体重是3.42kg, 标准标准差是差是0.42kg, 问该医院难产婴儿均重是否与当地问该医院难产婴儿均重是否与当地的新生儿有差别的新生儿有差别?(1) 一个总体均数:一个总体均数:3.30kg ;(2) 一个样本均数:一个样本均数:3.42kg ;(3) 可计算出样本标准误:可计算出样本标准误:0.42/ 5(4) n =25 1.77 , p 0.05 做出推论做出推论: p a a, 不是一个小概率事件,故原假设可能成立;不是一个小概率事件,故原假设可能成立;接受接受H0 , 拒绝拒绝H1, 可认为:可
8、认为: 难产儿平均出生体重与一般婴儿平均出生难产儿平均出生体重与一般婴儿平均出生体重差别尚无统计学意义。体重差别尚无统计学意义。 17l配对资料配对资料 自身配对自身配对:同一对象接受两种方法的处理同一对象接受两种方法的处理异体配对异体配对:相近实验条件对象配对,分别给予两相近实验条件对象配对,分别给予两种不同的处理方法种不同的处理方法 l方法:方法:1.计算差值的均数计算差值的均数2.计算差值的标准误计算差值的标准误 P154 (10-2)3.计算检验量计算检验量4.查界值表,做出结论,(自由度:对子数查界值表,做出结论,(自由度:对子数 1 )5.Page 154,例例10-218表表9
9、15对孪生兄弟的出生体重对孪生兄弟的出生体重(kg)编号编号 12.792.690.1023.062.890.1732.342.240.1043.413.370.0453.483.50-0.0263.232.930.3072.272.240.0382.482.55-0.0793.032.820.21103.073.050.02113.613.580.03122.692.660.03133.093.20-0.11142.982.920.06152.652.600.050.06 30.027ddS12iiidxx后出生者体重后出生者体重先出生者体重先出生者体重H0:d d0 0H1:d d0 01
10、9例的假设检验例的假设检验20目的:目的:由两个样本均数的差别推断两样本由两个样本均数的差别推断两样本 所代表的总体均数间有无差别。所代表的总体均数间有无差别。 计算公式及意义:计算公式及意义: t 统计量:统计量:t = 自由度:自由度:= n1 + n2 2 X1 X2(Sc2 (1/n1 + 1/n2) 1/2222222111222211221212/( -1)( -1)-1-1-2cXXnXXnnSnSSnnnn()()21 适用条件:适用条件:(1)已知)已知/可计算两个样本均数及它们的标准差可计算两个样本均数及它们的标准差 ;(2)两个样本之一的例数少于)两个样本之一的例数少于6
11、0;(3)样本都来自正态或近似正态总体;样本都来自正态或近似正态总体;(4)方差齐方差齐。22例题:例题: p. 155, 例例10-3(1)白血病鼠样本白血病鼠样本: 均数均数14.64, 标准差标准差1.62 (mg/g); 正常鼠样本正常鼠样本:均数均数12.74, 标准差标准差1.33 (mg/g);(2) n1=7; n2=7(3) 方差齐:方差齐:1.62/1.33 t 0.05/2,12 , p 0.05; 24 做出推论做出推论: 因为因为 p 0.05 = a a, 拒绝拒绝H0 , 接受接受H1 :可认为正常鼠和白血病鼠脾脏中可认为正常鼠和白血病鼠脾脏中平均含量有差别,白血
12、病鼠脾脏中平均含量有差别,白血病鼠脾脏中平均含量要高于正常鼠。平均含量要高于正常鼠。25例题:例题: 例例7已知:已知:25个个心肌梗塞病人血清心肌梗塞病人血清 脂蛋白与脂蛋白与23个正常人血个正常人血清清 脂脂蛋蛋白均数分别是白均数分别是491.4和和672.3mg/100ml, 它们它们的标准差分别是的标准差分别是135.8和和150.7mg/100ml, 问问.是否相是否相同同?(1)一个样本一个样本: 均数均数491.4, 标准差标准差138.5 (mg/100ml); 另一个样本另一个样本:均数均数672.3, 标准差标准差150.7 (mg/100ml);(2) n1=25; n2
13、=23(3) 近似正态分布:近似正态分布:138.52 491.4; 150.72 672.3 (4) 方差齐:方差齐:25/23 t 0.05(46) , p 0.05; 28 做出推论做出推论: 因为因为 p 0.05 =a a, 拒绝拒绝H0 , 接受接受H1 :可认为心肌梗塞病人血清可认为心肌梗塞病人血清 脂旦白脂旦白与正常人血清与正常人血清 脂旦白均数不同;脂旦白均数不同; 两样两样本均数差别有显著性。本均数差别有显著性。29 方差相等,方差相等, t检验检验 样本数样本数n小小 方差不齐,校正方差不齐,校正 t检验检验样本数样本数n大大 :u检验检验30检验方法检验方法采用采用F
14、F检验,检验两样本方差不等是否由于抽样误检验,检验两样本方差不等是否由于抽样误差所至。差所至。F F值的计算公式:值的计算公式: F= SF= S1 12 2/S/S2 22 2 , 其中其中S S1 12 2 为较大样本方差;为较大样本方差; S S2 22 2 为较小样本方差为较小样本方差查方差齐性检验用查方差齐性检验用F F界值表界值表得得F F界值界值 F F0.05/2,1,20.05/2,1,2, ,用用F F和和F F比较,得比较,得P P值范围值范围作结论:作结论:FF 接受接受H H0 0 、拒绝、拒绝H H1 1, , 两总体方差齐两总体方差齐FFF F P P 接受接受H
15、 H1 1 、拒绝、拒绝 H H0 0, , 两总体方差不齐两总体方差不齐1.Page 156,例例10-43132333435ltt值值 和和 t t的计算公式的计算公式lt t是两个是两个t t界值加权均数界值加权均数, ,作为比较的作为比较的t t界值。界值。l用用tt值值 和和 t t比较,得比较,得P P值范围,作值范围,作结论:结论:t 接受接受H0 ,拒绝拒绝H1, 差异无统计学意义差异无统计学意义t t P 接受接受H1,拒绝拒绝 H0, 差异有统计学意义差异有统计学意义 Page 157,例例10-536lPage161l1、下次课,下次课, 第十一章第十一章 方差分方差分析析