1、计量资料的统计推断内容第一节第一节 标准误标准误第二节第二节 t 分布分布第三节第三节 总体均数的估计总体均数的估计第四节第四节 假设检验假设检验第五节第五节 未知总体与已知总体均数的比较未知总体与已知总体均数的比较第六节第六节 完全随机设计两总体均数的比较完全随机设计两总体均数的比较第一节第一节 标准误(标准误(Standard error)一、概念一、概念抽样误差:抽样误差:由于抽样引起的样本由于抽样引起的样本统计量统计量与总体与总体参数参数之之间的差异。间的差异。标准误标准误 :( x Sx) 表示抽样误差大小的指标;表示抽样误差大小的指标; 样本均样本均数的标准差。数的标准差。SPSS
2、结果中用结果中用std. error of mean 表示表示 3X 1S1X 2 S2 X ISiX nSnxX服从什么分布?567三、三、 (均数)标准误(均数)标准误意义:意义:反映抽样误差的大小。标准误越反映抽样误差的大小。标准误越小,抽样误差越小,用样本均数估计总小,抽样误差越小,用样本均数估计总体均数的可靠性越大。体均数的可靠性越大。与样本量的关系:与样本量的关系:S 一定,一定,n,标准,标准误误二、(均数)标准误的计算二、(均数)标准误的计算nssxAnalyze-Descriptive Statistics-Frequencies-Statistics-Dispersion-
3、S.E. mean-Continue-OK8SPSS计算标准误9哥塞特(W.S. Gosset,18761937)1908年,哥塞特首次以“学生”(Student)为笔名,在生物计量学杂志上发表了“平均数的概率误差”。由于这篇文章提供了“学生t检验”的基础,为此,许多统计学家把1908年看作是统计推断理论发展史上的里程碑。 戈塞特:t分布与小样本 由于“有些实验不能多次地进行”,从而“必须根据少数的事例(小样本)来判断实验结果的正确性” 10小样本思想小样本思想1112t 分布的图形(分布的图形(u 分布分布 是是t 分布分布的特殊形式)的特殊形式)13t 值表值表(附表(附表2 ) 左侧列:
4、自由度,左侧列:自由度, 上两行:概率,上两行:概率, p, 即曲线下阴影部分的面积即曲线下阴影部分的面积; 表中的数字:相应的表中的数字:相应的 |t | 界值。界值。t 值表规律:值表规律:(1) 自由度(自由度()一定时,)一定时,p 与与 t 成反比成反比;(2) 概率(概率(p) 一定时,一定时, 与与 t 成反比成反比; t分布类似于标准正态分布。 标准正态曲线的方差为1,而在小样本时可以证明t是大于1的,而当n无限大时,t趋向于1。 对于小的n值,t分布比标准正态分布要分散些,t依赖于两个随机变量: 当n无限增大时t的变异减少,事实上存在着整个一族的t分布。每一个样本容量n对应该
5、分布族的一个成员。 当n增大时,t分布就接近于正态分布,当n增至30以上时,t分布和正态分布几乎没有什么区别。15nsx和第三节第三节 总体均数的估计总体均数的估计统计推断的任务就是用样本信息推论总体特征。统计推断的任务就是用样本信息推论总体特征。参数估计,参数估计,用样本均数估计总体均数。用样本均数估计总体均数。 1、 点(值)估计(近似值)点(值)估计(近似值)2、 区间估计(近似范围)区间估计(近似范围)16171、点点(值值)估计(估计(point estimation):用样本均数直接作为总体均数的估计值,用样本均数直接作为总体均数的估计值, 未考虑抽样未考虑抽样误差。误差。 概念概
6、念:根据样本均数,按一定的根据样本均数,按一定的可信度可信度计算计算 出出总体均数很可能在的一个总体均数很可能在的一个数值范围数值范围,这个范,这个范围称为总体均数的围称为总体均数的可信区间可信区间(confidence interval, CI)。谁的区间?。谁的区间? 方法方法(但是在(但是在SPSS下程序相同)下程序相同)(1) u 分布分布 法法(2) t 分布法分布法182、区间估计、区间估计(interval estimation)19(1)u 分布分布 法法公式公式应用条件应用条件:例题例题意义:与正常值范围进行比较意义:与正常值范围进行比较(xus x,xu s x) 即(xu
7、s x)样本量较大, 已知或可计算出 x 及 Sx Analyze-Descriptive Statistics-Explore-身高Statistics-Descriptives-Continue-OK20SPSS求可信区间21DescriptivesDescriptives163.7430.37998162.9890164.4970163.7522163.650014.4393.79985154.70173.6018.905.05-.030.241-.250.478MeanLower BoundUpper Bound95% ConfidenceInterval for Mean5% Tri
8、mmed MeanMedianVarianceStd. DeviationMinimumMaximumRangeInterquartile RangeSkewnessKurtosis身高Statistic Std. Error可信区间22StatisticsStatistics身高1000163.7430.379983.79985155.9675170.8850ValidMissingNMeanStd. Error of MeanStd. Deviation2.597.5Percentiles正常值范围 换句话说,做出校全体女大学生身高均数为换句话说,做出校全体女大学生身高均数为163.0 -
9、 164.5cm的结论,说对的概率是的结论,说对的概率是95%,说错的,说错的概率是概率是5%;做出校全体女大学生身高均数为;做出校全体女大学生身高均数为162.7 164.7cm的结论,说对的概率是的结论,说对的概率是99%,说错的概率是,说错的概率是1%。(可信区间)意义:(可信区间)意义:虽然不能知道某校全体女大学生身高均数的虽然不能知道某校全体女大学生身高均数的确切数值,全体女大学生身高均数在确切数值,全体女大学生身高均数在163.0 - 164.5cm之间的可能性是之间的可能性是95%,在,在 162.7 164.7cm之之间的可能性是间的可能性是99%。24(2)t 分布分布 法法
10、公式公式(x ts x,xt s x) 即(xts x)25区间估计的准确度:区间估计的准确度:说对的可能性大小,说对的可能性大小, 用用 (1- ) 来衡量。来衡量。99%的可信区间好于的可信区间好于95%的可信区间的可信区间(n, S 一定时)一定时) 。区间估计的精确度:区间估计的精确度:指区间范围的宽窄,范围越指区间范围的宽窄,范围越宽精确度越差。宽精确度越差。99%的可信区间的可信区间差于差于95%的可信区间的可信区间(n, S 一定时)一定时) 。 准确度与精确度的关系:准确度与精确度的关系:(例如预测孩子的身高)(例如预测孩子的身高)26正常值范围正常值范围概念:概念:绝大多数正
11、常人的某指绝大多数正常人的某指标范围。(标范围。(95%,99%, 指绝指绝大多数正常人)大多数正常人)计算公式:计算公式:SPSS程序:百分位数法程序:百分位数法用途:判断观察对象的某用途:判断观察对象的某项指标是否正常项指标是否正常.可信区间可信区间概念:概念:总体均数所在的数值总体均数所在的数值范围(范围( 95%,99% 指可信度)指可信度)计算公式:计算公式:SPSS程序:程序:用途:估计总体均数用途:估计总体均数正常值范围估计与可信区间估计正常值范围估计与可信区间估计第四节第四节 假设检验假设检验也叫也叫显著性检验显著性检验;科研数据处理的重要工具科研数据处理的重要工具;某事发生了
12、:某事发生了: 是由于碰巧?还是由于必然是由于碰巧?还是由于必然的原因?统计学家运用显著的原因?统计学家运用显著性检验来处理这类问题。性检验来处理这类问题。27假设检验:假设检验:1、原因2、目的3、原理4、过程(步骤)、过程(步骤)5、结果 从两个总体中进行随机抽样,得到两个样本均数从两个总体中进行随机抽样,得到两个样本均数X1、X2。 X1、X2不同不同。不同的原因是什么?。不同的原因是什么? X1、X2 不同有两种(而且只有两种)可能:不同有两种(而且只有两种)可能:(1)分别所代表的总体均数相同,由于抽样误差造)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别无显著性成
13、了样本均数的差别。差别无显著性 。(2)分别所代表的总体均数不同。差别有显著性。)分别所代表的总体均数不同。差别有显著性。以两种改善骨质疏松的药为例以两种改善骨质疏松的药为例291、假设检验的原因、假设检验的原因2、假设检验的目的、假设检验的目的l判断是由于何种原因造成的不同,以做出决策。反证法:当一件事情的发生只有两种可能反证法:当一件事情的发生只有两种可能A和和B,为,为了肯定其中的一种情况了肯定其中的一种情况A,但又不能直接证实,但又不能直接证实A,这,这时否定另一种可能时否定另一种可能B,则间接的肯定了,则间接的肯定了A。概率论(小概率):如果一件事情发生的概率很小,概率论(小概率):
14、如果一件事情发生的概率很小,那么在进行一次试验时,我们说这个事件是那么在进行一次试验时,我们说这个事件是“不会发不会发生的生的”。从一般的常识可知,这句话在大多数情况下。从一般的常识可知,这句话在大多数情况下是正确的,但是它一定有犯错误的时候,因为概率再是正确的,但是它一定有犯错误的时候,因为概率再小也是有可能发生的小也是有可能发生的。 建立假设:建立假设: 确定显著性水平(确定显著性水平( ):): 计算统计量:计算统计量:u, t, 2 确定概率值:确定概率值: 做出推论做出推论324、假设检验的一般步骤、假设检验的一般步骤 为了比较国产药和进口药对治疗更年期妇女骨质疏松效果是否相同,采取
15、随机双盲的临床试验方法。国产药组20例,进口药组19例,评价指标为第2-4腰椎骨密度的改变值(骨密度.sav)。33 1 -5.00 1 64.00 1 63.00 1 77.00 1 74.00 1 25.00 1 38.00 1 68.00 1 45.00 1 29.00 1 9.00 1 77.00 1 -2.00 1 89.00 1 77.00 1 63.00 1 70.00 1 36.00 1 82.00 1 -14.00 2 -17.00 2 48.00 2 47.00 2 60.00 2 58.00 2 11.00 2 23.00 2 52.00 2 30.00 2 15.00
16、2 -4.00 如何建立数据库?(1 1). . 建立假设建立假设检验假设或者称无效假设检验假设或者称无效假设(null hypothesis),用H H0 0表示, (反证法)(反证法) H H0 0是假设两总体均数相等: 。备择假设备择假设(alternative hypothesis),用H H1 1表示。H1是与H0相反的假设,假设两总体均数不相等: 。(2)确定显著性水平(概率论思想)(significance level ) 显著性水平()就是我们用来区分大概率事件和小概率事件的标准,是人为规定的。当某事件发生的概率小于时,则认为该事件为小概率事件,是不太可能发生的事件。通常 取0
17、.05 或 0.01。游戏规则(3)计算统计量计算统计量 根据资料类型与分析目的选择适当的公式计算出统计量,比如计算出 u 值 或 t 值。( 出现大t或小t的解释 ) 注意:在检验假设( H0 )成立的情况下,才会出现的分布类型或公式。37计算公式及意义:计算公式及意义: t 统计量统计量: t =自由度自由度 = n1+n2 221|21xxSxx)11(21221nnSScxx2) 1() 1(212221212nnnSnSScH0成立时,该公式成立!成立则意味着: Analyze-Compare Means-Independent Samples T test-test Variabl
18、e-Grouping-Define Groups-1,2-Continue-OK3839Group StatisticsGroup Statistics2048.250031.988287.152801936.368427.649016.34312分组12骨密度差NMeanStd. DeviationStd. ErrorMeanI In nd de ep pe en nd de en nt t S Sa am mp pl le es s T Te es st t.629.433 1.23837.223 11.881589.59672-7.5632331.326381.24336.686.222
19、 11.881589.56021-7.4948531.25801Equal variancesassumedEqual variancesnot assumed骨密度差FSig.Levenes Test forEquality of Variancestdf Sig. (2-tailed)MeanDifferenceStd. ErrorDifference Lower Upper95% ConfidenceInterval of theDifferencet-test for Equality of Means40t 统计量:统计量: t = 1.238;自由度:自由度:20+ 19 2 =
20、37表中:表中: t 0.05(37) = 2.026(4)确定概率值(确定概率值(P,在,在spss程序上用程序上用Sig.表表示示) 将计算得到的 t值与查表得到t,,比较 ,得到 P值的大小。根据t分布我们知道,如果| t | u ,则 P ;如果| t | 。本例中:本例中:t 0.05; (5)作出结论作出结论 p,H0: ,得到大于现有统计量t值的可能性p大于,不属于小概率事件,则不拒绝H0,差别无统计学意义,结论:认为认为 两组药疗效相同。两组药疗效相同。可以用国可以用国产药代替进口药产药代替进口药。如果p 1.96, p 0.05 = , 小概率事件发生了,原小概率事件发生了,
21、原假设不成立;拒绝假设不成立;拒绝H0 , 接受接受H1, 可认为:可认为:某校女大学某校女大学生身高均数与一般女子身高均数不同生身高均数与一般女子身高均数不同;某校女大学某校女大学生身高均数与一般女子身高均数生身高均数与一般女子身高均数差别有显著性。差别有显著性。 确定概率值:确定概率值: |u|=9.58 u = 1.96 u u p t0.05(25) , p 0.05 做出推论做出推论: p 0.05 , 小概率事件发生了,原假设不成立;小概率事件发生了,原假设不成立;拒绝拒绝H0 , 接受接受H1, 可认为:可认为:常参加体育锻炼的中学男常参加体育锻炼的中学男生的心率与一般中学生不同
22、;常参加体育锻炼的中学生的心率与一般中学生不同;常参加体育锻炼的中学男生的心率比一般中学生心率慢;常参加体育锻炼的男生的心率比一般中学生心率慢;常参加体育锻炼的中学男生的心率与一般中学生差别有显著性。中学男生的心率与一般中学生差别有显著性。xSx0 Analyze-Compare Means-One Sample T test-test Variable-Option-Confidence Interval-Continue-OK ( u与与t检验程序相同)检验程序相同)58SPSS进行单一样本的假设检验59One-Sample StatisticsOne-Sample Statistics1
23、665.62507.200691.80017心率NMeanStd. DeviationStd. ErrorMeanO On ne e- -S Sa am mp pl le e T Te es st t-4.65215.000-8.37500-12.2120-4.5380心率tdfSig. (2-tailed)MeanDifferenceLowerUpper95% ConfidenceInterval of theDifferenceTest Value = 74 例题: 为了比较国产药和进口药对治疗更年期妇女骨质疏松效果是否相同,采取随机双盲的临床试验方法。国产药组20例,进口药组19例,评价
24、指标为第2-4腰椎骨密度的改变值(骨密度.sav)。60第六节第六节 完全随机设计完全随机设计两总体均数的比较两总体均数的比较61 1 -5.00 1 64.00 1 63.00 1 77.00 1 74.00 1 25.00 1 38.00 1 68.00 1 45.00 1 29.00 1 9.00 1 77.00 1 -2.00 1 89.00 1 77.00 1 63.00 1 70.00 1 36.00 1 82.00 1 -14.00 2 -17.00 2 48.00 2 47.00 2 60.00 2 58.00 2 11.00 2 23.00 2 52.00 2 30.00 2
25、 15.00 2 -4.0062目的:目的:由两个样本均数的差别推断两样本由两个样本均数的差别推断两样本 所代表的总体均数间有无差别。所代表的总体均数间有无差别。 计算公式及意义:计算公式及意义: t 统计量统计量: t =自由度自由度 = n1+n2 221|21xxSxx)11(21221nnSScxx2) 1() 1(212221212nnnSnSSc63例题:例题:已知:已知:(1)一个样本一个样本: 均数均数48.25, 标准差标准差32.0; 另一个样本另一个样本:均数均数36.37, 标准差标准差27.65;(2) n1=20; n2=1964 建立假设:建立假设:检验假设检验假
26、设:两组药疗效相同;:两组药疗效相同; 备择假设备择假设 :两组药疗效不同;两组药疗效不同; 确定显著性水平(确定显著性水平( ):):0.0565 计算统计量:计算统计量:t 统计量:统计量: t = 1.238;自由度:自由度:20+ 19 2 = 37表中:表中: t 0.05(37) = 2.026 确定概率值:确定概率值: t 0.05; 做出推论做出推论: 因为因为 p 0.05 , 不能拒绝不能拒绝H0:认为认为 两组药疗效相同。可以用国产药代替进口药两组药疗效相同。可以用国产药代替进口药。66Analyze-Compare Means-Independent Samples T
27、 test-test Variable-Grouping-Define Groups-1,2-Continue-OK67什么是配对设计资料? 将可能影响指标的一些特征相同或近似的两个个体配成一对,然后按照随机化方法将每个对子内的两个个体用不同的两种方法进行处理。对处理的结果进行分析。有哪几种形式?68dSd|0|dSd69例题: 为考察一种新型透析疗法的效果,随机抽取了10名病人测量透析前后的血中尿素氮含量如下表,请根据本实验资料对此疗法进行评价。(数据见touxi.sav) 病人序号透析前透析后 131.618.2 220.7 7.3 336.426.5 433.123.7 529.522.
28、6 620.710.7 750.325.1 831.220.9 936.623.71028.116.570. H0:d = 0 H1:d 0. 确定显著性水平 = 0.05 . 计算统计量: t =7.826. 确定概率:=10 - 1=9。 查表 t 0.05(9) =2.262 t = 7.826 t 0.05(9) p 0.05. 判断结果:因为p 0.05,故拒绝检验假设H0, 10名病人透析前后血中尿素氮含量差异有显著性,即透析可以降低血中尿素氮含量。 Analyze-Compare Means-Paired Samples T test-Paired Variable-OK71SP
29、SS进行配对样本的假设检验72Paired Samples StatisticsPaired Samples Statistics31.820108.52412.695519.520106.36112.0116透析前透析后Pair1MeanNStd. DeviationStd. ErrorMeanP Pa ai ir re ed d S Sa am mp pl le es s T Te es st t12.30004.96991.57168.744715.85537.8269.000透析前 - 透析后Pair 1MeanStd. DeviationStd. ErrorMeanLowerUppe
30、r95% ConfidenceInterval of theDifferencePaired DifferencestdfSig. (2-tailed)73741、正确理解假设检验的结论(概率性)、正确理解假设检验的结论(概率性)假设检验的结论是根据概率推断的,所以不是绝对假设检验的结论是根据概率推断的,所以不是绝对正确的:正确的:(1)当 p , 不能拒绝不能拒绝 H0, 不能接受不能接受H1,按不能接,按不能接受受H1下结论,也可能犯错误,下结论,也可能犯错误,没有没有拒绝实际上不拒绝实际上不成立的成立的H0 , 这类称为这类称为 II 类类错误错误( “存伪存伪”的错的错误误), 其概率
31、大小用其概率大小用 表示表示, , 值一般不能确切值一般不能确切的知道的知道(存伪存伪是指两总体均数不相等)。是指两总体均数不相等)。76 II 类错误的概率类错误的概率 值的值的两个规律:两个规律:1. 当样本量一定时当样本量一定时, 愈小愈小, 则则 愈大愈大,反之反之;2.2.当当 一定时一定时, 样本量增加样本量增加, 减少减少. .(什么时候犯(什么时候犯,什么时候犯,什么时候犯II 类错误?类错误?)772. 统计学中的差异显著或不显著,和日常生统计学中的差异显著或不显著,和日常生活中所说的差异大小概念不同活中所说的差异大小概念不同. (不仅区别于均数差异(不仅区别于均数差异的大小,还区别于均数变异的大小的大小,还区别于均数变异的大小)选择假设检验方法要注意符合其应用条件;选择假设检验方法要注意符合其应用条件;当不能拒绝当不能拒绝H0时,即差异无显著性时,应考虑时,即差异无显著性时,应考虑 的因素:可能是样本例数不够;的因素:可能是样本例数不够; 单侧检验与双侧检验的问题单侧检验与双侧检验的问题