1、统计分析,统计描述,统计推断,用统计指标、统计表和统计图来描述资料的分析规律及其数量特征,总体参数估计,假设检验,统计推断(statistical inference) 通过样本统计量信息推断相应总体参数的方法。 包括对总体参数的置信推断及参数间差异的假设检验。,第三章 总体均数的估计与假设检验,总体均数的估计,抽样误差与标准误 t分布 参数的估计,一、抽样误差与标准误,由于个体变异的存在,在抽样研究中产生样本统计量之间,样本的统计量和总体参数之间的差异,称为抽样误差(sampling error)。 各种参数都有抽样误差,抽样误差的定义,正态总体 =4.83 =0.52,100份样本的均数和
2、标准差,将这100份样本的均数看成新变量值,按频数分布方法,得到这100个样本均数,形成的直方图见图4-1。,图4-1 随机抽样所得100个样本均数的分布,抽样实验小结,从正态总体N(,2)中抽取样本,获得均数的分布仍近似呈正态分布N(, 2/n) ; 从任意总体中随机抽样,当样本含量足够大时(n60),其样本均数的分布逐渐逼近正态分布; 样本均数之均数的位置始终在总体均数的附近; 随着样本含量的增加,样本均数的离散程度越来越小,表现为样本均数的分布范围越来越窄,其高峰越来越尖。,我们仿造标准差的计算公式,写出样本均数的标准差,变量值的标准差,样本均数的标准差,标准误的意义,标准误反映了样本均
3、数间的离散程度,也反映了样本均数与总体均数的差异。 大,抽样误差大,用 估计的可靠程度低; 小,抽样误差小,用 估计的可靠程度高。,在例数n一定时,标准误的大小与标准差成正比; 当总体中各观察值变异较小时,抽到的样本均数与总体均数相差较小;当总体中各观察值变异较大时,抽到的样本均数与总体均数相差较大,则抽样误差大。 而当总体一定时,标准误与样本含量的平方根成反比; 样本例数n越大,标准误越小。说明我们可以通过增加样本含量来减少抽样误差的大小。,在研究工作时,由于总体标准差常常未知,可以利用样本标准差近似估计,例:对某地成年男性红细胞数的抽样调查中,随机抽取了100名成年男性,调查得到其均数是5
4、.381012/L,标准差为0.441012/L,求其标准误。,n=100 s=0.441012/L,(1012/L),二、 t 分布(t-distribution),u分布,随机变量X N(m,s2),u变换,标准正态分布 N(0,12),均数,标准正态分布 N(0,12),在实际工作中,由于 未知,常用 s 代替,此时 服从t分布 (t-distribution)即:,t 分布(t-distribution),X1,X2,X3, N ( , 2 ),N (0,1 ),u 分布,X1,X2,X3, N ( , 2x ),N (0,1 ),Sx,t 分布,t分布曲线,t 分布有如下性质: 单峰
5、分布,曲线在t0 处最高,并以t0为中心左右对称 与正态分布相比,曲线最高处较矮,两尾部翘得高 t分布曲线是一簇曲线,其形态变化与自由度(=n-1)的大小有关。随自由度增大,曲线逐渐接近正态分布;分布的极限为标准正态分布。,标准正态分布曲线有一定的面积特点,t分布也有一定的面积特点。 由于t分布是一簇曲线,曲线的高低与自由度有关,要获得相同的外侧面积,其界值点并不相同,因此,外侧面积为的t界值点表示为t, ,其值的大小可查t界值表。,t分布的面积特点及界值,t 界值表(附表1),1.812,2.228,-2.228,t,f (t),=10的t分布图,表示法:双侧 单侧,用 途:1. 总体均数置
6、信区间的估计 2. 用于t检验,自由度相同时,P值 , t值 P值相同时,自由度 , t值 自由度 时, t值=u值,三、总体均数的置信区间估计 参数估计,parameter estimation,概念,用样本统计量估计总体参数称参数估计(parameter estimation) 是统计推断的一个重要内容 常用的估计方法有两种: 点估计 置信区间估计,点估计(point estimation),概念:指用样本统计量直接作为总体参数的估计值 方法:直接用随机样本的均数 作为总体均数的估计值,即 ;用样本率p作为总体率的估计值,即 特点:方法简单;但未考虑抽样误差的大小;点估计的准确性很难评价,
7、置信区间估计( confidence interval estimation),又称可信区间估计,即按预先给定的概率(1), 估计未知总体参数的可能范围。这一范围称为参数的可信区间或置信区间(confidence interval,CI),置信度( confidence level),也称可信度:估计正确的概率,可以是90%、95%,99% 等。置信度越大,区间要求越宽 90%可写成1-0.10,95%可写成1-0.05,99%可写成1-0.01, 0.10、0.05、0.01用表示,为估计错误的概率,(1-)即表示置信度。 一般情况下,置信区间选择95%。置信度定位95%时,置信区间的大小就
8、由抽样误差决定。,置信限( confidence limit),置信区间通常两个数值即置信限(confidence limit,CL)构成, 较小的称为置信下限(lower limit,L), 较大的称为置信上限(upper limit,U)。 置信区间是指包括总体参数的范围,置信限是指范围的两个界限,置信区间的上下限即为可信限。,总体均数置信区间的计算,已知时: 总体均数,95%的可信区间按下式计算:,总体均数置信区间的计算,未知 n 较大时(n100),总体均数的95%可信区间 n 较小时(n100) ,总体均数的95%可信区间,例 从某年某地20岁健康男大学生中抽得110名的一个样本,
9、求得身高的均数为172.73cm, 标准差为4.09cm, 试估计该地20岁健康男大学生身高均数的95置信区间。,该地20岁健康男大学生身高均数的95置信区间为 (171.97, 173.49) cm,(172.731.960.39 , 172.731.960.39) =(171.97, 173.49) cm,例 从某年某地20岁健康男大学生中抽得11名的一个样本, 求得身高的均数为172.25cm, 标准差为4.09cm, 试估计该地20岁健康男大学生身高均数的95置信区间。,该地20岁健康男大学生身高均数的95置信区间为 (169.50, 175.00) cm,=11-1=10,查t界值表
10、,得t0.05/2(10)=2.228 (172.252.2281.233, 172.252.2281.233) =(169.50, 175.00),总体均数的95置信区间的含义,100次抽样,可得到100个置信区间,平均有95个置信区间包括客观存在的总体均数,只有5个置信区间未包括总体均数,四、假设检验(hypothesis test),10岁男孩为总体A =130cm,=7.5cm,11岁男孩为总体B =140cm,=8.2cm,a2 X=131.9cm n=10,a1 X=128.3cm n=10,b X=138.2cm n=10,H0: a1与a2之差 是抽样误差,H1: b与a2之差
11、是 两不同年龄之差 与抽样误差之和 (本质之差),引起两个样本均数不相等的原因有两种可能 : 1、来自相同的总体,由于抽样误差所致; 2、来自不相同的总体,由于本质差异所致。 假设检验就是在这两者中作出决策的过程。,假设检验(hypothesis test),假设检验的基本思想 假设检验的基本步骤 t检验和u检验 样本均数与总体均数比较 配对设计的两样本均数比较 完全随机化设计的样本均数比较 假设检验中应注意的问题,假设检验的基本思想,亦称显著性检验(significane test) 它是利用小概率反证法的思想,从问题的对立面( H0 )出发间接判断要解决的问题(H1)是否成立,然后在H0成
12、立的条件下计算检验统计量(test ststistic),最后获得P值(P-value)来判断。,假设检验的步骤(1),1、建立检验假设,确定检验水准 (1)两种假设 H0: 无效假设(null hypothesis) 差异由抽样误差所致,=0 H1: 备择假设(alternative hypothesis)差异是由本质性差异引起,0 (2)两侧检验:单侧,双侧 (3)检验水准(显著性水平)(level of test) =0.05,u与u0比较,2、选择检验方法,计算检验统计量 即计算样本与所假设总体的偏离情况 根据研究设计方法、统计推断的目的、资料类型、样本含量和资料分布等选择适当的检验方
13、法,依据选择的方法公式计算相应的检验统计量(test statistic),如u检验、t检验、t检验、F检验、x2检验等,假设检验的步骤(2),3、确定P值,作出统计推断结论 即与统计量t(u、F等)值对应的概率 P值:是指依据所计算的检验统计量确定H0成立的可能性大小,即确定在检验假设条件下由抽样误差引起差别的概率。 统计推断应包括统计结论和专业结论两部分。 假设检验的结论具有概率性。,假设检验的步骤(3),t检验,单样本t检验:样本均数与总体均数的比较,成组t 检验:两个样本均数的比较,配对 t 检验 :配对资料的比较,t检验和u检验,u检验:适用条件:大样本或已知总体标准差。,适用条件:
14、正态分布,总体方差齐同,一、单样本t检验 (one sample/group t-test),例 某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其平均数为130.83g/L,标准差25.74g/L,问从事铅作业工人的血红蛋白是否不同于正常男性平均值140g/L?,已知:总体均数:大量观侧得到的稳定值或理论值0 。 样本均数:,1、建立检验假设,确定检验水准 2、计算检验统计量t,3、确定概率,=n-1=36-1=35,查t界值表:t0.05/2(35)2.030, t0.02/2(35)2.438 2.030P0.02 4、判断结果 按=0.05水准,拒绝H0,接受H1,有统计学意义
15、,认为从事铅作业工人血红蛋白含量与正常人不同。,1)自身配对: (1)同一受试对象给以某种处理前后的比较 目的:推断某种处理有无作用 (2)同一受试对象两个不同部位分别给以两种不同处理的比较 目的:推断两种处理的效果有无差别 (3)同一样品用两种方法(或仪器)检验的结果比较 目的:推断两种处理的效果有无差别 2)异体配对: 不同受试对象配成对子,分别给以两种不同处理 目的:推断两种处理的效果有无差别,二、配对样本t检验,配对资料的t检验公式,差数的均数,差数的标准差,差数均数的标准误,n 对子数,例,为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,随机抽取了10份乳酸饮料制品,分别用脂肪酸
16、水解法和哥特里罗紫法测定其结果如下表第(1)(3)栏。问两法测定结果是否不同?,两种方法对乳酸饮料中脂肪含量的测定结果(%),配对样本t检验的基本思想,两同质受试对象配对分别接受两种不同处理。若两处理效应相同,即1=2,则1 - 2=0,因此可将此类资料看成是差值的样本均数 所代表的未知总体均数d与已知总体均数0的比较。,1.建立检验假设,确定检验水准 H0: H1: 2.计算统计量t值 已知,则,3.确定P值 由t界值表得 t0.05/2,9 = 2.262, t0.001/2,9 = 4.781 本例t=7.925 t0.001/2,9 P0.001,4.判断结果 在 概率水平下拒绝H0,
17、接受H1 ,可以认为两法测定结果不同。,三、两个样本t检验 (two-sample/group t-test),适用于完全随机设计两样本均数的比较, 完全随机设计: 将受试对象完全随机地分配到两组中,每组研究对象分别接受不同的处理,然后比较两组的平均效应。,分类: 大样本(n60) 小样本(n60) 两总体方差齐性(即 )时, t检验 两总体方差不齐时, t检验(Cochran and Cox法、Satterthwaite法) 秩和检验,方差齐性检验,由于存在着抽样误差,即使两总体方差相等,两样本方差也可能不同,所以要判断两总体方差是否具有齐性。 公式,已知 n1=7,x1=14.64,s1=
18、1.63, n2=7,x2=12.74,s2=1.33. 查F界值表,1=6, 2=6, 其界值为F0.10(6,6)=4.28,1.480.10 说明方差齐性。,S1=90.41,n1=13;s2=9.23,n2=11 H0: H1: =0.05 P0.05,按=0.05水准,拒绝H0,接受H1,认为两组总体方差的差别有统计学意义,即两组总体方差不等。,方差齐性时,t检验公式,的标准误,合并方差,案例,例3-7 为研究国产四类新药阿卡波糖胶囊的降血糖效果,某医院用40名2型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组(用阿卡波糖胶囊)和对照组(用拜糖平胶囊),分别测得试验
19、开始前和8周后的空腹血糖,算得空腹血糖下降值见表3-6,能否认为该国产四类新药阿卡波糖胶囊与拜糖平胶囊对空腹血糖的降糖效果不同?,表3-6 试验组和对照组空腹血糖下降值(mmol/L),1、建立假设,确定检验水准,2、计算统计量t值,已知,则,3、确定概率,t=0.642 , ,4、判断结果,在 的概率水平下不拒绝H0;即尚不能认为两胶囊对空腹血糖的降糖效果不同。,方差不齐的两样本t检验,CochranCox法 Satterthwaite 法 Welch法,CochranCox法,公式,例3-8 在上述例3-7国产四类新药阿卡波糖胶囊的降血糖效果研究中,测得用拜糖平胶囊的对照组20例病人和用阿
20、卡波糖胶囊的试验组20例病人,其8周时糖化血红蛋白HbA1c(%)下降值如表3-7。问用两种不同药物的病人其HbA1c下降值是否不同?,表3-7 对照组和试验组HbA1c下降值(%),1、建立假设,确定检验水准,2、计算统计量t值,则,3、确定概率,t=0.965 , ,4、判断结果,在 的检验水平下不拒绝H0,无统计学意义,即认为两组药物疗效相同。,t0.2/2,19=1.328, t0.40/2,19=0.861 0.20P0.40,Satterthwaite法,公式,1、建立假设,确定检验水准,2、计算统计量t值,则,3、确定概率,t=0.965 , ,4、判断结果,在 的检验水平下不拒
21、绝H0,无统计学意义,即认为药物无疗效。,假设检验中的注意事项,I型错误和II型错误 检验水准的选择 双侧检验与单侧检验 结论的概率性 P和的涵义 正确对待统计结论和专业结论 Significant 的意义,I 型错误和 II 型错误,第一类错误(Type I Error) 拒绝了实际上是成立的H0; 第二类错误(Type II Error) 不拒绝实际上是不成立的H0。,I 型错误和 II 型错误,I 型错误和 II 型错误图示,界 值,1-,拒绝H0,不拒绝H0,I 型错误和 II 型错误,当P 即拒绝H0 ,接受H1 ,要注意第一类错误出现。 当P 即不拒绝H0,要注意第二类错误的出现;
22、 第二类错误率 表示失去对真实的H1作出肯定结论之概率; 1 就是对真实的H1作出肯定结论之概率,常被用来表达某假设检验方法的检验的功效(power of a test),国内学者称它为把握度:假设检验对真实的H1作肯定结论之把握程度。,检验水准的选择,检验水准大小的选择要慎重。在假设检验时,如果错误地不拒绝零假设的后果很严重,就需要严格尺度(尽可能拒绝H0),即选择一个较大的;否则要选择稍小的;但一般选择=0.05。,的含义,犯第一类错误的概率,即拒绝H0所冒的风险不可超过; 在假设检验之前人为规定,双侧检验与单侧检验,双侧检验: H0 : 12 ,H1 : 12 单侧检验: H0 : 12
23、 , H0 : 12 H1 : 1 2 , H1 : 1 2,何时选择单双侧,要有专业背景。,检验水准有单双侧之分。,双侧检验与单侧检验,选择要结合专业实际; 选择要在计算检验统计量之前; 在相同的检验水准下,正确地选择单侧检验将比双侧检验得到更多的检验效能。,P值的意义,从 H0 总体中随机获得等于或大于现有统计量值的概率。 拒绝H0时所冒的风险。,t,t,假设检验和可信区间的关系,假设检验:样本是否来自于同一总体? 可信区间:总体参数在哪里? 回答的问题虽然不一样,原理却相同。,假设检验和可信区间的关系,在相同的之下,若假设检验拒绝H0(p ),那么可信度为(1- )的可信区间必然不包括总
24、体参数; 反之成立。 可信区间和假设检验是对同一问题所作的不同结论,效果等价。,H0,有实际专业 意义的值,有统计学意义,无统计学意义,有实际的专业意义,可能有实际的专业意义,无实际的专业意义,样本例数太少, 可能有实际的专业意义,样本例数太少, 但无实际的专业意义,正确对待结论,专业上有差别,假设检验拒绝H0:结果有效,可以下专业结论; 专业上无差别,假设检验不拒绝H0:下无差别的结论; 专业上有差别,假设检验不拒绝H0:增大样本含量,减少二类误差; 专业上无差别,假设检验拒绝H0:改进试验,减少误差。,正态性检验,图示法 概率图probability-probability plot(P-
25、P图) 分位数图quantile-quantile plot(Q-Q图) 计算法 矩法(偏度skewness与峰度kurtosis) W检验法和w检验法(适用于样本含量少于100的资料 D检验法(适用于样本含量为102000的资料),P-P图,Q-Q图,矩法,既能用于小样本资料,亦可用于大样本资料的正态性检验 当频数分布为正态时,偏度系数与峰度系数分别等于0,但从正态分布总体中抽出的随机样本,由于存在抽样误差,其样本偏度系数g1与样本峰度系数g2不一定为0,为此,需检验g1、g2与0的相差是否有显著性。其检验假设为偏度系数等于O,即频数分布对称;峰度系数等于0,即为正态峰。,正态峰,假设检验用u检验, u1=g1/Sg1 u2=g2/Sg2 u0.05 在=0.05的水准上接受H0,成正态分布,谢谢,