1、 流行病学与卫生统计学系流行病学与卫生统计学系 2016.22假设检验中如果无效假设针对总体均数(此处假设检验中如果无效假设针对总体均数(此处指的是算术均数),通常的方法有指的是算术均数),通常的方法有t检验(专检验(专门用于不超过门用于不超过2组的资料)与方差分析(用于组的资料)与方差分析(用于三组及以上)三组及以上)如果针对的总体参数是中位数,可以考虑采用如果针对的总体参数是中位数,可以考虑采用秩和检验秩和检验3在假设检验中使用了在假设检验中使用了t统计量,所以就称之为统计量,所以就称之为t检验检验t检验的使用是有条件的,什么样的资料可以检验的使用是有条件的,什么样的资料可以计算计算t值?
2、值?4数值数值(计量资料、定量变量计量资料、定量变量)变量变量正态分布或近似正态分布正态分布或近似正态分布总体方差齐性总体方差齐性(两样本资料两样本资料)在满足上述条件下,如果总体标准差未知,而在满足上述条件下,如果总体标准差未知,而且样本含量较小(且样本含量较小(n100),考虑使用),考虑使用t检验;检验;而如果已知总体标准差或样本含量较大(而如果已知总体标准差或样本含量较大(n100)则可以使用)则可以使用Z检验检验5某医生测量了某医生测量了农村农村40名名新生儿,测得平均新生儿,测得平均体重为体重为3.27kg,标准差,标准差0.44kg;从该地的;从该地的既往记录求得新生儿的总体均数
3、为既往记录求得新生儿的总体均数为3.36kg问问该地农村新生儿的出生体重是否与该地该地农村新生儿的出生体重是否与该地新生儿的平均出生体重不同新生儿的平均出生体重不同?从资料提供的信息来看,样本均数从资料提供的信息来看,样本均数3.27与总体均数与总体均数3.36不相等,其原因可有以下两个方面:不相等,其原因可有以下两个方面:样本对应的总体均数等于样本对应的总体均数等于3.36,仅仅是由于抽样,仅仅是由于抽样误差所致这种差别;误差所致这种差别;非抽样误差,二者的确有别?非抽样误差,二者的确有别?两种情况只有一个是正确的,且二者必居其一,需两种情况只有一个是正确的,且二者必居其一,需要我们作出推断
4、。要我们作出推断。,农村新儿体重与该地平均水平相同,农村新儿体重与该地平均水平相同,二者不同,二者不同(有可能高也有可能低,总(有可能高也有可能低,总之不相等即可)之不相等即可)检验水准检验水准 22HxN(3.36,)40 xN(3.36t=,)40z3.273.36 1.294 401390.44/40/xnsn 根根据据0 0,新新生生儿儿体体重重服服从从正正态态分分布布:;从从该该总总体体中中随随机机抽抽样样,在在的的情情况况下下样样本本均均数数也也将将服服从从正正态态分分布布 既既然然满满足足正正态态分分布布就就可可以以作作 转转换换,但但是是总总体体标标准准差差未未知知,而而且且样
5、样本本例例数数较较少少,所所以以只只能能作作t t转转换换:P/2 2P /2 2-1.2941.2941/21/2 由于由于t=-1.294t0.05/2,35=-2.023,因此虽然无法,因此虽然无法准确得出准确得出P值,但仍然可以推断值,但仍然可以推断P0.05(经(经过计算机软件得出结果过计算机软件得出结果P=0.203)在在a a=0.05的水准上,不拒绝的水准上,不拒绝H0,尚不认为农,尚不认为农村新生儿的出生体重与该地村新生儿的出生体重与该地平均水平不同。平均水平不同。何为配对设计?何为配对设计?有时影响试验或研究结果的不仅仅是我们所观察有时影响试验或研究结果的不仅仅是我们所观察
6、的因素,例如要比较两种药物的疗效,如果两组的因素,例如要比较两种药物的疗效,如果两组患者在开始时的病情严重程度相差较大,那么即患者在开始时的病情严重程度相差较大,那么即使最终两药的治愈情况不同,也不能归结于药物使最终两药的治愈情况不同,也不能归结于药物差别;在这里患者的病情称之为非处理因素或差别;在这里患者的病情称之为非处理因素或“混杂混杂”因素因素配对设计就是研究者为了控制可能存在的非处理配对设计就是研究者为了控制可能存在的非处理因素对研究结果的影响而采用的一种因素对研究结果的影响而采用的一种“均衡均衡”的的设计方法设计方法常见的配对方法之一:常见的配对方法之一:将受试对象配成特征相近的对子
7、,而后让每将受试对象配成特征相近的对子,而后让每个对子中的两个对象随机接受不同的处理方个对子中的两个对象随机接受不同的处理方案,例如:比较两种疗法的患者生化指标,案,例如:比较两种疗法的患者生化指标,医生将年龄接近、性别一致、病情相同的患医生将年龄接近、性别一致、病情相同的患者配成对子,而后让一位患者接受甲处理另者配成对子,而后让一位患者接受甲处理另外一位患者接受乙处理外一位患者接受乙处理1314常见的配对方法之二:常见的配对方法之二:将同一份样品分成两份(或同一机体不同部将同一份样品分成两份(或同一机体不同部位),同时、随机接受两种不同的处理方案位),同时、随机接受两种不同的处理方案,例如:
8、牙医分别用两种方法对相同患者的,例如:牙医分别用两种方法对相同患者的牙龈取模,比较两种方法的精确度牙龈取模,比较两种方法的精确度有种有种“治疗前后的自身配对治疗前后的自身配对”,它是以受试对象接,它是以受试对象接受处理前的变量值作为对照值(相当于空白情况)受处理前的变量值作为对照值(相当于空白情况),接受处理后的变量值作为实验值。,接受处理后的变量值作为实验值。但是,在实际应用中,由于作用于受试对象的非处但是,在实际应用中,由于作用于受试对象的非处理因素如气候、饮食、心理状态等无法在长时间内理因素如气候、饮食、心理状态等无法在长时间内保持稳定,此时结果就不完全是处理因素的效应,保持稳定,此时结
9、果就不完全是处理因素的效应,同时还夹杂非处理因素改变对结果的影响;故这种同时还夹杂非处理因素改变对结果的影响;故这种配对设计的方式主要用于配对设计的方式主要用于急性、短期急性、短期试验。试验。2idd2dddddddddd N(,)dd dN(,),nStd-t=t(n-1)nsn,根根据据前前面面的的介介绍绍,差差值值 的的样样本本均均数数将将满满足足正正态态分分布布,表表达达为为但但是是由由于于未未知知,只只知知;所所以以只只可可作作 变变换换,如如下下:,其其中中为为对对子子数数检验的原理:如果两总体间没有差别,那么检验的原理:如果两总体间没有差别,那么每个对子的差的总体均数为每个对子的
10、差的总体均数为0,即,即 d=0(H0)检验的统计量检验的统计量:(1)0 ,其其中中为为对对子子数数,因因为为,化化简简后后得得到到课课本本公公式式:dddddddddtt nnsndtsn 2024名儿童接种卡介苗,按照年龄、性别配成名儿童接种卡介苗,按照年龄、性别配成12对,每对中的一对,每对中的一人接种新制品,另外一人接种标准品;经相同部位注射,人接种新制品,另外一人接种标准品;经相同部位注射,72小小时后观察结核菌素皮肤反应的直径,请问两种疫苗的反应结果时后观察结核菌素皮肤反应的直径,请问两种疫苗的反应结果有无差别有无差别?H0:d0,两种疫苗的反应结果相同两种疫苗的反应结果相同 H
11、1:d0,两种疫苗的反应结果不同两种疫苗的反应结果不同 a a0.05;双侧;双侧计算检验统计量计算检验统计量 t 查表,查表,t 0.05/2,11=2.201,所以,所以P0.1,故结果为不拒,故结果为不拒绝绝H0,尚不认为两组总体方差不同,尚不认为两组总体方差不同前面阐述了方差齐性的情况下,如何进行两个样前面阐述了方差齐性的情况下,如何进行两个样本均数比较的本均数比较的t检验检验如果方差不齐,很多学者建议在这样的情况下采如果方差不齐,很多学者建议在这样的情况下采用自由度校正的方法计算用自由度校正的方法计算t分布的概率,或者直接分布的概率,或者直接采用非参数检验采用非参数检验(Satter
12、thwaite,1941,1946;Aspin 1948,1949)分别提出了使用校正分别提出了使用校正自由度自由度的方法计的方法计算算t值所对应的概率值所对应的概率P他们提出的自由度计算方法为现在大多数统他们提出的自由度计算方法为现在大多数统计学软件所采用,公式如下计学软件所采用,公式如下 222112212 2222221211221212/11 snsnxxttvsssnsnnnnn区间估计与假设检验是统计推断的两个基本方法,区间估计与假设检验是统计推断的两个基本方法,它们之间有共同之处它们之间有共同之处二者的基本思想都是利用二者的基本思想都是利用样本信息来对总体的一些性样本信息来对总体
13、的一些性质进行推断质进行推断。二者的推断过程都二者的推断过程都应用了小概率事件的原理应用了小概率事件的原理,难以保,难以保证统计推断的结论百分之百正确。证统计推断的结论百分之百正确。二者都是利用概率分布的原理推导计算的,所以假设二者都是利用概率分布的原理推导计算的,所以假设检验可以看成是可信区间的另一种表达方式;置信区检验可以看成是可信区间的另一种表达方式;置信区间可看作是所有可能接受的假设的集合;例如:间可看作是所有可能接受的假设的集合;例如:12/2,10/2,112/2,212 /011 0a aa aa a 是是否否包包含含是是 样样本本均均数数与与总总体体均均数数比比较较的的 检检验
14、验配配对对 检检验验成成组组 检检验验否否包包含含是是否否包包含含dnnddnncxtSndtSnxxSnntttt虽然二者间有共同点,但是它们还是有区别虽然二者间有共同点,但是它们还是有区别的的二者的思维二者的思维方向不同方向不同:假设检验使用反证法:假设检验使用反证法(逆向思维);而在计算可信区间时,对未(逆向思维);而在计算可信区间时,对未知参数没有任何了解,但能以一定的置信度知参数没有任何了解,但能以一定的置信度给出未知参数的置信区间或其所在的范围给出未知参数的置信区间或其所在的范围(正向思维)。(正向思维)。二者各具特色,例如:在配对二者各具特色,例如:在配对t检验中,拒绝检验中,拒
15、绝无效假设,认为使用药物后患者的血压较使无效假设,认为使用药物后患者的血压较使用前降低了,差别有统计学意义,但是能否用前降低了,差别有统计学意义,但是能否说药物有效呢?临床上要说明降压要有效,说药物有效呢?临床上要说明降压要有效,指服用后至少可以使血压降低指服用后至少可以使血压降低5mmHg,此,此时假设检验无法回答这个问题,但是可信区时假设检验无法回答这个问题,但是可信区间可以;计算差值的间可以;计算差值的95可信区间,看该区可信区间,看该区间是否在间是否在5以上;也就是说大多数的假设检以上;也就是说大多数的假设检验只能回答可信区间中是否有验只能回答可信区间中是否有0(H0假设假设)的问的问
16、题,而至于区间的具体位置是无法回答的,题,而至于区间的具体位置是无法回答的,如下图:如下图:A:不拒绝不拒绝H0假设,前后差值的假设,前后差值的CI包含包含0B:拒绝拒绝H0假设,血压有变化,但差值假设,血压有变化,但差值的的CI提示没有临床意义提示没有临床意义H0:d=0C:拒绝拒绝H0假设,血压有变化,差值的假设,血压有变化,差值的CI提示提示可能有临床意义可能有临床意义D:拒绝拒绝H0,血压有变化,差值的,血压有变化,差值的CI提示有临床意义提示有临床意义 d5mmHg假设检验过程中如果拒绝假设检验过程中如果拒绝H0,则可通过,则可通过P值精确说明值精确说明出现较当前情况更为极端的概率,作为拒绝出现较当前情况更为极端的概率,作为拒绝H0的把的把握度;越小的握度;越小的P值意味着越有理由拒绝值意味着越有理由拒绝H0。而可信。而可信区间只能在原先给定的可信度情况下进行区间估计区间只能在原先给定的可信度情况下进行区间估计在不拒绝在不拒绝H0的情况下,假设检验可以提供这种不拒的情况下,假设检验可以提供这种不拒绝到底有多少把握可以理解为两者没有差别(可通绝到底有多少把握可以理解为两者没有差别(可通过一定方法估计过一定方法估计1-);而区间估计则不提供这方面);而区间估计则不提供这方面的信息的信息