1、SPSS在医学研究中的应用康复治疗学教研室许多护理研究创新课程假设检验的基本原理假设检验的基本原理:假设参数或分布一致,通过数据的分布计算此时的概率,如果发生的是一个小概率事件,一般认为不会发生或有理由拒绝原假设。小概率一般取值为 0.01或 0.05。t检验t 检验讨论的是两个总体均数是否相等;t 检验要求:数据服从正态分布,方差齐性。这些条件是 t 检验的基础;如果不满足,则通常需要采取其他适合的方法分析。Analyze 中 Compare Means t检验的分类1.单个样本 t 检验(One-Sample T Test):用于单样本均数与已知总体均数的比较。2.两独立样本 t 检验(I
2、ndependent-Samples T Test):用于两个独立样本均数的比较。3.配对样本 t单个样本 t 检验单个样本 t 检验过程(One-Sample T Test):用于进行样本均数代表的未知总体均数与已知总体均数的比较,一般已知总体值为理论值、标准值或是经大量观测得到的稳定值。通过以往大规模调查,已知某地婴儿出生体重均数为 3.3 kg,今在该地的某民族聚居区随机测得 30 名婴儿的出生体重,试推断该民族聚居区婴儿出生体重均数是否与该地相同?单个样本 t 检验 两独立样本 t 检验 两独立样本 t 检验(Independent Samples T Test):是用于进行两个独立样
3、本均数所代表的未知总体均数的比较的检验方法,需要强调的是样本数据要分别服从正态分布,且方差齐性。(当方差不齐时,有人坚持用这一方法,理由是两独立样本 t 检验过程提供了校正 t 检验。在此提醒,校正 t 检验只适合于方差不齐程度在一定范围之内的情况。)两独立样本 t 检验某研究者进行某项大鼠药物实验,对大鼠进行高血脂造模,分成两组,其中模型组为 27 例;采用某药进行实验的药物组为 18 例。经过一段时间后测量大鼠血中的高密度脂蛋白(HDL_C/mmol/L),试分析该药对 HDL_C 是否有影响?配对样本 t 检验配对样本 t 检验(Paired-Samples T Test):两个相关样本
4、是否来自于相同均数的总体,即配对样本的差值与总体均数为 0 进行的检验。配对设计是按照某些特征相近的受试对象配成对子:(分三种)一是特征相近的受试对象配对,分别接受两种不同的处理,如把同窝的动物配成对子;二是同一受试对象或同一受试对象的两个部分,分别接受两种处理;三是自身配对,即同一受试对象在接受处理前后的比较。配对样本 t 检验 配对数据有一定的相关性,不宜采用独立样本 t 检验进行比较,否则会造成数据信息的丢失。配对样本 t 检验的分析过程是求出配对数据的差值,利用所获得的样本差值与 0 进行检验,如果两种处理没有差异,那么差值的总体均等于 0,其差值的样本均数也应在 0 附近;反之,差值
5、的总体均数远离 0。进行配对 t 检验前,首先对数据的分布情况和特征进行考察,结果是配对数据的差值服从正态分布。在实践中,很少有人考虑这一条件。配对样本 t 检验有 12 名接种卡介苗的儿童,8 周后用两批不同的结核菌素。一批是标准结核菌素,一批是新制结核菌素,分别注射在儿童的前臂。测量两种结核菌素的皮肤浸润反应平均直径(mm),问两种结核菌素的反应性有无差别。方差分析 t 检验讨论的是两个总体均数是否相等,如果对多个总体均数进行比较再使用 t 检验将增大一类错误,因此引入了方差分析(ANOVA)的方法。方差分析是统计学中的经典方法,使用频率较高,可用于两个或多个样本均数差异的检验、分解,并估
6、计某些因素作用、因素的作用方式及方差齐性检验。方差分析方法是一种假设检验,它是在一定条件下,从变异入手将变异来源分解成几个部分,从而判断每个部分的作用大小。方差分析(1)因素:要检验的对象,对应变量可能有影响的变量。因素一般是多水平的,方差分析的目的就是比较各水平对应变量有无影响。例如,不同的临床药物浓度对某疾病指标的作用,药物为因素,不同浓度为因素的各水平。因素取值一般有限,多为分类变量。(2)水平:因素的不同取值为该因素的不同水平。(3)应变量:也可作因变量,在各因素(自变量)影响下的被记录或测定的变量。方差分析(4)交互作用:在一个因素的不同水平另一个因素的效应不同,则称这两个因素有交互
7、作用。(5)固定因素:固定因素是指在当前样本中已全部出现该因素的不同水平,通过分析可以得到各水平的信息,不需要外推和估计。如几种不同药物影响下的某一临床指标,此时药物因素就是固定因素,目的只是考察这几种药物的作用,对于其他药物的作用不再关注。(6)随机因素:和固定因素不同,在样本中没有全部取到该因素的不同取值或无法取得,如实验的温度、浓度等。可以根据样本信息外推该因素的其他情况。方差分析方差分析分类:One-Way ANOVA(单因素方差分析)General Linear Model 模型下的 Univariate(单变量多因素方差分析)Repeated Measure(重复测量方差分析)使用
8、条件:正态分布:各组样本都服从正态性,为正态总体的样本。方差齐:每个组或组合的方差齐,即总体方差相同。各样本独立:样本为相互独立的随机样本,可进行分解。单因素方差分析某研究小组欲了解抗疲劳药物对足球运动员肺功能的影响,将某地年龄相同、体重相近的 36 名足球运动员随机分为 3 组,每组 12 人。对照组,:按常规训练;试验组I:按常规训练并服用药物I;试验组II:按常规训练并服用药物II;一个月后测定第一秒用力肺活量(L),试比较 3 组运动员第一秒用力肺活量有无差异。注:在具体实验设计中,分组的例数不一定相等,但比较组间的基线水平应该相同,否则最终的差异或无差异无法判断。随机区组设计的方差分
9、析随机区组设计是将几个条件相近的对象配成一个区组(配对设计是两个相近的对象配成一对),在每个区组内处理因素随机分配,处理因素有不同的水平。随机区组设计均衡了不同处理因素的受试对象,效率更高。随机区组设计的方差分析是将总变异分解为区组变异、处理因素变异及随机误差部分。但随机区组设计没有考虑区组因素与处理因素的交互作用。随机区组设计的方差分析体重相近的 3 只小白鼠配成一个区组,共 5 个区组,分别接受甲、乙、丙三种抗癌药物的处理。问三种不同药物的抑瘤效果(瘤重/g)有无差异?Analyze|General Linear Model|Univariate协方差分析协方差分析(Analysis of
10、 Covariance,ANCOVA)是线性回归与方差分析原理结合的一种方法。在实验研究中,处理组间的不均衡会影响结果的可靠性和结论的准确性。如研究对象受处理因素的作用,各组对象的基线水平或其他特征又存在差异,则无法判断最终的效果是处理因素起作用还是由于基线的不同而造成的。一般解决该问题的方法之一是对各处理组完全随机化,不过在实际情况中有时却无法实现。协方差分析亦是解决此问题的一种多因素分析方法,把处理因素和不均衡因素的效应估计出来。协方差分析协方差分析是在均数比较之前,将某个或某些(非处理因素的、未控制的计量变量)对应变量有影响的变量作为协变量,建立应变量与协变量的线性回归关系,再利用此关系
11、求得协变量相等时各组的修正均数,然后用方差分析比较修正均数间的差异。协方差分析应具备以下条件:各样本为正态分布随机样本,方差齐性,相互独立。协变量为连续变量且与应变量存在线性关系。协变量与应变量的回归斜率相同(回归线平行)。完全随机设计的协方差分析为研究 A、B、C 三种饲料对猪的催肥效果,用每种饲料喂养 8 头猪一段时间,测得每头猪的初始重量(X)和增重(Y)。试分析三种饲料对猪的催肥效果是否相同?Analyze|General Linear Model|Univariate该资料条件如果满足,如不考虑初始重量时,可使用单因素的方差分析。但现在各组的初始重量不同,会影响不同饲料增重效果的判断
12、,因此将初始重量作为协变量进行方差分析,同时在进行协方差分析前要对资料的特征进行考。随机区组设计的协方差分析为研究三种饲料对增加大白鼠体重的影响,按随机区组设计将初始体重相近的 36 只大白鼠分成 12 个区组,再将每个区组的 3 只大白鼠随机分入 A、B、C 三种饲料组,但在实验设计时未对大白鼠的进食量加以控制。问扣除进食量因素的影响后,三种饲料对增加大白鼠体重有无差别?group(饲料)、x(进食量 g)、y(增重 g)和 block(区组)。将 40 例病情相似的淋巴系肿瘤患者随机分成两组,分别做单纯化疗与复合化疗。对同一研究对象进行两种临床处理(检查或治疗)的阳性率是否相等,或者把每一
13、份标本平均分成两份,分别用两种方法进行化验,比较两种化验方法的结果是否有本质不同。现有 198 份痰标本,每份标本分别用 A、B 两种培养基培养结核菌 Analyze|Descriptive Statistics|Crosstabs 对 48 个某肺癌细胞株进行对抗肿瘤药物阿霉素和表阿霉素耐药性的检测,试问 2 组的耐药率是否有差异?非参数检验非参数检验是指在母体不服从正态分布或分布情况不明时,用以检验数据是否来自同一个母体假设的一类检验方法。一般应用非参数检验方法的资料有以下特征:总体分布为偏态;总体分布形式未知;观察例数偏少(n30),并且总体分布不确定;有序或无序的等级资料;组间离散程度
14、相差很大,各样本均数间方差不齐等。非参数检验 Analyze|Nonparametric Tests非参数检验分类:1.卡方检验(Chi-Square Test):也称为卡方拟合优度检验(Chi-Square Goodness of Fit Test),用于检验二项或多项分类变量的分布。卡方检验方法用来检验数据是否与某种期望概率分布的理论数据相符合。注意,该检验和前面所讲的字2检验不太一样,前面所讲的卡方检验方法是通过 SPSS 系统中的菜单Analyze|Descriptive Statistics|Crosstabs 命令设置完成的。非参数检验非参数检验分类:2.二项分布检验(Binorm
15、ial Tests):用于对给定样本数据检验其总体是否服从概率为给定数值的二项分布。二项分布最典型的案例就是抛掷硬币的实验,根据抛掷硬币检验硬币的正反面出现的概率是否为1/2,从而得到抛掷硬币时硬币的正反面出现的概率是否相同的结论。非参数检验非参数检验分类:3.单样本 K-S 检验(1-Sample K-S):是柯尔莫哥洛夫 斯密尔洛夫(Kolmogorov-Smirnov)检验的简称。该检验是一种拟合优度检验,可以利用样本数据推断样本来自的总体是否服从某一理论分布,理论分布主要包括正态分布、均匀分布和泊松分布等。非参数检验非参数检验分类:4.2 Independent Samples:两个独
16、立样本比较的秩和检验,用于分组数据分布位置的检验。5.K Independent Samples:多个独立样本比较的秩和检验,用于分组数据分布位置的检验。6.2 Related Samples:两个相关样本比较的秩和检验,用于配对数据分布位置的检验。7.K Related Samples:多个相关样本比较的秩和检验,用于配对数据分布位置的检验。重点介绍 4 种秩和检验方法。两个独立样本比较的秩和检验将肺癌并发转移的患者分为观察组和对照组观察组:常规治疗+转移灶治疗对照组:常规治疗观察期生存期(周),问两组生存时间差别?观察为周,分布不明确,例数较少,直方图偏态,方差不齐。多个独立样本比较的秩和检验推断样本所属总体的中位数或分布是否存在差异两个相关样本比较的秩和检验相关与回归相关不一定是因果关系存在因果关系,必然相关。相关是研究两个或两个以上变量之间密切程度和相关方向的一种统计方法。Analysis-correlation:(双变量相关-bivariate)(偏相关-partial)(距离-distances)进行线性相关前应绘制散点图两变量相关分析Pearson线性相关要求两个变量服从正态分布偏相关分析控制某些变量的影响后,进行两变量之间线性关系的分析。