1、SPSSSPSS 前面进行的假设检验和方差分析,前面进行的假设检验和方差分析,大都是在数据服从大都是在数据服从正态分布或近似地服正态分布或近似地服从正态分布的条件下进行的。从正态分布的条件下进行的。但是如果但是如果总体的分布未知,总体的分布未知,如何进行总体参数的如何进行总体参数的检验,或者如何检验总体服从一个指定检验,或者如何检验总体服从一个指定的分布,都可以归结为的分布,都可以归结为非参数检验方法。非参数检验方法。SPSSSPSS本章主要内容单样本的非参数检验单样本的非参数检验两独立样本非参数检验两独立样本非参数检验两配对样本非参数检验两配对样本非参数检验多独立样本非参数检验多独立样本非参
2、数检验多配对样本非参数检验多配对样本非参数检验SPSSSPSS第一节单样本的非参数检验l总体分布的卡方检验总体分布的卡方检验l二项分布检验二项分布检验l单样本单样本K-S检验检验l变量值随机性检验变量值随机性检验SPSSSPSS总体分布的卡方检验总体分布的卡方检验 总体分布的卡方检验是一种总体分布的卡方检验是一种对总体分布对总体分布进行检验进行检验的极为典型的非参数检验方法。的极为典型的非参数检验方法。eg:在一个正:在一个正20面体的各面上分别标有面体的各面上分别标有09十个数字,每个数字在两个面上标出。十个数字,每个数字在两个面上标出。若把该若把该20面体投掷一些次数后,若检验每面体投掷一
3、些次数后,若检验每个数字出现的概率是否大致相同,则需用个数字出现的概率是否大致相同,则需用卡方检验。卡方检验。概念SPSSSPSSl 将总体的取值范围分成将总体的取值范围分成有限个互不相容的子集有限个互不相容的子集,从总体中抽取一个样本,考察样本观察值落到每个从总体中抽取一个样本,考察样本观察值落到每个子集中的子集中的实际频数,实际频数,并按假设的总体分布计算每个并按假设的总体分布计算每个子集的子集的理论频数理论频数,最后根据实际频数和理论频数的,最后根据实际频数和理论频数的差构造差构造卡方统计量卡方统计量,即即l 当原假设成立时,统计量服从卡方分布。以此来检当原假设成立时,统计量服从卡方分布
4、。以此来检验假设总体的分布是否成立。验假设总体的分布是否成立。基本思想基本思想02201()ekiiiifffSPSSSPSS 决策情况:决策情况:如果如果 的概率的概率 ,则应拒,则应拒绝原假设,即认为样本来自的总体分布绝原假设,即认为样本来自的总体分布与期望分布或某一理论分布存在显著差与期望分布或某一理论分布存在显著差异;反之,则不存在显著差异。异;反之,则不存在显著差异。2PSPSSSPSS基本操作及应用举例基本操作及应用举例(以心脏病猝死(以心脏病猝死.sav.sav为例)为例)分析分析非参数检验非参数检验卡方卡方SPSSSPSSSPSSSPSS输入检验输入检验变量变量输入理论(期输入
5、理论(期望)分布值望)分布值SPSSSPSSSPSSSPSS因为卡方对应的概率因为卡方对应的概率P P值大于值大于0.050.05,所以差异不显著,即认为样本来自的总体所以差异不显著,即认为样本来自的总体分布与指定的理论分布无显著差异分布与指定的理论分布无显著差异SPSSSPSS二项分布检验二项分布检验 SPSS的二项分布检验的二项分布检验正是通过样本数正是通过样本数据检验样本来自的据检验样本来自的总体是否服从总体是否服从指定概率指定概率值为值为P的的二项分布二项分布,其原假设为样本来自的,其原假设为样本来自的总体与指定的二项分布无显著差异。总体与指定的二项分布无显著差异。概念概念SPSSSP
6、SSl SPSS二项分布检验,在二项分布检验,在小样本小样本中采用精确检验中采用精确检验方法方法,对于,对于大样本大样本则采用近似检验方法则采用近似检验方法。精确精确检验方法检验方法计算计算n次试验中成功出现的次数小于等次试验中成功出现的次数小于等于于x次的概率,即次的概率,即l 在大样本下,在大样本下,采用近似检验采用近似检验,用,用Z检验统计量,检验统计量,即即0 xiin iniP XxC p q基本思想基本思想0.5(1)xnpZnppSPSSSPSSl决策情况:决策情况:如果上述两种情况下的概率如果上述两种情况下的概率 P值小值小于显著性水平于显著性水平 ,则应拒绝原假设,则应拒绝原
7、假设,即认为样本来自的总体分布与指定的即认为样本来自的总体分布与指定的二项分布存在显著差异;反之,则不二项分布存在显著差异;反之,则不存在显著差异。存在显著差异。SPSSSPSS二项分布检验的基本操作与应用二项分布检验的基本操作与应用(以产品合格率(以产品合格率.sav.sav为例)为例)分析分析非参数检验非参数检验二项式二项式SPSSSPSS输入检输入检验概率验概率值值SPSSSPSSSPSSSPSS由于概率由于概率P P大于大于0.050.05,所以不能拒绝原假设,所以不能拒绝原假设,即认为一级品率不低即认为一级品率不低于于0.90.9SPSSSPSS K-S检验(检验(Kolmogoro
8、w-Smirnov),该方法该方法能够利用样本数据推断样本来自能够利用样本数据推断样本来自总体是否总体是否与某一个理论分布有显著差异与某一个理论分布有显著差异,是一种拟,是一种拟合优度的检验方法,适用于探索合优度的检验方法,适用于探索连续型随连续型随机变量的分布机变量的分布。概念概念单样本单样本K-SK-S检验检验SPSSSPSS 正态分布正态分布 均匀分布均匀分布 指数分布指数分布 泊松分布泊松分布理论分布类型理论分布类型SPSSSPSSl 在原假设成立的前提下,计算各样本观测值在理论分布中出现的理论概率值F(x)l 计算各样本观测值的实际累计概率值S(x);计算实际累计概率值与理论累计概率
9、值的差S(x)F(x)l 计算差值序列中的最大绝对差值,即 修正的D为基本思想基本思想m ax()()iiDS xFxmax(max()()iiDS xF x1max()()iiDS xF xSPSSSPSS 决策情况:决策情况:如果如果D统计量的概率统计量的概率 P值小于显著值小于显著性水平性水平 ,则应拒绝原假设,即认,则应拒绝原假设,即认为样本来自的总体分布与指定的分布为样本来自的总体分布与指定的分布存在显著差异;反之,则不存在显著存在显著差异;反之,则不存在显著差异。差异。SPSSSPSS单样本单样本K-SK-S检验的基本操作与应用举例检验的基本操作与应用举例以儿童身高以儿童身高.sa
10、v.sav为例为例分析分析非参数检验非参数检验1-1-样本样本K-SK-SSPSSSPSSSPSSSPSS正态正态分布分布SPSSSPSSSPSSSPSS由于概率由于概率P P大于大于0.050.05,所以不能拒,所以不能拒绝原假设,即认为绝原假设,即认为周岁儿童身高的总周岁儿童身高的总体分布与正态分布体分布与正态分布无显著差异无显著差异SPSSSPSSP-PP-P图图SPSSSPSSQ-QQ-Q图图SPSSSPSS单样本单样本K-SK-S检验的基本操作与应用举例检验的基本操作与应用举例以储户存款金额总体的分布检验为例以储户存款金额总体的分布检验为例SPSSSPSS概率概率P P小于小于0.0
11、50.05,所以拒绝原,所以拒绝原假设,即认为储户存款金额总假设,即认为储户存款金额总体分布不服从正态分布体分布不服从正态分布SPSSSPSS变量值随机性检验变量值随机性检验u概念:概念:通过对样本变量值的分析,实现对总体通过对样本变量值的分析,实现对总体变量值出现是否随机进行检验。变量值出现是否随机进行检验。u基本思想:基本思想:利用游程大小进行判断。利用游程大小进行判断。游程游程是指变量值序列中连续出现相同的值的是指变量值序列中连续出现相同的值的次数次数u检验统计量:检验统计量:其中,其中,基本思想基本思想rrruZ12122rn nunn2121212212122(2)()(1)rn n
12、n nnnnnnnSPSSSPSS变量值随机性检验的变量值随机性检验的SPSSSPSS操作操作以耐电压值以耐电压值.sav.sav为例为例SPSSSPSSSPSSSPSS因为概率因为概率P P值大于值大于0.050.05,所,所以不能拒以不能拒绝原假设,绝原假设,即认为该即认为该设备是正设备是正常工作的常工作的SPSSSPSS练习1.在一个正在一个正2020面体的各面上分别标出面体的各面上分别标出0 09 9个数个数字,每个数字在两个面上标出,现将它投掷字,每个数字在两个面上标出,现将它投掷805805次,得出各数字朝上的次数。数据放在次,得出各数字朝上的次数。数据放在Frequncy.sav
13、Frequncy.sav文件中,试检验其均匀性。文件中,试检验其均匀性。2.2.试着检验抛硬币实验中,正面出现的概率试着检验抛硬币实验中,正面出现的概率是否为是否为1/2.1/2.数据在硬币结果数据在硬币结果.sav.sav中。中。3.3.试着检验试着检验1010个电子元件的使用寿命分布是个电子元件的使用寿命分布是否服从指数分布?数据在电子元件使用寿否服从指数分布?数据在电子元件使用寿命命.sav.sav中。中。SPSSSPSS 4.现有抛掷一枚硬币现有抛掷一枚硬币66次所得结果保存在数次所得结果保存在数据文件硬币结果据文件硬币结果.sav中,请检验该实验是否中,请检验该实验是否是随机性实验。
14、是随机性实验。SPSSSPSS第二节两独立样本的非参数检验 如果如果两个无联系总体的分布是未知两个无联系总体的分布是未知的,则的,则检验检验两个总体的分布是否有显著差异两个总体的分布是否有显著差异的方的方法是一种非参数检验方法,或者称为法是一种非参数检验方法,或者称为两个两个独立样本的检验独立样本的检验。检验是通过两个总体中。检验是通过两个总体中分别抽取的随机样本数据进行的。分别抽取的随机样本数据进行的。概念概念SPSSSPSS 曼曼-惠特尼惠特尼U检验检验 K-S检验检验 w-w游程检验游程检验 极端反应检验极端反应检验方法方法SPSSSPSS方法一:两独立样本的曼方法一:两独立样本的曼-惠
15、特尼惠特尼U检验检验 概念概念 通过对两组独立样本平均秩的研究来推断通过对两组独立样本平均秩的研究来推断它们来自的两个总体分布有无显著差异它们来自的两个总体分布有无显著差异。检验的基本步骤检验的基本步骤u首先将两组样本数据(首先将两组样本数据(X1,X2,Xn)和)和(Y1,Y2,Yn)混合并按)混合并按升序升序排序,得到排序,得到每个数据各自的秩每个数据各自的秩Ri基本思想基本思想SPSSSPSSu分别对两组样本的分别对两组样本的秩求平均,秩求平均,得到两个平均秩得到两个平均秩Wx/m和和WY/m,然后比较它们的大小,若差值较大,然后比较它们的大小,若差值较大,说明原假设很可能不成立。说明原
16、假设很可能不成立。u计算两个样本计算两个样本各自优先于对方各自优先于对方的秩的个数的秩的个数U1、U2,即即 然后对然后对U1、U2大小进行比较,若它们相差较大时,大小进行比较,若它们相差较大时,则有必要怀疑原假设的真实性。则有必要怀疑原假设的真实性。u 计算计算WilcoxonW统计量,其为上述统计量,其为上述U1、U2较小较小者所对应的秩和者所对应的秩和11(1)2XUWm m21(1)2YUWn nSPSSSPSSu计算曼计算曼-惠特尼惠特尼U统计量,统计量,小样本下,小样本下,U统计量服从统计量服从Mann-Whitney分布分布 即即 大样本下,大样本下,U统计量近似服从正态分布统计
17、量近似服从正态分布121min(,)(1)2UU UWk k121(1)12UmnZmn mnSPSSSPSSu统计决策统计决策 在小样本下,依据在小样本下,依据U统计量的概率统计量的概率P值进行决策;值进行决策;在大样本下,则依据在大样本下,则依据Z统计量的概率统计量的概率P值进行决策。值进行决策。若概率若概率P值小于显著性水平值小于显著性水平 ,则拒绝原假设,则拒绝原假设,即认为样本来自的两总体分布存在显著差异;反即认为样本来自的两总体分布存在显著差异;反之,则差异不显著。之,则差异不显著。具体计算举例以课本具体计算举例以课本P199P199页数据为例页数据为例SPSSSPSS曼曼-惠特尼
18、惠特尼U U检验检验SPSSSPSS基本操作基本操作(以两独立样本使用寿命为例)(以两独立样本使用寿命为例)分析分析非参数检验非参数检验2 2个独立样本个独立样本SPSSSPSSSPSSSPSS由于本题中由于本题中涉及是涉及是小样小样本,因此采本,因此采用用U U检验检验,相,相应概率为应概率为精精确概率确概率,由,由于于0.040.04小于小于0.050.05,所以,所以拒绝原假设,拒绝原假设,所以认为两所以认为两种工艺下产种工艺下产品使用寿命品使用寿命的分步存在的分步存在显著差异显著差异SPSSSPSS方法二:两独立样本K-S检验 概念概念 K-S检验检验不仅能够对不仅能够对单个总体的分布
19、单个总体的分布是否与是否与某一理论分布存在显著差异进行检验,还某一理论分布存在显著差异进行检验,还可以对可以对两个总体的分布两个总体的分布是否存在差异进行是否存在差异进行检验检验基本思想基本思想SPSSSPSS 基本思想同前面单样本基本思想同前面单样本K-S检验,但也有些检验,但也有些不同,就是分析的对象是不同,就是分析的对象是变量值的秩。变量值的秩。基本步骤基本步骤首先,首先,将两组样本混合并按升序排序将两组样本混合并按升序排序然后,然后,分别计算两组样本秩的累计频数和累分别计算两组样本秩的累计频数和累计频率。计频率。最后,最后,计算两组累计频率的差,得到秩的差计算两组累计频率的差,得到秩的
20、差值序列并得到值序列并得到D统计量,根据统计量,根据D统计量得出统计量得出的概率的概率P与显著性水平大小进行比较判断。与显著性水平大小进行比较判断。SPSSSPSS两独立样本两独立样本K-SK-S检验检验SPSSSPSS基本操作基本操作(以两独立样本(以两独立样本-使用寿命为例)使用寿命为例)SPSSSPSSSPSSSPSS方法三:两独立样本的游程检验方法三:两独立样本的游程检验 该方法的基本思想与单样本游程检验的基本相同,该方法的基本思想与单样本游程检验的基本相同,不同的是计算游程数的方法。两独立样本的游程不同的是计算游程数的方法。两独立样本的游程数依赖于变量的秩。数依赖于变量的秩。首先首先
21、,将两组样本混合并按升序排序,在变量值排,将两组样本混合并按升序排序,在变量值排序的同时,对应的组标记值也会随之重新排列序的同时,对应的组标记值也会随之重新排列 然后然后,对组标记值序列按前面的计算游程的方法进,对组标记值序列按前面的计算游程的方法进行计算游程数。若游程数较少,则说明两总体有行计算游程数。若游程数较少,则说明两总体有较大差异。反之,则差异不大。较大差异。反之,则差异不大。基本思想基本思想SPSSSPSS 根据游程数计算Z统计量121212121221212212(2()()(1)n nrnnZn nn nnnnnnn最后,最后,进行统计决策。进行统计决策。SPSSSPSS两独立
22、样本的游程检验两独立样本的游程检验SPSSSPSS的基本操作的基本操作(以两独立样本(以两独立样本-使用寿命为例)使用寿命为例)SPSSSPSSSPSSSPSS方法四:两独立样本的方法四:两独立样本的极端反应检验极端反应检验 将一组样本作为控制样本,另一组样本作将一组样本作为控制样本,另一组样本作为实验样本,以控制样本作为对照,检验为实验样本,以控制样本作为对照,检验实验样本相对于控制样本是否出现了极端实验样本相对于控制样本是否出现了极端反应。如果实验样本没有出现极端反应,反应。如果实验样本没有出现极端反应,则认为两总体分布无显著差异;反之则差则认为两总体分布无显著差异;反之则差异显著异显著。
23、基本思想基本思想SPSSSPSS 具体分析过程:具体分析过程:首先,首先,将两组样本混合按升序排序将两组样本混合按升序排序然后,然后,求出控制样本的最小秩求出控制样本的最小秩 Qmin 和最大秩和最大秩Qmax,并计算出跨度并计算出跨度S=Qmax-Qmin+1 接着接着,为消除样本数据中极端值对分析结果为消除样本数据中极端值对分析结果的影响,计算跨度之前可按比例去除控制的影响,计算跨度之前可按比例去除控制样本中部分靠近两端的样本值,然后再求样本中部分靠近两端的样本值,然后再求跨度,得到截头跨度。跨度,得到截头跨度。SPSSSPSS极端反应注重对跨度和截头跨度的分析。针对跨度极端反应注重对跨度
24、和截头跨度的分析。针对跨度或截头跨度计算的或截头跨度计算的H检验统计量为:检验统计量为:小样本下,小样本下,H统计量服从统计量服从Hollander分布;大样本下,分布;大样本下,H统计量近似服从正态分布。统计量近似服从正态分布。最后,最后,进行统计决策。进行统计决策。21()miiHQQSPSSSPSS两独立样本的极端反应检验两独立样本的极端反应检验SPSSSPSS的基本操作的基本操作(以两独立样本(以两独立样本-使用寿命为例使用寿命为例)SPSSSPSSSPSSSPSS应用举例(以城镇和农村储户存款金额比较为例)SPSSSPSSSPSSSPSSSPSSSPSS双样本双样本 Kolmogor
25、ov-Smirnov 检验检验SPSSSPSSWald-Wolfowitz 检验检验SPSSSPSS练习题 现有数据关于患者服用两种不同安眠药后现有数据关于患者服用两种不同安眠药后睡眠时间延长情况,请用四种不同方法来睡眠时间延长情况,请用四种不同方法来检验两种不同安眠药对睡眠时间延长分布检验两种不同安眠药对睡眠时间延长分布是否有显著差异?是否有显著差异?SPSSSPSS第三节多独立样本的非参数检验l中位数检验中位数检验lKruskal-Wallis检检验验lJonckheere-Terpstra检验检验城市身高样本数据北京79,75,78,76,72上海72,71,74,74,73成都76,7
26、8,78,77,75广州70,72,71,71,69四城市周岁儿童身高样本数据四城市周岁儿童身高样本数据SPSSSPSS中位数检验中位数检验 概念:概念:通过对多组独立样本的分析,检验通过对多组独立样本的分析,检验它们来自的总体的中位数是否存在显著差它们来自的总体的中位数是否存在显著差异。异。基本思想:基本思想:如果多个总体的中位数没有显如果多个总体的中位数没有显著差异,那么这个共同的中位数应在各样著差异,那么这个共同的中位数应在各样本组中均处在中间位置上。本组中均处在中间位置上。基本思想基本思想SPSSSPSS 分析步骤:分析步骤:首先,首先,将多组样本混合按升序排序,并求出混合样将多组样本
27、混合按升序排序,并求出混合样本的中位数。本的中位数。然后,然后,分别计算各组样本中大于和小于上述中位数分别计算各组样本中大于和小于上述中位数的样本个数,形成列联表。的样本个数,形成列联表。接着,接着,利用卡方检验方法分析各组样本来自的总体利用卡方检验方法分析各组样本来自的总体对于上述中位数的分布是否一致。如果各组中大对于上述中位数的分布是否一致。如果各组中大于(或小于)上述中位数的样本比例大致相同,于(或小于)上述中位数的样本比例大致相同,则可认为多组样本有共同的中位数,它们来自的则可认为多组样本有共同的中位数,它们来自的总体的中位数没有显著差异。反之,则有显著差总体的中位数没有显著差异。反之
28、,则有显著差异。异。最后,最后,进行统计决策。进行统计决策。SPSSSPSS计算示例计算示例SPSSSPSS多独立样本的中位数检验多独立样本的中位数检验SPSSSPSS基本操作基本操作以儿童身高以儿童身高.sav.sav为例为例分析分析非参数检验非参数检验K K个独立样本个独立样本SPSSSPSSSPSSSPSS因为概率因为概率P P小于小于0.050.05,所以拒绝,所以拒绝原假设,即认为原假设,即认为四个不同城市的四个不同城市的儿童身高的中位儿童身高的中位数有显著差异数有显著差异SPSSSPSSKruskal-Wallis检验 概念:概念:检验实质是两独立样本的曼检验实质是两独立样本的曼-
29、惠特尼惠特尼检验在多个独立样本下的推广,用于检验检验在多个独立样本下的推广,用于检验多个总体的分布是否存在显著差异。多个总体的分布是否存在显著差异。基本思想:基本思想:首先,首先,将多组样本数据混合并按升序排序,将多组样本数据混合并按升序排序,求出各变量值的秩求出各变量值的秩.基本思想基本思想SPSSSPSS 其次,其次,考察各组秩的均值是否存在显著差异。构考察各组秩的均值是否存在显著差异。构造造K-W检验统计量为:检验统计量为:最后,最后,根据根据K-W统计量相应的概率统计量相应的概率P值与显著性水值与显著性水平平 大小进行比较,作出决策。大小进行比较,作出决策。212()(1)kiiiKW
30、n RRN NSPSSSPSS多独立样本的多独立样本的Kruskal-WallisKruskal-Wallis检验的检验的SPSSSPSS操作操作以儿童身高以儿童身高.sav.sav为例为例SPSSSPSS因为概率因为概率P P值小值小于于0.050.05,所以拒,所以拒绝原假设,即认绝原假设,即认为四个城市的周为四个城市的周岁儿童身高的平岁儿童身高的平均秩差异是显著均秩差异是显著的,总体分布是的,总体分布是存在显著差异的存在显著差异的SPSSSPSSJonckheere-Terpstra检验检验概念概念:用于检验多个独立样本来自的多个总用于检验多个独立样本来自的多个总体的分布是否存在显著差异
31、的非参数检验体的分布是否存在显著差异的非参数检验方法。方法。基本思想:基本思想:同两独立样本的曼同两独立样本的曼-惠特尼惠特尼U检验检验类似,也是计算一组样本的观察值小于其类似,也是计算一组样本的观察值小于其他组样本观察值的个数。他组样本观察值的个数。基本思想基本思想SPSSSPSS 小样本下,构造的小样本下,构造的J-T统计量为:统计量为:大样本下,构造的大样本下,构造的Z统计量为:统计量为:ijijJTU221221()/423)(23)72kiikiiiJNnZNNnn最后,根据统计量得到的概率最后,根据统计量得到的概率P P值与显值与显著性水平大小进行比较,作出决策著性水平大小进行比较
32、,作出决策SPSSSPSS多独立样本的多独立样本的Jonckheere-TerpstraJonckheere-Terpstra检验的检验的SPSSSPSS操作操作以儿童身高以儿童身高.sav.sav为例为例SPSSSPSSSPSSSPSS练习 现有不同地区不同性质工作的职工工资数据保存在文件“职工工资.sav”中,如果定义一个分组变量,将我国东部、中部和西部各省标上1,2,3作为分组值,下面来考察东部、中部和西部的职工平均工资是否存在显著差异(=0.05)?SPSSSPSS 两配对样本的非参数检验是在对总体分两配对样本的非参数检验是在对总体分布不甚了解的情况下,通过对两组配对样布不甚了解的情况
33、下,通过对两组配对样本的分析,推断样本来自的两个总体的分本的分析,推断样本来自的两个总体的分布是否存在显著差异的方法。布是否存在显著差异的方法。第四节第四节 两配对样本的非参数检验两配对样本的非参数检验概念概念SPSSSPSS Mcnemar 符号检验符号检验 Wilcoxon符号检验符号检验方法方法SPSSSPSS方法一:两配对样本的方法一:两配对样本的Mcnemar方法方法 McNemar检验是一种变化显著性检验,检验是一种变化显著性检验,它将研究对象自身作为对照者检验其它将研究对象自身作为对照者检验其“前前后后”的变化是否显著。其原假设是两配对的变化是否显著。其原假设是两配对样本来自的两
34、总体的分布无显著性差异。样本来自的两总体的分布无显著性差异。基本思想基本思想 该方法主要该方法主要针对服从二项分布的变量针对服从二项分布的变量,因,因此如果变量不是二项分布,还要先对数据进行此如果变量不是二项分布,还要先对数据进行转化,然后再检验。因此有一定的局限性转化,然后再检验。因此有一定的局限性SPSSSPSS分析分析非参数检验非参数检验2 2个相关个相关样本样本SPSSSPSS基本操作(以统计学基本操作(以统计学.sav.sav为例)为例)SPSSSPSSSPSSSPSS因为概率因为概率P P大于大于0.050.05,所以不能拒所以不能拒绝原假设,绝原假设,即认为学习即认为学习统计学前
35、后统计学前后学生对其重学生对其重要性认识没要性认识没有发生显著有发生显著变化变化SPSSSPSS方法二:两配对样本符号检验 其检验方法与其检验方法与McNemar检验有类似的解决检验有类似的解决思路,且利用正负号的个数实现检验。思路,且利用正负号的个数实现检验。基本步骤为:基本步骤为:首先,首先,分别用第二组样本的各个观察值减去分别用第二组样本的各个观察值减去第一组样本的对应观察值。差值为正则记第一组样本的对应观察值。差值为正则记为正号,为负则记为负号;为正号,为负则记为负号;然后然后,将正号的个数与负号的个数进行比较。,将正号的个数与负号的个数进行比较。基本思想基本思想SPSSSPSS 若两
36、种符号个数大致相同,则认为两组配若两种符号个数大致相同,则认为两组配对样本的数据分布差距较小;反之,则差对样本的数据分布差距较小;反之,则差距较大。距较大。检验方法仍然采用二项分布检验方法。检验方法仍然采用二项分布检验方法。SPSSSPSSSPSS基本操作(以训练成绩.sav为例)SPSSSPSS由于概率由于概率P P值值大于大于0.050.05,因此不能拒因此不能拒绝原假设,绝原假设,即认为训练即认为训练前后的成绩前后的成绩分布没有显分布没有显著差异,也著差异,也就是新方法就是新方法效果不显著效果不显著SPSSSPSS方法三:两配对样本Wilcoxon符号秩检验 首先首先,按照符号检验的方法
37、,用正负号分,按照符号检验的方法,用正负号分别表示两组对应样本数据差值情况。别表示两组对应样本数据差值情况。然后然后,将差值变量进行,将差值变量进行升序升序排序,并求出排序,并求出差值变量的秩。分别计算正号秩及统计量差值变量的秩。分别计算正号秩及统计量W+和负号秩及统计量和负号秩及统计量W-基本思想基本思想SPSSSPSSSPSSSPSS 小样本下,检验统计量为:小样本下,检验统计量为:W=min(W+,W-)大样本下,检验统计量为:大样本下,检验统计量为:(1/4)(1)(21)/24Wn nZn nn最后最后,进行统计决策进行统计决策SPSSSPSSSPSS基本操作(以训练成绩.sav为例
38、)SPSSSPSS因为概率因为概率P P值大值大于显著性水平于显著性水平0.050.05,所以不,所以不能拒绝原假设,能拒绝原假设,认为训练前后认为训练前后的成绩分布没的成绩分布没有显著差异,有显著差异,即新方法效果即新方法效果不显著不显著SPSSSPSS练习 一车间为了提高工作效率,对某种零件的一车间为了提高工作效率,对某种零件的加工过程进行改进,为了比较加工时间是加工过程进行改进,为了比较加工时间是否明显减少,抽取否明显减少,抽取15名工人对比他们改革名工人对比他们改革前后零件的加工时间,得到相应的数据存前后零件的加工时间,得到相应的数据存放在放在“改进前后零件加工时间改进前后零件加工时间
39、.sav”中,试中,试根据数据检验改进后零件的加工时间是否根据数据检验改进后零件的加工时间是否明显减少(明显减少(=0.05)?采用两配对样本符号)?采用两配对样本符号检验和两配对样本检验和两配对样本Wilcoxon符号秩检验方符号秩检验方法法SPSSSPSS第五节多配对样本的非参数检验 多配对样本的非参数检验是通过分析多配对样本的非参数检验是通过分析多组多组配对样本数据,配对样本数据,推断样本来自的多个总体推断样本来自的多个总体的中位数或分布是否存在显著差异。的中位数或分布是否存在显著差异。Eg:对多个评委对同一批歌手比赛打分标:对多个评委对同一批歌手比赛打分标准是否一致。准是否一致。概念概
40、念SPSSSPSS Friedman检验检验 Cochran Q检验检验 Kendall协同系数检验协同系数检验方法方法SPSSSPSS方法一:多配对样本的方法一:多配对样本的Friedman检验检验 概念:概念:多配对样本的多配对样本的Friedman检验是利用秩实检验是利用秩实现对多个总体分布是否存在显著差异的非参数检现对多个总体分布是否存在显著差异的非参数检验方法。验方法。基本思想:基本思想:比较每种处理下秩总和是否相等,即是否有比较每种处理下秩总和是否相等,即是否有 或或 存在来大体比较多个存在来大体比较多个总体分布是否有显著差异。总体分布是否有显著差异。但具体比较还要通过构造检验统计
41、量来进行。但具体比较还要通过构造检验统计量来进行。()ijRR ij()ijRR ij21121()(1)2kiinkFriedmanRk kSPSSSPSS方法一方法一SPSS基本操作基本操作(以促销方式(以促销方式.sav为例)为例)分析分析非参数检验非参数检验K K个相关个相关样本样本SPSSSPSSSPSSSPSS因为概率因为概率P P小小于显著性水平于显著性水平0.050.05,所以拒,所以拒绝原假设,即绝原假设,即认为三种不同认为三种不同促销方式下的促销方式下的销售额数据的销售额数据的分布存在显著分布存在显著差异差异因为第二种因为第二种促销形式下促销形式下的秩均值最的秩均值最大,因
42、此促大,因此促销效果最好销效果最好SPSSSPSS方法二:多配对样本的方法二:多配对样本的Cochran Q检检验验 概念:概念:通过对多个配对样本的分析,推断样本通过对多个配对样本的分析,推断样本来自的多个总体的分布是否存在显著差异。来自的多个总体的分布是否存在显著差异。基本思想:主要针对二值变量的,因此不进行基本思想:主要针对二值变量的,因此不进行秩的计算,构造秩的计算,构造Q检验统计量:检验统计量:最后进行统计决策最后进行统计决策2112111(1)()kkjijinniiiik kGGkQkLLSPSSSPSS方法一方法一SPSS基本操作基本操作(以航空公司(以航空公司.sav为例)为
43、例)SPSSSPSS因为概率因为概率P P小于小于0.050.05,所以拒绝原假设,所以拒绝原假设,认为三家航空公司认为三家航空公司的服务水平存在显的服务水平存在显著差异。著差异。因为甲航空因为甲航空公司得到乘公司得到乘客满意的人客满意的人数最多,因数最多,因此其服务水此其服务水平最高平最高SPSSSPSS方法三:多配对样本的方法三:多配对样本的Kendall协同协同系数检验系数检验 概念:概念:也是一种多配对样本的非参数检验方法,与也是一种多配对样本的非参数检验方法,与Friedman检验方法结合,可方便实现对评判者的评检验方法结合,可方便实现对评判者的评判标准是否一致的判断,其原假设是判标
44、准是否一致的判断,其原假设是评判者的评判评判者的评判标准不一致。标准不一致。基本思想:基本思想:分析还依赖于秩的大小比较。分析还依赖于秩的大小比较。协同系数协同系数2122(1)()2(1)/12niim nRWm n nSPSSSPSS最后,进行统计决策最后,进行统计决策 若根据若根据W计算得概率计算得概率 ,则则拒绝拒绝原假设,即认原假设,即认为评判者的评判为评判者的评判标准一致标准一致;若若 ,则,则不能拒绝不能拒绝原假设,即认为评判者的原假设,即认为评判者的标标准不一致。准不一致。PPSPSSSPSS方法三方法三SPSS基本操作(以评委打基本操作(以评委打分分.sav为例)为例)SPSSSPSS因为概率因为概率P P小于小于0.050.05,所以拒,所以拒绝原假设,即认为各歌手得绝原假设,即认为各歌手得分的平均秩存在显著差异分的平均秩存在显著差异W W协同系数协同系数0.9550.955,非,非常接近常接近1 1,所以评委,所以评委的评分标准是一致的的评分标准是一致的