1、S P S S在会计和财务管理中的应用 苏海洋第6章 非参数检验n学习目标:n理解非参数检验和参数检验的区别;n掌握分布拟合检验的SPSS操作及结果解释;n掌握独立性检验的SPSS操作及结果解释;n掌握二项检验的SPSS操作及结果解释;n掌握两独立样本非参数检验的SPSS操作及结果解释;n掌握两相关样本非参数检验的SPSS操作及结果解释。前言n由于参数假设检验需要满足一系列前提条件,因而无法对所有数据类型做出正确的统计推断。于是人们又发展出了非参数检验的方法以解决不适合参数检验条件数据的统计推断。6.1 非参数检验简介6.1.1 非参数检验和参数检验的异同n参数检验(parametric te
2、st),是在总体分布形式已知的前提下,检验同一分布族中的参数异同。n非参数检验(non-parametric test),是在总体分布未知,或参数检验的其它必要条件(如方差齐性)不满足时,对总体做统计推断的方法n假设检验的一般原理对这两类方法都适用,置信水平1-、p值等的概念也具有相同的涵义。6.1 非参数检验简介6.1.1 非参数检验和参数检验的异同6.1 非参数检验简介n6.1.2 非参数检验的优缺点n优点n非参分布的限制,对不满足总体分布假设的数据仍可使用。n非参数检验往往不需要大样本,小样本情况下结果也较为可靠。n非参数检验对计数数据、定类数据和定序数据等非连续变量数据都可使用。6.1
3、 非参数检验简介n6.1.2 非参数检验的优缺点n缺 点n未能充分利用数据的全部信息。在将原始数据转换成等级、符号时,丢失了原始数据提供的数量大小的信息。n 非参数方法不能像多因素方差分析一样分析交互作用,并对其做假设检验。n 非参数方法的统计检验力往往低于相应的参数检验。 6.1 非参数检验简介6.1.3 非参数检验的SPSS过程6.2 卡方检验n6.2.1 卡方检验的一般原理n 卡尔皮尔逊(Pearson, K.,1900),以频数数据对象的假设检验,它以实际观测次数和理论期望次数之间的差异构造出 统计量,从而利用 分布进行假设检验, 统计量公式为 k 是样本分类数; f oi表示第i 类
4、实际观测到的频数; fei表示第i 类理论分布下的频数。22kieieioifff226.2 卡方检验n6.2.1 卡方检验的一般原理n当频数n充分大时, 统计量渐进服从 分布。如果从样本计算出的 统计量很大,则它所对应的p值会很小,说明总体在原假设条件下样本取到实际观测频数的可能性是非常小的,若小于事先确定的显著性水平,则拒绝原假设H0;反之,观测到的频数与理论频数差距越小, 值就越小,假设检验的p值就越大,若该p值大于事先确定的显著性水平,则接受原假设H0。2226.2 卡方检验n6.2.1 卡方检验的一般原理n当某个类别的理论频数较小(fei5)时, 统计量与 分布有一定差距,这时应用费
5、雪精确检验法来进行假设检验。n费雪精确检验(Fisher, R.A.,1922)是用排列组合的原理算出原假设条件下出现样本频数的精确概率。226.2 卡方检验6.2.2 分布拟合检验6.2.3 独立性检验6.2 卡方检验6.2.2 分布拟合检验n分布拟合检验用于检验总体是否具有某个指定的分布或属于某一个分布族。n 拟合优度检验法是分布拟合检验的一种,它针对分组数据。n原理:假设样本来自的总体服从某一分布,然后求出随机变量落在每一组中的理论频数。26.2 卡方检验n6.2.2.2 拟合优度检验的SPSS过程n 案例6-1:数据“收入分布1.sav”中,某社区9557名居民的收入按行业惯例被 分成
6、了7个档次,如右图所示。检验该社区居民的人均月收入X(元)是否来自服从N (6000,2000)的总体?6.2 卡方检验n6.2.2.2 拟合优度检验的SPSS过程n案例分析:这是一个典型的分布拟合检验,正态分布参数是已知的,我们可以用 拟合优度检验法来检验样本数据是否和该正态分布有差异。首先我们需要将理论分布计算出来。n第一步:计算理论分布n步骤1:先将每组收入下限输入一个新的数据集中,如图。6.2 卡方检验n第一步:计算理论分布n步骤2:计算出理论累积概率。选择主菜单【转换(T)】中的【计算变量(C)】命令,打开计算变量对话框。按图中提示输入。6.2 卡方检验n第一步:计算理论分布n步骤2
7、【续】:n计算出理论累积概率。结果如图。6.2 卡方检验n第一步:计算理论分布n步骤3:计算累积次数分布。选择主菜单【转换】中的【计算变量】命令,打开计算变量对话框。在【目标变量】框中新建变量“累积人数”,并在【数学表达式】框中填写“累计概率*9557”,即得到理论分布的人数频次。6.2 卡方检验n第一步:计算理论分布n步骤3【续】:n计算累积次数分布。结果如图。6.2 卡方检验n第一步:计算理论分布n步骤4:将累积次数分布转换成简单次数分布。用累积人数中的后一组人数减前一组就可以得到每组的简单次数分布情况,即每组的理论人数。6.2 卡方检验n第一步:计算理论分布n步骤4:将累积次数分布转换成
8、简单次数分布。用累积人数中的后一组人数减前一组就可以得到每组的简单次数分布情况,即每组的理论人数。将这个理论人数复制到本章数据“收入分布1.sav”数据中6.2 卡方检验n第二步:拟合优度检验n步骤1:在进行 拟合优度检验之前,还要先对个案进行加权。选择主菜单【数据(D)】中的【加权个案(W)】命令,进入【加权个案】对话框,在对话框中选择【加权个案】选项,并将变量“实际人数”置入右边的【频率变量(F)】框中。6.2 卡方检验n第二步:拟合优度检验n步骤2:分组变量进行个案加权之后就可以开始进行 拟合优度检验了。依次选择【分析(A)】【非参数检验(N)】【旧对话框(L)】【卡方(C)】命令。26
9、.2 卡方检验n第二步:拟合优度检验n步骤3:单击【卡方(C)】进入其主对话框,把变量“组序号”置入右边的【检验变量列表(T)】框中,右边勾选【期望】下的【值(V)】以便输入理论人数。6.2 卡方检验n第二步:拟合优度检验n步骤4:结果解释。n表6-2给出的是观察数、期望数和残差,利用这些数据我们做 检验。 26.2 卡方检验n第二步:拟合优度检验n步骤4【续】:n统计量 的值为(2.034E9)2.034109, 对应的p值(渐进显著性)为0.000,即p0.05,该例题的原假设H0是数据分布服从N(6000,2000)的正态分布,因此应该拒绝原假设。 226.2 卡方检验n思考:n 统计量
10、的值为(2.034E9),即2.034109n这么大的统计量?n理论次数小于5的单元格有1个,因此统计量不服从 分布。n此时应采用费雪精确检验,但SPSS不提供该检验的办法。n我们可以用合并单元格来解决226.2 卡方检验n合并单元格后进行拟合优度检验n我们将最后两组合并,使得合并后的所有组理论频数大于5。合并后我们可以重复上述的 拟合优度检验操作步骤。26.2 卡方检验n合并单元格分析后结果解释。n此时 统计量的值为27157.805,对应于自由度为5的 分布p值为0.0000.05,因此应该原假设。虽然在这个例子中最后的统计推论和合并组之前无异,但是检验统计量的值却相差甚远,因此我们要特别
11、注意单元格理论频数不得小于5的假设。26.2 卡方检验n6.2.3 独立性检验n独立性检验简介:目的是从样本数据中推断总体两个变量是否彼此独立的检验,相当于独立样本比率差异的显著性检验,所需的数据通常为kj 交叉表。6.2 卡方检验n6.2.3 独立性检验n例如,对200名消费者购买日用品的名牌偏好和性别这两个变量做了调查,汇总结果如表6-6所示,试问名牌偏好和性别两个变量是否相互独立?男女合计偏好名牌6971140不偏好名牌411960合计11090N=200观 察 频 数6.2 卡方检验6.2.3 独立性检验n独立性检验的原假设H0为男女消费者在品牌偏好上的比率没有显著差异,若该原假设成立
12、,则每一格的理论fei次数应为 (fxi和fyi分别为性别变量和偏好变量的边际频数。)男女合计偏好名牌7763140不偏好名牌332760合计11090N=200理理 论论 频频 数数Nfffyixiei6.2 卡方检验n6.2.3 独立性检验n由此我们可以计算出 统计量并进行假设检验,此时 统计量服从自由度为(k-1)(j-1)=(2-1)(2-1)=1的 分布。男女合计偏好名牌6971140不偏好名牌411960合计11090N=200观 察 频 数男女合计偏好名牌7763140不偏好名牌332760合计11090N=200 理 论 频 数2226.2 卡方检验n6.2.3 独立性检验n案
13、例6-2:本章数据“性别与偏好.sav”是男性和女性购买日用品时对品牌的偏好类型(偏好品牌和不偏好品牌),试分析消费者购买日用品时对品牌的偏好是否与性别有关,或者说男性和女性购买日用品时的品牌偏好比率是否存在差异。6.2 卡方检验6.2.3 独立性检验n步骤1:n打开数据,依次选择【分析(A)】【描述统计】【交叉表(C)】命令6.2 卡方检验6.2.3 独立性检验n步骤2:单击【交叉表(C)】进入其主对话框,并将两个变量分别置入【行(S)】和【列(C)】框中,这里将“性别”放入【行(S)】中,将“名牌偏好”放入【列(C)】框中。6.2 卡方检验6.2.3 独立性检验n步骤3:单击【统计量(S)
14、】进入其对话框,选择【卡方(H)】选项,如图6-17所示。单击【继续】按钮回到主对话框,最后单击【确定】按钮,提交系统分析6.2 卡方检验6.2.3 独立性检验n步骤4:结果解释。该例的原假设是性别与名牌偏号是没有关联的(独立的),因为 统计量的检验概率p=0.01310, n210)和小样本两种情形下计算方法不同,但都是以两样本的秩为出发点进行计算的。原假设下的U统计量的分布为已知,小样本时为精确概率,样本量大时趋于正态分布。6.4 两独立样本非参数检验n6.4.2 Mann-Whitney U检验n2.Mann-Whitney U检验的SPSS过程n案例6-4:数据“电暖气月销量.sav”
15、(见表6-11)为某企业某款电暖气2014和2015年度的月销售量数据,请分析这两年的月销量分布是否相同。1月2月3月4月5月6月7月8月9月10月11月12月20141351191068941322331409812112320151951751821507542921237181106表6-11 某企业某款电暖气月销量(台)6.4 两独立样本非参数检验n6.4.2 Mann-Whitney U检验n2.Mann-Whitney U检验的SPSS过程n案例分析:数据的组织方式和进行两独立样本t检验时一样,只是月销量的数据并不服从正态分布,也不需要这样的假设。6.4 两独立样本非参数检验n6.
16、4.2 Mann-Whitney U检验n2.Mann-Whitney U检验的SPSS过程n步骤1:打开数据,依次选择【分析(A)】【非参数检验(N)】【旧对话框(L)】【2个独立样本(2)】命令。6.4 两独立样本非参数检验n6.4.2 Mann-Whitney U检验n2.Mann-Whitney U检验的SPSS过程n步骤2:单击【2个独立样本(2)】进入其主对话框。将“电暖气月销量”置入【检验变量列表(T)】框中,将“年份”置入【分组变量(G)】框中,定义组的方式与两独立样本t检验过程相同,这里通过单击【定义组(D)】进入对话框定义比较的组别,即2014和2015年6.4 两独立样本
17、非参数检验n6.4.2 Mann-Whitney U检验n2.Mann-Whitney U检验的SPSS过程n步骤3:这里选择系统默认的Mann-Whitney U检验法,由于此例中两个样本量都大于10,因此不需要使用精确检验法。6.4 两独立样本非参数检验n6.4.2 Mann-Whitney U检验n2.Mann-Whitney U检验的SPSS过程n步骤4:结果解释。表6-11分别输出了电暖气月销量在2014年和2015年的样本量、秩平均值和秩和。表6-12中的Z统计量值为-0.231,渐进显著性p值为0.817 0.05,因此我们接受电暖气在2014和2015年度的销量分布来自同一总体
18、的原假设。6.5 两相关样本非参数检验n6.5.1 两相关样本非参数检验的一般原理n两相关样本非参数检验对应于参数检验中的配对样本t检验,只是配对样本假设两样本来自正态分布的总体,而两相关样本非参数检验则用于总体非正态的数据。两相关样本非参数检验同样也是检验两个成对数据的差值的中位数是否与0存在显著性差异。两相关样本非参数检验中,SPSS提供了4种检验方法:Wilcoxon检验、符号检验、McNemar检验和边际同质性检验。6.5 两相关样本非参数检验n6.5.2 符号检验n1.符号检验的原理n符号检验是把正负符号作为数据的一种非参数检验程序,适用于检验两个来自不对称分布的配对样本的差异。符号
19、检验以中位数作为集中趋势的量度,其原假设是配对资料差值来自中位数为零的总体。与配对样本t检验的思路类似,符号检验先求出两样本每对数据之差(xi-yi),若原假设成立,则正差值的个数n+和负差值的个数n-应各占一半左右。检验统计量为N= n+ n-, 当样本量较小时(N25),可以精确计算出原假设成立时N的各个取值的精确概率,而样本量较大时,N渐进服从正态分布。这样我们可以根据N 统计量进行假设检验。6.5 两相关样本非参数检验n6.5.2 符号检验n2.符号检验的SPSS过程n案例6-5:本章数据“台式电脑销量.sav”是各个企业在各电商平台开设旗舰店前后的同期月销量对比数据。试研究电商平台的
20、使用是否显著增加了这些企业的台式电脑月销量。6.5 两相关样本非参数检验n6.5.2 符号检验n1.符号检验的原理n2.符号检验的SPSS过程n案例分析:各企业的台式电脑月销量数据不服从正态分布的状态下,样本量少于30,达不到配对样本t检验的条件,为了保证检验的准确性,这时采用非参数检验该类型数据是比较合适的。6.5 两相关样本非参数检验n2.符号检验的SPSS过程n案例分析:各企业的台式电脑月销量数据不服从正态分布的状态下,样本量少于30,达不到配对样本t检验的条件,为了保证检验的准确性,这时采用非参数检验该类型数据是比较合适的。n步骤1:打开数据,依次选择【分析(A)】【非参数检验(N)】
21、【旧对话框(L)】【2个相关样本(L)】命令。6.5 两相关样本非参数检验n2.符号检验的SPSS过程n步骤2:单击【2个相关样本(L)】进入其对话框,将变量“电脑月销量_前”和“电脑月销量_后”依次选中置入【检验对】框中,系统默认的是【Wilcoxon】检验法,但是这里重新勾选【符号检验(S)】检验法。如果检验的对数超过1对,也可以一次性进行检验。6.5 两相关样本非参数检验n2.符号检验的SPSS过程n步骤3:由于样本量较小,应精确计算概率。单击对话框右上角的【精确(X)】按钮,在弹出的对话框中勾选【精确(X)】,如图6-30,其余保持SPSS默认值。单击【继续】按钮回到主对话框 。6.5
22、 两相关样本非参数检验n2.符号检验的SPSS过程n步骤4:结果解释。表6-14给出的是“电脑月销量_后”小于“电脑月销量_前”(负差分)的次数(5),“电脑月销量_后”大于“电脑月销量_前”(正差分)的次数(6)。6.5 两相关样本非参数检验n2.符号检验的SPSS过程n步骤4【续】:n经检验,表6-15的精确显著性的单双侧p值都是大于0.05,所以接受原假设,即说明电商这种平台的使用并没有显著增加这些企业的台式电脑同期月销量。小结n本章学习了非参数检验的适用条件以及它和参数检验的区别与联系;n非参数检验的具体方法有很多,本章着重讨论了卡方检验、二项检验、Mann-Withney U检验和符号检验的原理,操作步骤和结果解释。THANK YOU!