1、第六章第六章 非参数统计非参数统计 n第一节第一节 引言引言 n第二节第二节 单样本非参数检验单样本非参数检验 n第四节第四节 两样本的非参数检验两样本的非参数检验 n第四节第四节 秩相关检验秩相关检验 第六章第六章 非参数统计非参数统计 本章重点与难点本章重点与难点n重点重点:了解和掌握了解和掌握单样本非参数检验、两样单样本非参数检验、两样本的非参数检验、秩相关检验本的非参数检验、秩相关检验的基本方法。的基本方法。难点难点:符号秩检验的基本原理和符号秩检验的基本原理和秩相关检验秩相关检验的基本原理及其计算方法。的基本原理及其计算方法。第一节第一节 引言引言 n一、关于非参数统计一、关于非参数
2、统计 n二、非参数统计中常用统计量二、非参数统计中常用统计量 一、一、关于非参数统计关于非参数统计 n非参数统计方法的共同特征是与总体分布无关,非参数统计方法的共同特征是与总体分布无关,即总体分布未知的情况下的统计推断方法。即总体分布未知的情况下的统计推断方法。n非参数检验总是比传统检验安全。但是在总体非参数检验总是比传统检验安全。但是在总体分布形式已知时,非参数检验就不如传统方法分布形式已知时,非参数检验就不如传统方法效率高。这是因为非参数方法利用的信息要少效率高。这是因为非参数方法利用的信息要少些。往往在传统方法可以拒绝零假设的情况,些。往往在传统方法可以拒绝零假设的情况,非参数检验无法拒
3、绝。非参数检验无法拒绝。 n注意:非参数统计的注意:非参数统计的“非参数非参数(nonparametric)”意味着其方法不涉及描述总体分布的有关参数;意味着其方法不涉及描述总体分布的有关参数;之所以称和总体分布无关之所以称和总体分布无关(distributionfree),是因为其推断方法不涉及到总体分布,不应理是因为其推断方法不涉及到总体分布,不应理解为与所有分布解为与所有分布(例如有关秩的分布例如有关秩的分布)无关。无关。二、非参数统计中常用统计量二、非参数统计中常用统计量n(一)(一) 顺序统计量顺序统计量n1顺序统计量顺序统计量 n2基于顺序统计量的统计量基于顺序统计量的统计量n3顺
4、序统计量的分布顺序统计量的分布1顺序统计量顺序统计量2基于顺序统计量的统计量基于顺序统计量的统计量3顺序统计量的分布顺序统计量的分布n(二)(二) 秩统计量秩统计量n1秩统计量秩统计量n2秩统计量的分布和数字特征秩统计量的分布和数字特征n3线性符号秩统计量线性符号秩统计量1秩统计量秩统计量2秩统计量的分布和数字特征秩统计量的分布和数字特征3线性符号秩统计量线性符号秩统计量第二节第二节 单样本非参数检验单样本非参数检验n一、单样本拟合优度检验一、单样本拟合优度检验n二、符号检验二、符号检验n三、三、Cox-Stuart趋势检验趋势检验n四、游程检验四、游程检验一、单样本拟合优度检验一、单样本拟合
5、优度检验二、符号检验二、符号检验(二)(二) Wilcoxon符号秩检验符号秩检验三、Cox-Stuart趋势检验我国进出口差额趋势图年份额度(亿美元)198619881990199219941996-150-100-50050100150四、游程检验n1游程的概念游程的概念n一个可以属性总体,如,按性别区分的人群、一个可以属性总体,如,按性别区分的人群、按产品是否有毛病区分的总体等等,随机从中按产品是否有毛病区分的总体等等,随机从中抽取一个样本,样本也可以分为两类;类型抽取一个样本,样本也可以分为两类;类型和类型和类型。若凡属类型。若凡属类型的记为符号的记为符号A,类型,类型的记为符号的记为
6、符号B,则当样本按某种顺序排列,则当样本按某种顺序排列(如如按抽取时间先后排列按抽取时间先后排列)时,一个或者一个以上时,一个或者一个以上相同符号连续出现的段,就被称作游程,也就相同符号连续出现的段,就被称作游程,也就是说,游程是在一个两种类型的符号的有序排是说,游程是在一个两种类型的符号的有序排列中,相同符号连续出现的段。列中,相同符号连续出现的段。 n【例【例6.5】 从生产线上抽取产品检验瑕疵的产从生产线上抽取产品检验瑕疵的产品是否是随机出现的。现随机抽了品是否是随机出现的。现随机抽了30件产品,件产品,按生产线抽取的顺序排列:按生产线抽取的顺序排列:n00001111111111111
7、1000111111111n问瑕疵的产品是随机出现的吗?问瑕疵的产品是随机出现的吗?第三节第三节 两样本的非参数检验两样本的非参数检验n一、配对符号检验一、配对符号检验n二、两样本配对二、两样本配对Wilcoxon检验检验n三、三、Brown-Mood 中位数检验中位数检验n四、四、Wlicoxon(Mann-Whitney)秩和检验)秩和检验一、配对符号检验一、配对符号检验二、两样本配对Wilcoxon检验三、Brown-Mood 中位数检验四、Wlicoxon(Mann-Whitney)秩和检验第四节第四节 秩相关检验秩相关检验n一、一、Pearson相关系数相关系数n二、二、Spearm
8、an秩相关检验秩相关检验n三、三、Kendall检验检验一、一、Pearson相关系数相关系数二、Spearman秩相关检验三、Kendall检验nKendall检验是从另一个角度来看相关检验是从另一个角度来看相关,其检验其检验的假设为:的假设为:n【例【例6.12】 下面用例下面用例6.11中中10个国家和地区个国家和地区1997年的国际化程度和国际竞争力的资料的关年的国际化程度和国际竞争力的资料的关系来说明系来说明Kendall检验。检验。n因而对于水平因而对于水平0.000拒绝零假设。显然拒绝零假设。显然10个国家个国家和地区和地区1997年的国际化程度和国际竞争力具有年的国际化程度和国
9、际竞争力具有显著相关性。显著相关性。 本章小结本章小结n1t检验并不稳健,在不知总体分布时,特别是小样检验并不稳健,在不知总体分布时,特别是小样本时,应用本时,应用t检验就可能有风险。这时就要考虑使用与检验就可能有风险。这时就要考虑使用与总体分布无关的非参数方法。对于本章所介绍的数据总体分布无关的非参数方法。对于本章所介绍的数据趋势或随机性检验,就不存在简单的参数方法。非参趋势或随机性检验,就不存在简单的参数方法。非参数方法总是简单实用的。符号检验是最有代表性的非数方法总是简单实用的。符号检验是最有代表性的非参数检验,一旦熟悉了符号检验的基本思路,后面的参数检验,一旦熟悉了符号检验的基本思路,
10、后面的内容就很容易理解了。内容就很容易理解了。n2两相关样本的非参数检验通常是用来比较成对数据两相关样本的非参数检验通常是用来比较成对数据的,它包括符号检验与两样本配对的,它包括符号检验与两样本配对Wilcoxon检验。符检验。符号检验只用到它们差异的符号,而对数字大小所包含号检验只用到它们差异的符号,而对数字大小所包含的信息未能考虑。配对的信息未能考虑。配对Wilcoxon检验既考虑了差异的检验既考虑了差异的正、负号,又考虑了两者差值的大小。正、负号,又考虑了两者差值的大小。 n3两独立样本的非参数检验通常是用来比较两个不同两独立样本的非参数检验通常是用来比较两个不同总体的位置参数,传统的总
11、体的位置参数,传统的t检验在比较两个不同总体的检验在比较两个不同总体的位置参数时并不稳健,在不知总体分布时,应用位置参数时并不稳健,在不知总体分布时,应用t检验检验是会有风险的。因此我们介绍了一些更为稳健的非参是会有风险的。因此我们介绍了一些更为稳健的非参数方法包括:数方法包括:Brown-Mood 中位数检验、中位数检验、Wlicoxon(Mann-Whitney)秩和检验。比较两个总体的中位数)秩和检验。比较两个总体的中位数的检验时,的检验时,Brown-Mood 中位数检验只利用了样本大中位数检验只利用了样本大于或小于共同中位数的数目,如同前面的单独符号秩于或小于共同中位数的数目,如同前面的单独符号秩检验一样,只有方向的信息,没有差异大小的信息。检验一样,只有方向的信息,没有差异大小的信息。作为单样本的作为单样本的Wlicoxon秩和检验的推广,我们介绍了秩和检验的推广,我们介绍了两个样本的两个样本的Wlicoxon秩和检验。秩和检验。n4相关系数相关系数 同样只能度量同样只能度量 与与 的线性关系,的线性关系,并且存在其他缺陷。非参数相关性检验,并且存在其他缺陷。非参数相关性检验,Spearman相关系数与相关系数与Kendall相关系数同样作相关系数同样作为衡量相关性的工具,为衡量相关性的工具, 克服了相关系数的以上克服了相关系数的以上缺陷。缺陷。rrXY