1、第九章第九章 非参数检验非参数检验一、参数统计与非参数统计参数统计与非参数统计的概念从总体中随机抽取一定含量的样本,用样本指标估计(推断)从总体中随机抽取一定含量的样本,用样本指标估计(推断)总体指标,大体上有两种方法。一是参数统计,另一种是非参总体指标,大体上有两种方法。一是参数统计,另一种是非参数统计。数统计。1、参数统计、参数统计 指在总体分布类型已知的条件下,对其未知参数进行检验的指在总体分布类型已知的条件下,对其未知参数进行检验的方法。方法。要求独立、正态(方差齐),如要求独立、正态(方差齐),如t检验、检验、F检验均属于参检验均属于参数统计。数统计。2、非参数统计、非参数统计 主要
2、采用符号或等级排列(秩排列)来代替数据本身的分析主要采用符号或等级排列(秩排列)来代替数据本身的分析方法。方法。它适用于它适用于任何分布类型资料任何分布类型资料的统计分析。秩和检验就是的统计分析。秩和检验就是一种非参数检验方法。一种非参数检验方法。适用条件参数统计参数统计:a.样本所在总体呈正态分布样本所在总体呈正态分布 b.各总体方差要齐各总体方差要齐 c.各个样本是相互独立的随机样本各个样本是相互独立的随机样本非参数统计非参数统计:a.总体分布为偏态或分布未知的计量资料;总体分布为偏态或分布未知的计量资料;b.等级资料;等级资料;c.个别数据偏大或小,一端或二端是不确定数值的资料(必选);
3、个别数据偏大或小,一端或二端是不确定数值的资料(必选);d.各组离散程度相差悬殊,即各总体方差不齐。各组离散程度相差悬殊,即各总体方差不齐。优 点参数统计:检验效能高(发现差别的能力,即把握度)。参数统计:检验效能高(发现差别的能力,即把握度)。非参数统计:非参数统计:a.使用于任何分布的资料使用于任何分布的资料 b.不受总体方差一致的限制不受总体方差一致的限制 c.可用于等级资料的统计分析可用于等级资料的统计分析 d.有些问题本身没有适当的参数检验方法,有些问题本身没有适当的参数检验方法,而非参数检验则恰能处理而非参数检验则恰能处理一、非参数统计的概念缺 点参数统计:易受使用条件的限制参数统
4、计:易受使用条件的限制非参数统计:非参数统计:a.由于它没有充分利用原始数据中所提供的信息,由于它没有充分利用原始数据中所提供的信息,故检验效能低故检验效能低 b.很多非参数统计检验方法都采用一些近似估计作很多非参数统计检验方法都采用一些近似估计作 出推断结论。因此,其结果有一定的近似性出推断结论。因此,其结果有一定的近似性参数检验与非参数检验比较参数检验与非参数检验比较参数检验参数检验 非参数检验非参数检验 资料服从正态分布资料服从正态分布 1 1、对资料没有特殊要求,总体为偏态、总体分布、对资料没有特殊要求,总体为偏态、总体分布未知的计量资料未知的计量资料2 2、等级资料、等级资料3 3、
5、有过大、有过大/小值的数据,或数据某一端没有具体值小值的数据,或数据某一端没有具体值4 4、总体方差不齐、总体方差不齐 检验效率高检验效率高 检验效率低,容易犯第二类错误,原因信息丧失或信检验效率低,容易犯第二类错误,原因信息丧失或信息利用不足息利用不足。秩和检验秩和检验第一节第一节 配对资料符号秩和检验配对资料符号秩和检验第二节第二节 两样本比较的秩和检验两样本比较的秩和检验第三节第三节 多个样本比较的秩和检验多个样本比较的秩和检验秩次:观察值由小到大排列后得到的秩序号,当几 个数据大小相同时,取平均秩次作为其秩次。秩和:用秩次代替原始数据求和得到。秩和检验:用秩和进行假设检验的方法。一、配
6、对资料秩和检验(Wilcoxon符号秩和检验法)当配对设计计量资料不具备参数检验的适用条件,可采用符号秩和检验法。它是将配对样本差值的中位数与0作比较一、配对资料秩和检验(Wilcoxon符号秩和检验法)例:10对小鼠吃中剂量和高剂量的保健食品后测得肝糖原数据如下:number中剂量高剂量1620.16958.472866.50838.423641.22788.904812.91815.205738.96783.176899.38910.927760.78758.498694.95870.809749.92862.2610793.94805.48 1、建立检验假设 H0:差值的总体中位数等于0
7、,即Md0 H1:差值的总体中位数不等于0,即Md0 双侧=0.05 2、计算统计量T值检验步骤(1)求差值:计算各对数据的差值(2)编秩:按差值绝对值由小到大编秩。编秩时差值为0,则舍去 不计;若差值的绝对值相等,称为相持,此时取平均秩次。3、求秩和并确定统计量T:将所有的秩次冠以原差值的符号,分别求出正负差值秩次之和,分别以T+,T表示。双侧Tmin(T+,T);单侧任取其一为T。本例T+=48.5;T=6.5二、配对资料符号秩和检验number中剂量高剂量差值秩次1620.16958.47338.31102866.50838.42-28.08-53641.22788.90147.6884
8、812.91815.202.291.55738.96783.1744.2166899.38910.9211.543.57760.78758.49-2.29-1.58694.95870.80175.8599749.92862.26112.34710793.94805.4811.543.54、确定P值和作出推断结论4 4、确定、确定P P值和作出推断结论值和作出推断结论 n表示差数不为表示差数不为0的对子数,本例:的对子数,本例:n=10。当当n50时,查附表时,查附表8确定确定P值,该表中列出的是一个范围:值,该表中列出的是一个范围:在n=10处,有范围:847;由于T=6.5在此范围之外,即有:5.6 2 20.05(3)0.05(3);0.050.05按按0.050.05水准,拒绝水准,拒绝 H H0 0,接受,接受H H1 1,故可认为四组,故可认为四组DNADNA含量有差别。含量有差别。小结