1、第第3 3讲讲 单样本非参数统计单样本非参数统计卡方检验卡方检验 传统的非参数统计传统的非参数统计 单样本非参数检验 两样本(独立和相关)非参数检验 多样本(独立和相关)非参数检验单样本检验及方法单样本检验及方法什么叫单样本检验呢?什么叫单样本检验呢?在进行统计分析过程中,往往需要根据一组样本的信息来对某个某个总体分布总体分布或抽样过程是抽样过程是否随机否随机进行判断,利用一个样本对总体进行推断的非参数检验。卡方检验二项分布检验科尔戈洛夫-斯米尔诺夫单样本检验游程检验主讲方法:主讲方法:卡方检验二项分布检验科尔莫戈罗夫-斯米尔诺夫(Kolmogorov-Smirnov)检验游程检验3.1 卡方
2、检验的求解思想和方法思想:卡方检验是在给定样本 观察值 nXXX,.,21nxxx,.,21的情况下,检验总体是否服从有关分布)(XF的一种非参数统计方法。(1 1)建立零假设和备择假设)建立零假设和备择假设分布函数和密度函数的区别知道吧?分布函数和密度函数的区别知道吧?(2 2)构造和计算统计量)构造和计算统计量把实轴 分成 个不相交的区间 ),(k),(,.,(,(1211kaaaa设样本观察值 落入每个区间的实际频数为nxxx,.,21if则实际频率为nfi当零假设成立时,样本值落在每个区间的概率 可以由分布函数 精确计算,则每个区间的理论频数为ip)(xFinp当假设成立时,理论频数
3、与实际频数 应该相差很小inp构造统计量kiiiinpnpf122)(if(3 3)设定显著性水平和确定否定域)设定显著性水平和确定否定域给定显著性水平 。在零假设成立时,统计量服从自由度为21k的卡方分布。否定域为 )1(2122 k y=chi2(x,5)0246810121416182022240.000.020.040.060.080.100.120.140.16(4 4)做出统计决策)做出统计决策如果 统计量的值落在否定域2 )1(2122 k 中,拒绝零假设,即总体不服从指定分布)(XF即 的概率P值?显著性水平23.2 卡方检验的例题例:医学家研究心脏病人猝死人数与日期的关系时发
4、现,一周之中星期一心脏病人猝死者较多,其他日子基本相同。每天的比例近似为2.8:1:1:1:1:1:1.现在收集到168个观察数据,其中星期一至星期日的死亡人数分别为:55,23,18,11,26,20,15。现在利用这批数据,推断心脏病人猝死人数与日期的关系是否成立?3.2 卡方检验的例题解:该问题可以转化为检验心脏病猝死人数在一周时间内的分布是否同预期分布相同,可以使用卡方检验进行处理,过程如下:(1 1)建立零假设和备择假设)建立零假设和备择假设 零假设:每天心脏病猝死人数分布同预期分布相同 备择假设:每天心脏病猝死人数分布同预期分布不同3.2 卡方检验的例题(2 2)构造和计算统计量)
5、构造和计算统计量怎么计算得到的呢?2小答案 2.8/8.8=0.3181 168*0.3181=53.44083.2 卡方检验的例题(3 3)设定显著性水平和确定否定域)设定显著性水平和确定否定域给定显著性水平0.05,在原假设成立时,统计量2服从自由度为7-1=6的卡方分布,否定域为:59.12)6(295.022 3.2 卡方检验的例题(4 4)做出统计决策)做出统计决策统计量 =7.752,没有落在否定域259.12)6(205.022中,接受零假设零假设:每天心脏病猝死人数分布同预期分布相同因此,医学家的研究结论是正确的哦。因此,医学家的研究结论是正确的哦。y=chi2(x,5)024
6、6810121416182022240.000.020.040.060.080.100.120.140.163.3 3.3 卡方检验的卡方检验的SPSSSPSS软件实现软件实现(1)输入例子中的数据,如图所示。切记要加权!卡检验的SPSS操作勾选“值”输入2.8,点“添加”改成1,点“添加”,依次进行1个2.8,6个1,最后点OK!死亡日期5553.51.52319.13.91819.1-1.11119.1-8.12619.16.92019.1.91519.1-4.11681.002.003.004.005.006.007.00TotalObserved NExpected NResidual得到卡方检验结果,分两部分得到卡方检验结果,分两部分注意:学习了卡方检验的方法和过程后,你会解读软件给注意:学习了卡方检验的方法和过程后,你会解读软件给出的分析结果吗?出的分析结果吗?答案 P值=0.256,大于显著性水平0.05,接受原假设,认为原分布成立,即原来医生的结论是正确的。