1、2023-2-16第七章 总体分布的拟合优度检验Goodness of Fit Test for Distribution of Population2023-2-16为什么要知道总体分布?为什么要知道总体分布?1.参数统计学推断方法(如t检验、F检验)均以服从某一分布(如正态分布)为假定条件。2.实际工作中需要了解样本观察频数(Observed frequency,简记为O)是否与某一理论频数(Expected frequency,简记为E)相符。2023-2-16本章介绍的拟合优度检验方法本章介绍的拟合优度检验方法1.卡方检验卡方检验2.正态性检验的W法(Shapiro-wilk法)、D法
2、(Kolmogorov-Smirnov法)2023-2-16第一节第一节 拟合优度检验拟合优度检验的原理与计算步骤的原理与计算步骤1.原理原理 判断样本观察频数(判断样本观察频数(Observed frequency)与理论与理论(期望期望)频数(频数(Expected frequency)之差)之差是否由抽样误差所引起。是否由抽样误差所引起。2023-2-16数据格式与计算公式221(),1kiiPiiOEkaEa 为参数的个数注意:理论频数注意:理论频数Ei不宜过不宜过小(如不小于小(如不小于5),否则需),否则需要合并组段!要合并组段!2023-2-16注意:理论频数不宜过小,否则需要合
3、并注意:理论频数不宜过小,否则需要合并2.计算步骤计算步骤2023-2-162/)12/(2222)2/(21)(ef3.847.8112.59P P0.050.05的临界值的临界值2分布分布(chi-square distribution)2023-2-16卡方分布下的检验水准及其临界值卡方分布下的检验水准及其临界值2023-2-16第二节第二节 离散型随机变量分布的离散型随机变量分布的拟合优度检验拟合优度检验一、二项分布的拟合优度检验一、二项分布的拟合优度检验二、二、Poisson分布的拟合优度检验分布的拟合优度检验2023-2-16一、二项分布的拟合优度检验一、二项分布的拟合优度检验【例
4、7.4】某研究人员在某地随机抽查了150户3口之家,结果全家无某疾病有112户,家庭中1人患病的有20户,2人患病的有11户,3人全患病有7户,问该病在该地是否有家族聚集性。解:如果家庭成员之间的发病与否(解:如果家庭成员之间的发病与否(X)互)互不影响,则不影响,则X符合二项分布(符合二项分布(两种互斥结果两种互斥结果、试验条件不变、各次试验独立、试验条件不变、各次试验独立)。也就)。也就表明疾病不具有家族聚集性。表明疾病不具有家族聚集性。2023-2-162023-2-16二、二、Poisson分布的拟合优度检验分布的拟合优度检验【例7.3】将酵母细胞的稀释液置于某种计量仪器上,数出每一小
5、方格内的酵母细胞数,共观察了413个小方格,结果见表7.3第1、2列,试问该资料是否服从Poisson分布?2023-2-16卡方分量卡方分量P(7)0.0005562023-2-16其他离散型变量分布的拟合优度检验其他离散型变量分布的拟合优度检验1.二项分布2.Poisson分布3.超几何分布超几何分布4.负二项分布负二项分布 可仿照上述二项分布、可仿照上述二项分布、Poisson分分布的方法进行分布的拟合优度检验。布的方法进行分布的拟合优度检验。2023-2-16第三节第三节 连续型随机变量分布的连续型随机变量分布的拟合优度检验拟合优度检验一、采用一、采用卡方检验卡方检验进行正态性检验进行
6、正态性检验二、采用二、采用Shapiro-Wilk法法进行正态性进行正态性检验检验三、采用三、采用Kolmogorov-Smirnov法法进行进行正态性检验正态性检验2023-2-16一、采用一、采用卡方检验卡方检验进行正态性检验进行正态性检验2023-2-1655 101.2942.9704815.5847121XXZS 2023-2-16拟合优度卡方检验的问题拟合优度卡方检验的问题1.1.分组不同,拟合的结果可能不同。分组不同,拟合的结果可能不同。2.2.需要有足够的样本含量。需要有足够的样本含量。对于连续型变量的优度拟合,卡方检验并不是理想的方法。对于连续型变量的优度拟合,卡方检验并不是
7、理想的方法。统计学家推荐的拟合检验方法是:统计学家推荐的拟合检验方法是:Shapiro-Wilk检验检验 Kolmogorov-Smirnov检验检验2023-2-16二、采用二、采用Shapiro-Wilk法法进行正态性检验进行正态性检验由Shapiro和Wilk于1965年提出。常简称为W法,软件可计算出W统计量。适用于小样本。计算时需要采用常数表(附表9)。大样本时计算很复杂。2023-2-16【例7.6】用小鼠研究正常肝核糖核酸(RNA)对癌细胞的生物学作用,测定水层RNA诱导肝癌细胞的果糖二磷酸酯酶(FDP)活性的结果如下,请分析FDP活性是否服从正态分布?2023-2-16排序排序
8、后的数据一分为二后的数据一分为二由附表9获得所有变量值的SS2023-2-16三、采用三、采用Kolmogorov-Smirnov法法进行正态性检验进行正态性检验由Kolmogorov与Smirnov提出。原理:寻找最大距离(Distance),所以常简称为D法。适用于大样本。具体做法:具体做法:比较实际频数与理论频数的累积概率间的差距,找出最大距离D,根据D值来判断实际频数分布是否服从理论频数分布。2023-2-162023-2-16 Kolmogorov-Smirnov拟合优度检验拟合优度检验 图示图示60.12737D 7D40.11993D 2023-2-16P-P图表7-8的第4列表7-8的第5列