1、第九章第九章非参数检验非参数检验非参数检验非参数检验非参数检验是指在总体不服从正态分布且分布情况不明时,用来检验数据资料是否来自同一个总体的一类假设检验方法,因这些方法一般不涉及总体参数而得名。主要类型: Chi-square test 卡方检验 Binomial test二项式检验 Runs test 游程检验等等 变量关系的显著性检验类型变量关系的显著性检验类型 假设假设 m m=800样本样本1:X1795;S10m m1.96 Se样本样本2:X2790;S10接受区95拒绝区5B、卡方计算公式、卡方计算公式: 一、定类一、定类定类尺度:定类尺度:2检验检验卡方检验是用来检验样本中两个
2、定类变量的关系强度测量卡方检验是用来检验样本中两个定类变量的关系强度测量结果(卡方值)是否能推断总体。结果(卡方值)是否能推断总体。 A、2检验的假设:检验的假设: H0: 20; H1: 20;22()ijijjiijOEEC、卡方分布形状、卡方分布形状拒绝域拒绝域接受域接受域D、SPSS中卡方检验示例(性别与文化程度)中卡方检验示例(性别与文化程度)步骤:步骤:1)确定双变量总体参数的假设:)确定双变量总体参数的假设: H0: X20 ; H1: X2 0;2)确定检验此假设的概率标准:显著度为)确定检验此假设的概率标准:显著度为0.05。3)抽取一个样本容量为)抽取一个样本容量为1254
3、的随机样本,计算出样本中的随机样本,计算出样本中性别与文化程度的性别与文化程度的X227.89。4)选择用来检验)选择用来检验H0 的分布:的分布: X2分布,并根据显著度分布,并根据显著度0.05设立接受域设立接受域(P0.05)或拒绝域或拒绝域(P0.05);5)观察样本的统计量的概率值是否落在接受域内,从而)观察样本的统计量的概率值是否落在接受域内,从而判断是接受判断是接受/拒绝原假设。从下表看出,样本统计量拒绝原假设。从下表看出,样本统计量X227.89,概率值(,概率值(Significance)=0.0000.05,落在拒,落在拒绝域,因此,否定绝域,因此,否定H0;接受总体中;接
4、受总体中X227.89的判断。的判断。此判断犯错误的概率)此判断犯错误的概率)=0.0000.05)或拒绝域或拒绝域(P0.05);5)观察样本的统计量的概率值是否落在接受域内,从而判断是接受)观察样本的统计量的概率值是否落在接受域内,从而判断是接受/拒绝原假拒绝原假设。从下表看出,样本统计量设。从下表看出,样本统计量F 6.006。 概率值(概率值(Significance)=0.0000.05,落在拒绝域,因此,否定落在拒绝域,因此,否定H0;拒绝总体中;拒绝总体中H0: 12 3 .k 的判断。的判断。即由样本可以推断总体,不同的文化程度,收入有差别;文化程度与收入有关。即由样本可以推断
5、总体,不同的文化程度,收入有差别;文化程度与收入有关。Report现在每月工资302.867137.93460.2818176.64773.50221386.82546.95213326.58676.57312470.18793.66146460.91828.86125618.19666.0015325.00681.22858509.60文化程度不识字或识字很少初小高小初中高中中专或中技大专大学本科研究生以上TotalMeanNStd.DeviationANOVA Table10489339.47 1498477 6.006 .000212065634850 249489.0222554974
6、857(Combined)BetweenGroupsWithin GroupsTotal现在每月工资 *文化程度Sum ofSquaresdfMeanSquareFSig.F值显著度三、三、 定距定距定距尺度相关系数定距尺度相关系数r的显著性检验的显著性检验: t检验检验t检验也可用来检验样本中一对定距变量的相关系数检验也可用来检验样本中一对定距变量的相关系数r在总在总体上是否有效。其检验的方式与前面的假设检验大同小异。体上是否有效。其检验的方式与前面的假设检验大同小异。在此我们只略述检验的原假设以及检验结果。在此我们只略述检验的原假设以及检验结果。 A、相关系数检验的原假设:、相关系数检验的
7、原假设:H0: r0 ; H1: r 0 ; B、检验结果:检验结果的概率值若小于给定的显著度,、检验结果:检验结果的概率值若小于给定的显著度,如如0.05,则推翻原假设,说明两变量总体上有相关。即样,则推翻原假设,说明两变量总体上有相关。即样本中的相关系数在总体中也有效。本中的相关系数在总体中也有效。C、SPSS中相关系数中相关系数 r 的的t检验示例:检验示例:CorrelateBivariate显著性检验结果Correlations1.000-.079*.0201254861-.079*1.000.020.861861Pearson CorrelationSig. (2-tailed)N
8、Pearson CorrelationSig. (2-tailed)N年龄现在每月工资年龄现在每月工资Correlation is significant at the 0.05 level (2-tailed).*. 相关系数样本量t检验概率值四、回归系数四、回归系数B的显著性检验:的显著性检验:t 检验检验样本中的回归公式中计算出的自变量回归系数样本中的回归公式中计算出的自变量回归系数B在总体中是否有效,需要用在总体中是否有效,需要用t分布来检验。检验步分布来检验。检验步骤同于前述的假设检验。骤同于前述的假设检验。 A、原假设:、原假设:H0: B0 ; H1: B 0 ; B、检验结果:
9、检验结果的概率值若小于给定的、检验结果:检验结果的概率值若小于给定的显著度,如显著度,如0.05,则推翻原假设,样本中的回归,则推翻原假设,样本中的回归公式可用于说明总体。公式可用于说明总体。C、 t分布形状分布形状:拒绝域拒绝域拒绝域拒绝域Coefficientsa823.3363.54012.958.000-3.4871.497-.079-2.329.020(Constant)年龄1BStd.ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: 现在每月工资a. 回归系数 t
10、值 t 值的显著度 第五章第五章 参数估计与假设检验参数估计与假设检验 主要内容主要内容第一节第一节 单一样本单一样本T检验检验 (One-Sample T Test)第二节第二节 独立样本独立样本T检验检验 (Independent-Sample T Test)第三节第三节 配对样本配对样本T检验检验 (Paired-Sample T Test)均值比较与均值比较的检验过程均值比较与均值比较的检验过程均值比较的概念均值比较的概念统计分析常常采取抽样研究的方法,即从总体中随机抽取一统计分析常常采取抽样研究的方法,即从总体中随机抽取一定数量的样本进行研究来推断总体的特性。由于总体中的每定数量的样
11、本进行研究来推断总体的特性。由于总体中的每个个体间均存在差异,即使严格遵守随机抽样原则也会由于个个体间均存在差异,即使严格遵守随机抽样原则也会由于多抽到一些数值较大或较小的个体致使样本统计量与总体参多抽到一些数值较大或较小的个体致使样本统计量与总体参数之间有所不同;又由于实验者测量技术的差别或测量仪器数之间有所不同;又由于实验者测量技术的差别或测量仪器精确程度的差别等等也会造成一定的偏差,使样本统计量与精确程度的差别等等也会造成一定的偏差,使样本统计量与总体参数之间存在差异。由此可以得到这样的认识:总体参数之间存在差异。由此可以得到这样的认识:均值不均值不相等的两组样本不一定来自均值不同的总体
12、相等的两组样本不一定来自均值不同的总体。能否用样本均值估计总体均值?两个变量均值接近的样本是能否用样本均值估计总体均值?两个变量均值接近的样本是否来自均值相同的总体?换句话说,否来自均值相同的总体?换句话说,两组样本某变量均值不两组样本某变量均值不同,其差异是否具有统计意义同,其差异是否具有统计意义?能否说明总体具有显著性差?能否说明总体具有显著性差异?这是各种研究工作中经常提出的问题。这就要进行均值异?这是各种研究工作中经常提出的问题。这就要进行均值比较。比较。一、一、 简介简介 主要用于检验单个变量的均值与假设检验值(给定的常数)之间是否存在差异,也可进行单样本的参数区间估计。二、完全窗口
13、分析二、完全窗口分析 按AnalyzeCompare MeansOne-Sample T Test顺序,打开One-Sample T Test主对话框(如图5-1)第一节第一节 单一样本单一样本T检验检验图图5-1 One-Sample T Test主对话框主对话框图图5-2 Options对话框对话框Test Variables框:用于框:用于选取需要选取需要分析的变分析的变量量Test Value:输输入已知的入已知的总体均值,总体均值,默认值为默认值为0Confidence Interval:输输入置信区间,入置信区间,一般取一般取90、95、99等。等。Missing Values:在
14、检验变量中含在检验变量中含有缺失值的观测将有缺失值的观测将不被计算。不被计算。在任何一个变量在任何一个变量中含有缺失值的观中含有缺失值的观测都将不被计算测都将不被计算三、例题分析三、例题分析(一) 05-1 某校在对一项教学改革措施的评价中,随机抽取了60位学生进行态度调查,他们的10项态度7级量表的态度反应资料见下表:教学改革态度反应得分(教学改革态度反应得分(x)人数(人数(f)1020220306304010405012506020607010合计合计60试构造学生态度得分平均值的试构造学生态度得分平均值的98%的置信区间。的置信区间。(二)以04-7的资料来说明。已知另一地区16-18
15、岁的少年血红蛋白平均值为11.657 (g%),检验这一地区16-18岁少年血红蛋白平均值是否与另一地区的平均值相等。1、操作步骤、操作步骤 1)(打开数据文件“04-7血红蛋白血红蛋白.sav”。)按AnalyzeCompare MeansOne Sample T Test顺序,打开主对话框。 2)将变量hb选入 Test Variable框。 3)在Test Value中输入 11.657,后单击OK。2、结果分析、结果分析O On ne e- -S Sa am mp pl le e S St ta at ti is st ti ic cs s4011.44482.2690.3588HBN
16、MeanStd.DeviationStd. ErrorMean表表5-1 单个样本统计量单个样本统计量 表5-1 是血红蛋白值的观测量个数、均值、标准差和均值的标准误等统计量。O On ne e- -S Sa am mp pl le e T Te es st t-.59239.558-.2122-.9379.5134HBtdfSig.(2-tailed)MeanDifferenceLowerUpper95% ConfidenceInterval of theDifferenceTest Value = 11.657表表5-2 单个样本检验单个样本检验 从表5-2可看出,t值为-0.592,自由
17、度为39,显著值为0.558,样本均值与检验值的差为-0.2122,该差值95%的置信区间是-0.93790.5134。 (三)为了解某村1300户农民的年收入状况,不重复抽取70户家庭进行调查,得出每户农民年平均收入为4500元,标准差为260元。试求该村每户农民年平均收入95%的置信区间。(四)某商品的零售商要求总代理增加广告费支出,认为如此每星期平均销售量可达20000箱。总代理增加广告费三个月后想了解平均销售情况,随机抽取16家零售店调查,发现每星期平均销售量只有15000箱,标准差为6000箱。假设销售量服从正态分布,试问平均销售量的下降是否因偶然因素所致(0.01)?一、一、 简介
18、简介 用于检验对于两组来自独立总体的样本,其独立总体的均值或中心位置是否一样。如果两组样本彼此不独立,应使用配对T检验(Paired -Sample T Test )。如果分组不止一个,应使用One-Way ANOVA 过程进行单变量方差分析。如果想比较的变量是分类变量,应使用Crosstabs功能。 独立样本T检验还要求总体服从正态分布,如果总体明显不服从正态分布,则应使用非参数检验过程(Nonparametric test)。第二节第二节 独立样本独立样本T检验检验两个独立样本之差的抽样分布两个独立样本之差的抽样分布 m m1s s1总体总体1s s2 m m2总体总体2抽取简单随机样抽取
19、简单随机样样本容量样本容量 n1计算计算X1抽取简单随机样抽取简单随机样样本容量样本容量 n2计算计算X2计算每一对样本计算每一对样本的的X1-X2所有可能样本所有可能样本的的X1-X2m m1 1 m m2 2两个总体均值之差的两个总体均值之差的检验检验 (s s12、 s s22 已知已知)1.假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布, 可以用正态分布来近似(n130和 n230) 2.检验统计量为两个总体均值之差的两个总体均值之差的检验检验 (s s12、 s s22 未知,大样本未知,大样本)检验统计量为两个总体均值之差的两个总体均值之差的检验检验 (s s1
20、2、 s s22 未知但相等未知但相等,小样本小样本)1.检验具有等方差的两个总体的均值2.假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知但相等3.检验统计量两个总体均值之差的两个总体均值之差的检验检验 (s s12、 s s22 未未知且不相等知且不相等,小样本小样本)1.检验具有不等方差的两个总体的均值2.假定条件 两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知且不相等s12 s223.检验统计量方差齐性检验(Levene F方法):计算两组样本的均值计算各个样本与本组均值的平均离差绝对值;利用单因素方差分析推断两独立总体平均离差绝对值是否有显
21、著差异。在对两独立样本进行T检验时,两组样本方差相等和不等时,计算t值使用的公式不同,所以首先进行方差F检验。用户需要根据F检验的结果,自己选择t检验输出中的结果,得出最后结论。如果推断两总体方差相等,则看方差相等的T检验值和P值;如果推断两总体方差不相等,则看方差不相等的T检验值和P值。图图53 独立样本独立样本T检验主对话框检验主对话框从源变量框中选取从源变量框中选取要作检验的变量。要作检验的变量。为分组变量,为分组变量,只能有一个。只能有一个。二、完全窗口分析二、完全窗口分析 按AnalyzeCompare MeansIndependent-Sample T Test顺序,打开Indep
22、endent- Sample T Test主对话框(如图5-3)在检验变量中含有缺在检验变量中含有缺失值的观测将不被计算。失值的观测将不被计算。在任何一个变量中含在任何一个变量中含有缺失值的观测都将不有缺失值的观测都将不被计算被计算输入置信区输入置信区间,一般取间,一般取90、95、99等。等。图图5-5 Independent-Sample T Test的的Options对话框对话框图图54 Define Groups 主对话框主对话框分别输入分组变量的取值条分别输入分组变量的取值条件,如件,如1为男,为男,2为女等。为女等。输入分界点值,如体重输入分界点值,如体重60公公斤等。斤等。三、例题分析三、例题分析(一) 05-2 某一个新的制造过程可以增加电池的使用寿命,假设电池使用寿命服从正态分布。在新电池中随机抽15个,而在旧电池中随机抽12个同时测试其使用寿命,资料如下,试求新旧两种电池平均寿命之差的95%的置信区间。新电池(日):18.2,10.4,12.6,18.0,11.7, 15.0,24.0,17.6,23.6,24.8,19.3,20.5, 19.8,17.1,16.3旧电池(日):12.1,7.5,8.6,13.9,7.8,15.1,17.9,10.6,13.8,14.2,15.3,11.6