1、第十章第十章 Excel与与SPSS在统在统计实务中的应用计实务中的应用 内容介绍内容介绍学学习习目目的的与与要要求求 本章重点讲述如何使学生能够掌握Excel和 SPSS软件的基本操作,并能够利用软件中的相关功能解决有关的统计问题。学习本章的要求:Excel在统计实务中的应用 SPSS在统计实务中的应用在统计实务中的应用 两种软件在实际统计问题中的解决与应用重点与难点 重重 点点 Excel在统计实务中的应用 SPSS在统计实务中的应用在统计实务中的应用 难难 点点 两种软件在实际统计问题中的解决与应用第一节第一节 Excel在统计实务中的应用在统计实务中的应用 一、统计数据的整理一、统计数
2、据的整理 (一)制作频数分布表(一)制作频数分布表 数值型数据均表现为数值,在数据整理时通常数值型数据均表现为数值,在数据整理时通常是进行数据分组,分作后再计算出各组中出现是进行数据分组,分作后再计算出各组中出现的次数或频数,形成一张频数分布表。的次数或频数,形成一张频数分布表。以某电脑公司以某电脑公司2002年前四个月各天的销售量数年前四个月各天的销售量数 据为例。(单位:台)据为例。(单位:台)234159187155172183182177163158143198141167194225177189196203187160214168173178184209176188161152149
3、211196234185189196206150161178168174153186190160171228162223170165179186175197208153163218180175144178191197192166196179171233179187173174210154164215233175188237194198168174226180172190172187189200211156165175210207181205195201172203165196172176182188195202213电脑公司年前四个月冬天销售数据 首先对上面的数据进行排序,结果如下:14115
4、916617217718218819620321414316016717317718318919620321514416016817317818418919620521814916116817417818518919620622315016116817417818619019620722515216217017417918619019720822615316317117517918719119720922815316317117517918719219821023315416417217518018719419821023315516517217518018719420021123415616
5、5172176181188195201211234158165172176182188195202213237 然后进行分组和编制频数分布表:第一步:确定组数。,即应分为8组,考虑到本例中数据较多,我们可分为10组。第二步:确定各组的组距。组距=(最大值-最小值)组数,则组距=(237-141)10=9.6。为便于计算,组距取10。各组确定为:140150;150160;230240。2lglg1nK第三步:利用Excel制作频数分布表。1、将120个原始数据输入到Excel工作表中的A1:A120单元格 Excel工作表原始数据输入工作表原始数据输入 2、在B2:B11单元格输入每一组的上限
6、值。(注意:用Excel制作频数分布表时,一个组的频数包括该组的上限值,因此,我们应输入149,159,239)。3、选择“工具”下拉菜单,并选择“数据分析”选项(如果没有该选项,先在“工具”下拉菜单中选择“加载宏”命令,当出现对话框后,选择“分析工具库”选项,然后确定),在数据分析对话框中选择“直方图”命令。结果如下图所示:当出现对话框时,在“输入区域”方框内键入 A1:A120 在“接收区域”方框内键入 B2:B11 在“输出区域”方框内键入C2 选择“图表输出”结果如下图所示:选择“确定”后即得到频数分布表。我们对频数分布表进一步修饰后,结果如下表所示。某电脑公司销售量数据分组表某电脑公
7、司销售量数据分组表按销售量分组(台)频率(天)频率(%)14015043.33 15016097.50 1601701613.33 1701802722.50 1801902016.67 1902001714.17 200210108.33 21022086.67 22023043.33 23024054.17 合计120100.00 采用组距分组时,需要遵循“不重不漏”的原则。“不重”是指一项数据只能分在其中的某一组,不能在其它组中重复出现;“不漏”是指列出了所有的类别,即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。如果全部数据中的最大值和最小值与其它数据相差悬殊,为避免出现空
8、白组(即没有变量值的组)或个别极端值被漏掉,第一组和最后一组可以采取“以下”及“以上”这样的开口组。经过调整后如下表:某电脑公司销售量数据分组表某电脑公司销售量数据分组表按销售量分组(台)频率(天)频率(%)150以下43.33 15016097.50 1601701613.33 1701802722.50 1801902016.67 1902001714.17 200210108.33 21022086.67 22023043.33 230以上54.17 合计120100.00(二)数据的图示(二)数据的图示1、直方图 通过数据分组后形成的频数分布表,我们可以初步看出数据分布的一些特征和规律
9、。如果用图形来表示这一分布的结果,会更形象、直观。显示分组数据频数分布特征的图形有直方图、折线图和曲线图等。这里主要介绍直方图的绘制方法。直方图是用矩形的宽度和高度来表示频数分布的图形。在平面直角坐标中,我们用横轴表示数据分组,纵轴表示频数或频率,这样,各组与相应的频数就形成了一个矩形,即直方图。根据上例中的数据利用Excel绘制直方图。1、点击工具栏上的图表向导,打开图表向导对话框如图所示,按照提示一步一步操作。2、选择柱形图,得到输出结果如图所示:051015202530140150150160160170170180180190190200200210210220220230230240
10、销售量(台)频数(天)2、线图 如果数值型数据是在不同时间上取得的,即时间序列数据,可以绘制线图。线图是在平面坐标上用折线表现数量变化特征和规律的统计图。线图主要用于显示时间序列数据,以反映事物发展变化的规律和趋势。以19911998年我国城乡居民家庭的人均收入为例,数据如下表所示。绘制线图。19911998年城乡居民家庭人均收入单位:元年份城镇居民农村居民19911700.6 708.6 19922026.6 784.0 19932577.4 921.6 19943496.2 1221.0 19954283.0 1577.7 19964838.9 1926.1 19975160.3 2091
11、.1 19985425.1 2162.0 根据上表利用Excel绘制线图,基本步骤同绘制直方图,只是在这选择折线图。0.01000.02000.03000.04000.05000.06000.01991 1992 1993 1994 1995 1996 1997 1998年 份收 入城 镇 居 民农 村 居 民 图表向导对话框图表向导对话框 城乡居民家庭人均收入城乡居民家庭人均收入 二、用Excel进行统计分析 利用例10.1中的数据,说明利用Excel计算描述统计量的步骤。先将120个原始数据输入到Excel工作表中的A1:A120单元格。然后按下列步骤操作:第一步:选择“工具”下拉菜单,并
12、选择“数据分析”选项。第二步:在“数据分析”对话框中选择“描述统计”。结果如下图所示:数据分析对话框数据分析对话框 选择“确定”后,当出现对话框时:在“输入区域”方框内键入A1:A120 在“输出区域”方框内键入C2 选择“汇总统计”结果如下图所示:“描述统计描述统计”对话框对话框 选择“确定”后即得到描述统计量输出表,如下图所示描述统计量输出表描述统计量输出表 三、利用Excel进行回归分析 回归分析中的计算量较大,实际分析中,回归分析的计算可以依赖于计算机。除专门的统计软件外,为大多数人所熟悉的Excel也有部分的统计功能,这些功能基本上能满足一些简单的统计分析。下面我们研究生产费用与产量
13、之间的关系,说明用Excel进行回归的具体步骤以及如何看懂Excel输出的回归分析结果。首先,我们将生产费用和产量的数据输入到Excel工作表的A2:B13单元格。然后按下列步骤进行操作:第一步:选择“工具”下拉菜单第二步:选择“数据分析”选项第三步:在分析工具中选择“回归”,然后选择“确定”第四步:当对话框出现时 在“Y值输入区域”方框内键入A2:A13 在“X值输入区域”方框内键入B2:B13 在“输出选项”中选择输出区域,选择新工作表组 结果如下图所示:“回归分析回归分析”对话对话框框 选择“确定”后得到下面的结果,如下图所示。回归分析输出结果回归分析输出结果 Excel输出的回归结果包
14、括三个部分:第一部分是“回归统计”,该部分给出了回归分析中的一些常用统计量,包括相关系数、判定系、调整后的、标准误差、观测值的个数等。第二部分是“方差分析”,该部分给出了自由度、回归分析、残差、总计、回归和残差的均方、检验统计量、F检验的显著水平。“方差分析”的主要作用是对回归方差的显著性进行检验,该检验的目的是判断因变量y与自变量x是否存在线性关系。在给定显著水平下,Significance F=6.9221E-07,这说明生产费用与产量之间存在线性相关关系。第三部分是参数估计的有关内容。包括回归方程的截距、斜率,截距和斜率的标准误差、用于检验的回归系数的t统计量、P值,以及截距和斜率的置信
15、区间(下限95.0%和上限95.0%)等。在实际应用中,我们主要是看t检验的结果。对于回归系数Pvalue=0.000001,表明回归系数是显著的,这说明产量是影响生产费用的一个主要因素。最后得到回归方程:x4436.24323.2y第二节SPSS在统计实务中的应用在统计实务中的应用 一、一、SPSS软件的基础知识软件的基础知识(一)SPSS for Windows的启动与退出1、启动SPSS for Windows 在启动SPSS for Windows以前,首先进入Windows操作环境,单击“开始”按钮,从“程序”菜单的子菜单中选择“SPSS for Windows选项,如图所示。SPS
16、S 9.0 for Windows 的启动的启动 启动SPSS for Windows后,出现无标题的“数据编辑器”窗口,如图所示。用户可在该窗口进行建立数据文件的一切工作。数据编辑窗数据编辑窗 2、退出SPSS for Windows 工作完毕后,用户可以使用File菜单中Exit菜单项退出SPSS。但是在退出SPSS之前,应该首先确认数据文件(或者运行过程中产生的统计图表等)是否已经保存。如果新建立的或者修改过的内容没有存盘,则系统将显示如图9-15所示的存盘提示框。用户可根据实际需要,进行人机对话。存盘提示对话框存盘提示对话框 以随机抽测某中学30名15岁学生的身高和体重为例,数据见表
17、编号id 性别sex 身高x 体重y 编号id 性别sex 身高x 体重y 1 男 174.6 54.2 2 男 169.1 57.2 3 男 171.5 66.4 4 男 168.6 51.1 5 男 177.2 58.2 6 男 175.0 55.0 7 男 183.5 69.1 8 男 182.9 68.2 9 男 169.1 74.2 10 男 170.0 77.1 11 男 184.0 61.8 12 男 172.6 65.6 13 男 168.5 85.4 14 男 175.2 65.4 15 男 171.3 70.6 16 女 156.9 45.7 17 女 156.2 46.7
18、 18 女 156.9 54.2 19 女 156.0 40.2 20 女 156.3 64.9 21 女 158.7 48.7 22 女 154.7 54.2 23 女 167.0 55.6 24 女 165.6 49.8 25 女 156.3 60.8 26 女 157.8 52.6 27 女 166.2 54.3 28 女 164.7 65.3 29 女 161.3 42.8 30 女 164.8 56.5(二)数据文件的建立及存储 1、定义变量“性别”为字符型变量,其他均为数值型变量。以“性别”为例,定义变量的步骤如下:(1)在打开数据编辑窗口(图9-14)后,单击Data菜单中的“D
19、efine Variable”项或单击该窗口(图9-14)下部的“Varible View”,就可打开定义变量的对话框(这种由主菜单直接打开的对话框称为一级对话框)如图所示。定义变量的对话框(一级对话框)定义变量的对话框(一级对话框)名称(含义)Values(变量标签值)Name(变量名称)Missing(缺失值)Type(变量类型)Columns(列数)Width(变量宽度)Alignment(对齐方式)Decimals(保留小数点位数)Measure(度量)Label(变量标签)该对话框中左端纵列的1、2、3表示各个变量的编号,对话框的首行为“变量描述”栏,其中各项目属性的解释见下表。“变
20、量描述变量描述”栏各项目属性列表栏各项目属性列表(2)定义变量名。将光标移入定义变量对话框(图9-16)中第一行第一列的空格内,然后用键盘输入定义的变量名“sex”。(3)定义变量类型与宽度。单击Type按钮,展开定义变量类型对话框(Define Variable Type),如图 定义变量类型的对话框(二级对话框定义变量类型的对话框(二级对话框1)在定义变量类型对话框左半部列有八种可选择的变量类型。最上面Numeric(标准数值型)、最下面String(字符型)是通常选用的两种变量类型。本例中“sex”为字符型变量,因此可用鼠标单击“String”前面的圆圈,该圆圈中增加一个黑点儿,表明当前
21、选中的为“字符型”变量类型。由于我们考虑用m表示男性,用f表示女性,因此,其值的长度只需一个字节。但因变量名sex为三个字节,所以把“Width”后面的方框内数字改为3(因定义的是字符型,故“Decimal”显示为0)。(4)定义变量标签。在一级对话框中,单击“Labels”按钮,展开定义标签(Define Labels)二级对话框,如图所示。在该对话框中可以定义变量标签,同时可以定义变量值标签。定义标签的对话框(二级对话框定义标签的对话框(二级对话框2)在对话框中的第一行Variable后面的方框中有插入点光标在闪烁,说明等待你输入描述变量名的标签。设系统运行在汉字平台上,可以给出汉字标签,
22、我们输入“性别”作为变量sex的标签。在对话框的下部有一个大方框,标有“Value Labels”,包含有三个较小的矩形框,用这三个矩形框定义值标签。这里我们定义的变量sex,值“m”表示“男性”,值“f”表示“女性”。先在第一个小框中输入“m”,再把插入点光标移至第二个小框中,输入“男”,按“Add”按钮,清单中显示m=“男”。然后,再在第一个小框中输入“f”,在第二个小框中输入“女”,再按“Add”按钮,清单中增加了一个值标签,显示f=“女”。至此,值标签定义完毕。按“Continue按钮,确认定义的变量标签和值标签正确无误,并返回上一级对话框(图9-16)。至此,对数据项“性别”定义了变
23、量名“sex”,并对其属性“Type”和“Label”作了定义。可模仿此例,对数据项“身高”和“体重”作出相应的变量名及其属性的定义,这样数据文件的框架结构已经完成。2、录入数据 在定义变量对话框中单击下部的“Data View”,进入数据录入状态,如图。定义变量对话框的数据录入状态定义变量对话框的数据录入状态 本例是按变量输入数据。把光标移到变量名“sex”列、对应观测量序号为“1”的单元格,并单击,使之成为当前操作单元格。按性别依次键入m或f,并回车,把30个学生的性别全部输入完毕。同样可对变量“身高”和“体重”的数据进行录入。要想修改某个数据或补漏某个数据,可以移动光标到二维数据表格中相
24、应的单元格并单击,使之成为当前操作单元格,键人变量值,回车即可。3、数据文件的存储 要将本例在数据窗中录入的身高和体重数据在A盘建立一个名为d1.say的数据文件,操作方法如下:(1)直接单击“保存”按钮,或者单击File菜单项,展开下拉菜单,选择“Save as”项,就可打开“Save Data as”对话框,如图所示。数据文件另存为其它文件名或类型的对话框数据文件另存为其它文件名或类型的对话框(2)在对话框的“保存在”列表框中选定A驱动器,然后在“文件名”文本框中键入 “d1.say”。此文件名后缀必须为sav。(3)单击“保存”按钮,完成存盘工作。如果是一个旧的数据文件,在其上修改或追加
25、了一些数据,并且不再想保留原来的数据文件,只想保留经修改或追加后的数据文件,此时可使用File菜单中的“Save”,用鼠标单击,或者单击“保存”按钮,便可将该文件保存。二、二、SPSS软件在统计实务中的应软件在统计实务中的应用介绍用介绍(一)频数统计(一)频数统计可以利用Frequencies过程进行频数统计(还可以用来获得某些描述统计量和描述数值范围的统计量)。以某小学二年级80名学生身高数据为例。设已建立的数据文件为d2.sav,并已存入软盘,对变量h(身高)作频数统计。135134129133131131131134125128135127127133130132130129124132
26、122124127131137132133134124128135133131123115132134138124132128136127120125131136127124129129132138125131120121144128133128127130120121122127121125130140121126130122128127125127131 第一步:打开数据文件d2.sav (1)单击主菜单中的File菜单项,展开下拉菜单;单击Open,展开打开数据文件的对话框“Open File”,如图9-21所示。(2)单击“搜索”组合框右侧的下拉按钮,在下拉列表中选择要打开的文件所在的
27、驱动器A。(3)在文件夹列表中找到要打开的文件名d2。(4)单击“OK”按钮,就可以打开选定的数据文件d2。第二步:进行频数统计 (1)单击Analyze菜单,选择Descriptive Statistics中的Frequencies项,打开相应的对话框,如图所示。(2)在主对话框的左侧源变量框中选择h,单击向右的箭头按钮,使其进入Variable(s)框中。在变量表下方选中“Display frequency tables”,可以要求输出频数分布表。FrequencyPercentValid PercentCumulative PercentValid115.0011.31.31.3120.
28、0033.83.85.0121.0045.05.010.0122.0033.83.813.8123.0011.31.315.0124.0056.36.321.3125.0056.36.327.5126.0011.31.328.8127.00911.311.340.0128.0067.57.547.5129.0045.05.052.5130.0056.36.358.8131.00810.010.068.8132.0067.57.576.3133.0056.36.382.5134.0045.05.087.5135.0033.83.891.3136.0022.52.593.8137.0011.31.
29、395.0138.0022.52.597.5140.0011.31.398.8144.0011.31.3100.0Total80100.0100.0(3)在主对话框最下面一行有Statistics、Charts、Frequencies Format三个按钮,分别用于选择统计量、统计图和设置示频数表输出格式。如果单击Statistics按钮,打开选择输出统计量对话框,如图所示。可在对话框中选择输出统计量,如下表所示,可选择的统计量分四组。Percentile Values百分位数组百分位数组Dispersion离差组离差组Central Tendency中心趋势组中心趋势组Quartiles四分
30、位数Std.deviation标准差Mean算术平均数Cutpoints for equal groups将数据平分所设的相等等份选择的数值范围;Variance方差Median 中位数Percentile 由用户定义的百分位数Range全距Mode众数Minimum最小值Sun总和Maximum最大值S.E.mean 均数的标准误可选统计量中常用三种统计量的解释 在统计量选择对话框中选择输出统计量,单击Continue按钮,返回主对话框,并单击“OK”按钮提交运行,输出结果见表。所选统计量的输出结果示例 N Valid Misslng Mean MedianModeStd.Deviation
31、Variance SkewnessStd.Error Of SkewnessKurtosisStd.Error Of KurtosisRangePercentiles 10 25 75 90 298 0 201.41 203.00 205 25.73 662.06 -.123 .141 .061 .28l 161 169.90 184.00 220.00 235.00如果单击“Charts”按钮可以展开统计图对话框,如图所示。该对话框可分为两部分,选项内容见下表。左上部分为统计图的类型左下部分为坐标轴标签的显示None 不输出图Frequencies 垂直轴表示频数Bar charts 显示条
32、图Percentage 垂直轴表示百分数Pie charts显示饼图Histograms显示直方图如果单击“Frequencies Format”按钮可以打开频数分布表格式对话框,如图所示。在对话框中设置频数表输出格式。该对话框可分为三部分,各栏目选项内容见下表。Order by Order by 排序栏排序栏Multiple Variables Multiple Variables 多变量栏多变量栏Suppress tables with more Suppress tables with more than _categories than _categories 控制频数表输出的分类数控
33、制频数表输出的分类数Ascending values 按实际值升序排列Compare variables 所有变量结果在一个图形中输出Descending values 按实际值降序排列Organize output by variables 每个变量单独输出一个图形Ascending counts 按频数升序排列Descending counts 按频数降序排列(二)制作统计图SPSS for windows有很强的制图功能,可以绘制多种统计图形,这些图形可以由各种统计分析过程产生,也可以直接由Graphs菜单中所包含的一系列图形产生。在此,我们以常用的条形图(Bar),主要介绍根据数据直接
34、绘制图形的过程,即Graphs菜单中下属菜单的功能,具体操作步骤如下。(其他图形的绘制过程与此类似,可参照进行)第一步:在Graphs菜单中选Bar项,打开Bar Charts条形图主对话框,如图所示。在主对话框中,左边三个框图Simple、Clustered、Stacked分别代表单式条形图、复式条形图和分段条形图。可以单击其中任意一个框图进行选择,如选择单式条形图类型,则单击Simple框,此框外围加黑,即被选中。在主对话框下面的Data in Chart Are框为统计量描述模式选择框。这里我们取默认值Summaries for groups of case观测量分类描述模式,这种模式对
35、分类变量中每一类观测量生成一个简单条形图。这两步选择完成后,单击“Define”按钮可打开单式条形图参数定义对话框,如图所示。在参数定义对话框图中,首先从左边变量表中选择一个作为分类变量(如身高h),单击向右箭头将其送入“Category Axis”分类轴变量框内(系统默认的分类轴是横轴)。然后在Bars Represent栏中选择统计量,被选中的统计量将作为与分类轴垂直的轴上的标度(系统默认标度轴是纵轴)。在本例中取默认项“N of cases”频数作为统计量。单击上图右下角的Titles钮,打开Titles标题对话框,如下图所示。该对话框包括三部分,上面部分可录入主标题;中部可键入副标题;
36、下面部分可录入足标(又称脚注)。然后,单击Continue钮,回到单式条形图参数对话框 在上图中,单击“OK”钮,在输出窗中生成图形,如下图所示。(三)(三)SPSS在相关与回归分析在相关与回归分析中的应用中的应用 1、相关分析、相关分析 以某学校一组学生的百米和立定跳远成绩为例,进以某学校一组学生的百米和立定跳远成绩为例,进行相关分析,数据见下表行相关分析,数据见下表 编号123456789101112131415百米12.512.315.113.112.012.215.412.812.112.512.412.312.911.713.7立跳26727723725528427724223026
37、8262274275248287238 录入上表中的数据,建立相应数据文件,结合统计学原理课程中相关分析的有关内容,本例要求选择计算皮尔逊相关系数,其余采用缺省设置,进行分析。注:在一元回归分析中,皮尔逊相关系数的计算公式如下:22yx2xyyyn1xxn1yyxxn1r(1)操作步骤说明 在Analyze主菜单中选择Correlate子菜单,然后单击Bivariate”选项,此时打开Bivariate Correlation对话框,如图所示。在该对话框设置选项,进行变量两两间的相关分析。Variables列表框将欲进行相关分析的变量用箭头从左面的源变量框中转移到该列表框中Test of Si
38、gnificance框选择单侧或双侧检验Correlation Coefficients框选择计算相关系数的方法Twotailed双侧检验Pearson计算皮尔逊相关系数,即积差相关系数Onetailed单侧检验Kendalls计算肯德尔taub秩相关系数Flag significant correlation在结果中标注具有显著性的变量Spearman计算斯皮尔曼秩相关系数,即等级相关系数Options按钮打开Options对话框该对话框中各选项的简要内容见下表 本例中在变量列表当中选中“百米(y)”和“立跳(x)”,单击右向箭头按钮,将其送入Variables列表框,同时选中“Pearso
39、n”。然后,打开Options对话框,如图所示。该对话框个栏目内容见下表 Statistics框选择需生成的统计量Missing Values框设置缺失值的处理方式Means and standard deviations计算均值、标准差Exclude cases pairwise剔除正在进行相关分析的配对变量中含有缺失值的个案Crossproduct deviations and covariance离均差与协方差Exclude cases listwise剔除所有含有缺失值的个案的全部数据在Options对话框中选中待分析的统计量后,单击“continue”按钮,返回相关分析主对话框,并单
40、击“OK”按钮,计算结果如下表 X Y X Pearson Correlation 1.000 -.757 Sig.(2-tailed).001 N 15 15 Y Pearson Correlation -.757 1.000 Sig.(2-tailed).001 .N 15 15表中第一组数据为相关系数值,第二组数据为可计算项相关系数非0的概率,第三组数据为样本数。本例r=-0.757,n=15,双侧检验结果P=0.0010.01。根据统计学原理课程中的有关内容,可对以上数据进行具体分析。2、回归分析 以相关分析中表中某学校一组学生的百米和立定跳远成绩为例,进行一元回归分析,具体操作步骤如
41、下:(1)在Analyze中选择Regression子菜单,然后单击“Linear”选项,打开Linear Regression对话框,如图所示。该对话框中主要选项的意义如下表所示。Dependent窗口选择左边的源变量,用向右箭头键,使其成为因变量Method下拉式列表框选择进行回归分析的方法Independent(s)列表框选择左边的源变量,用向右箭头键,使其成为自变量Statistics按钮打开Linear Regression:Statistics对话框(2)在对话框的源变量列表中,将百米移入Dependent窗口,立跳移入Independent(s)窗口。(3)单击Statistic
42、s按钮,打开Linear Regression:Statistics对话框,如图所示。此对话框中提供了多个统计量的显示控制,各统计量的含义见表 Regression Coefficients框Residuals框其他选项Estimates回归系数DurhinWatson残差的Durbin-Watson 系列相关检验和参差与预测值的综述统计Mode fit计算并显示相关系数、相关系数的平方、调整的相关系数、标准误差和方差分析表Confidence interval预测区间Casewise diagnostics选择确定进行残差分析的个案范围R squared change显示增删一个独立变量时相
43、关系数的变化Covariance matrix回归系数的方差、协方差矩阵,矩阵的对角线上为方差,余为协方差Descriptives显示变量数据的均值、标准离差和单侧条件下的相关矩阵Part and partial correlation显示部分相关和偏相关矩阵Co linearity diagnostic进行共线性诊断用户根据需要,可对相应的统计量进行选择。由于本例中要求显示回归系数、DW检验值、相关系数、相关系数的平方、调整的相关系数、标准误差和方差分析表等,因此只需在Statistics对话框中选中“Estimates”、“DurhinWatson”和“Mode fit”三个选项,然后单击
44、Continue按钮,返回Linear Regression对话框(4)单击Linear Regression对话框右下角的Options按钮,打开Linear Regression的Options对话框,如图所示。此对话框中各选项的意义如表所示。Stepping Method Criteria框Include constant in equation回归方程中包含常数项Missing Values框设置缺失值的处理方式Use Probability of F用F的显著性概率作为变量选入或剔除的标准Exclude cases listwise剔除所有含有缺失值的个案Use F value用变量
45、的F值作为选入或剔除变量的标准Exclude cases pairwise剔除成对数据中至少含有一个缺失值的个案Replace with mean用均值代替缺失值用户可根据需要进行选择。本例中采用F的显著性概率作为变量选入或剔除的标准,并且接受的概率为5%,拒绝的概率为10%,所以在“Stepping Method Criteria框”中选中“Use Probability of F”,在Entry中输入0.05,在Removal中输入0.10。同时由于回归方程中包含常数项,所以选中“Include constant in equation”。本例中对所有含有缺失值的个案采取剔除的方式,因此在
46、“Missing Values”框中选择“Exclude cases listwise”。然后,单击“Continue”按钮,返回Linear Regression对话框。(5)在Linear Regression对话框中,单击右上角的“OK”按钮,提交运行,结果输出如下:模型说明(对回归模型(Method)、自变量、因变量加以说明)。Model Variables Entered Variables Removed Method 1 X .Enter a All requested variables entered.b Dependent Variable:Y 模型概要,见下表。Chang
47、e StatisticsModel R R Adjusted RStd.Error ofR SquareF dfl df2 Sig.FDurbin-Watso Square Square the Estimate Change Change Change 1 .757 .573 .540 12.5489 .573 17.466 1 13 .001 2.394 a Predictors:(Constant),X b Dependent Variable:Y该表中列出了模型的相关系数(R)、相关系数的平方(R Square)、调整的相关系数的平方(Adjusted R Square)、估计的标准误
48、差(Std.Error of Estimate)、对R的检验结果和DW检验值。本例R=0.757,R2=0.573,DW检验结果d=2.394 方差分析表,见下表。Model Sum of Squares df Mean Square F Sig.1 Regression 2750.432 1 2750.432 17.466 .001 Residual 2047.168 13 157.474 Total 4797.600 14 a Predictors:(Constant),X b Dependent Variable:Y 上表中列出了回归项(Regression)和残差项(Residual)
49、的平方和(Sum of Squares)、自由度(df)、均方和(Mean Square)、F值(F)和显著性概率(Sig.)。当显著性概率小于5,拒绝原假设,即认为回归系数不为零,回归方程是有意义的。本例F=17.466,P=0.0010.05,方程可靠。回归系数分析表,见下表。Model B Std.Error Beta t Sig1 (Constant)427.858 39.961 10.707 .000 X -12.937 3.096 -757 -4.179 .001a Dependent Variable:Y上表列出了变量X的非标准化回归系数(Unstandardized Coeff
50、cients)和常数项,标准误差(Std.Error),标准化回归系数(Standardized Coefficients)Beta值、t值、显著性水平(Sig.)。本例所得方程为:,系数具非常显著意义。二、实训资料:二、实训资料:资料资料1:编号ID班级CLASS性别SEX年龄AGE短跑X1跳远X2铅球X30102030405060708091011121314151617181920111ll111111222222222女女女女女男男男男男男女女女女男男男男男21253143202232413842252640273028393244358.38.08.78.97.97.18.89.09