1、第3章 基本统计分析第3章 基本统计分析?本章学习目标本章学习目标?掌握描述性统计分析、频数原理与实验?理解探索分析的原理与实验?掌握交叉列联表分析原理与实验?掌握实验结果的统计分析?了解基本统计分析在经济管理数据分析中的应用。第3章 基本统计分析?SPSS处理数据后的基本输出结果是各种统计量和统计图表。研究者的许多分析与结论,建立在这些基本输出结果的基础上。对数据进行基本统计分析,是对其进行深入细致的统计分析的基础和前提。对基本统计量和基本统计图表的熟练掌握和运用,是SPSS软件使用者的基本功。本章介绍最基本的统计量、统计分析方法和统计图。实验一 描述性统计?实验目的实验目的?理解和掌握基本
2、描述统计量的意义及其构造原理?熟悉基本描述统计量的类别及其对数据的描述功能?熟悉获得基本描述统计量的SPSS操作方法?学习运用基本描述统计量分析问题的一般规范实验一 描述性统计?准备知识准备知识?数理统计的基本统计量包括描述数据集中趋势的统计量(均值、中位数和众数)、描述数据离散趋势的统计量(标准差、方差和极差)和描述数据分布状况的统计量(峰度、偏度和分位数)。有了这些基本统计量,研究者就掌握了数据的基本特征。通过这些基本统计量对数据进行基础统计分析后,研究者可以确定对数据做定进一步分析的方向。准备知识均值均值(Mean)是总体或样本数据的平均值中位数中位数(Median)是总体数据中大小处于
3、中间位置的数值。众数众数(Mode)是总体中出现频数最高的那个数。准备知识全距全距(Range)是数据中最大值与最小值之间的绝对差值,表示数据的分布范围。方差方差(Variance)是总体所有数据与其均值的差值的平方的平均值。标准差标准差(Standard Deviation)是方差的平方根。准备知识准备知识峰度峰度峰度(Kurtosis)是描述总体数据分布形态与正态分布形态相比较的陡平程度的统计量。偏度偏度偏度(Skewness)是描述总体分布形态对称性的统计量。准备知识准备知识1四分位数(Quartiles)是将全部数据按升序或降序分为四等份的三个数2十分位数(Deciles)是将全部数据
4、按升序或降序分为十等份的九个数3百分位数(Percentiles)是将全部数据按升序或降序分为一百等份的九十九个数数据描述统计是对数据进行基本分析,从总体上把握数据分布基本特征的统计方法。通常用均值(及标准误)、中位数和众数描述数据的集中趋势,用标准差、方差和全距(及最大值和最小值)描述数据的离散性,用峰度、偏度和分位数描述数据的分布情况。准备知识准备知识描述统计实验一 描述性统计?实验内容实验内容?运用数据文件data2-1.sav,对机械厂职工的基本数据进行描述分析,计算男女全体职工、男职工和女职工的月基本工资的情况:1.均值(及标准误)、中位数和众数;2.全距(及最大值和最小值)、方差和
5、标准差;3.峰度和偏度。实验一 描述性统计?实验步骤实验步骤(1)打开数据文件3-1.sav。(2)执行“分析(A)描述统计描述(D)”命令,打开“描述性”对话框,如图所示(3)在“描述性”对话框中,从左边源变量列表中选择“月基本工资”移入右边的“变量(V)”框中(4)点击“选项(O)”按钮,在“描述:选项”对话框中选择“均值(M)”、“标准差(T)”、“方差”、“范围”、“最小值”、“最大值”和“均值的标准误(E)”、“峰度”和“偏度”,如图所示(5)在“描述性”对话框中单击“确定”按钮,提交系统运行。得到男女全体职工月基本工资的情况。(6)对数据文件3-1.sav执行“数据(D)选择个案”
6、命令,打开“选择个案”对话框,如图所示在“选择个案”对话框的“选择”栏中,选择“如果条件满足(C)”项目点击下面的“如果(I)”按钮,打开“选择个案:If”对话框,如图所示在“选择个案:If”对话框右上的空白框中,输入“sex=1”或“sex=0”在“选择个案:If”对话框中,点击下方的“继续”按钮,返回“选择个案”对话框在“选择个案”对话框的“输出”栏中,选择系统默认设置“过滤掉未选定的个案(F)”,点击“确定”按钮,完成职工(个案)的性别选择。如图所示?实验结果实验结果职工月基本工资描述统计量职工月基本工资描述统计量?实验结果实验结果男职工月基本工资描述统计量男职工月基本工资描述统计量?实
7、验结果实验结果女职工月基本工资描述统计量女职工月基本工资描述统计量?实验总结实验总结?基本描述统计通过对样本数据的集中趋势(均值(及标准误)、中位数和众数)、离散趋势(全距(及最大值和最小值)、方差和标准差)和分布形态(峰度和偏度)的分析,可以使研究者清晰地把握数据的分布特点。实验二 频数分析?实验目的实验目的?了解变量取值(数据)的分布情况;?判断样本的代表性及抽样的系统偏差;?学习运用频数分析方法解决实际问题。?知识准备知识准备?频数是同一数据或同一事件出现的次数。频数分析可以用来考察数据值的分布状况,即变量取值的分布情况,使研究者对所研究随机变量的变化特征有更加深入的了解以下3点1频数的
8、概念2频数分布表和频数分布图的概念3SPSS频数分析的操作方法实验二 频数分析?实验内容实验内容?运用数据文件3-1.sav,对机械厂各部门职工人数进行统计,输出频数分布表和条形图。实验二 频数分析?实验步骤实验步骤(1)打开数据文件3-1.sav。(2)执行“分析(A)描述统计频率(F)”命令,打开“频率(F)”对话框。(3)在“频率(F)”对话框中,从左边源变量列表中选择“车间部门”移入右边的“变量(V)”下面的空白框中;选择左下方的系统默认设置,在“显示频率表格(D)”前面的空框中打“”(4)在“频率(F)”对话框中点击“图表(C)”按钮,打开“频率:图表”对话框,在“图表类型”下的选项
9、中选择“条形图(B)”,在“图表值”下面的选项中选择选择系统默认设置“频率(F)”,点击“继续”按钮,返回“频率(F)”对话框。(5)在“频率(F)”对话框中,单击“确定”按钮,提交系统运行。得到各部门职工人数统计的频数表和条形图。?实验结果实验结果车间部门统计量车间部门统计量各车间部门统计量各车间部门统计量各车间部门统计量各车间部门统计量男性工龄茎叶图男性工龄茎叶图?实验总结实验总结?频数分析是对相同个案的数量或同一事件重复出现的次数,进行分类统计的基本统计方法。运用频数分析,可以使研究者从总体上把握总体或样本中个案的分类或分组分布情况。实验三 数据探索?实验目的实验目的?了解数据探索的功能
10、与统计原理?掌握SPSS数据探索的操作方法?学习通过数据探索,了解数据分布基本特征,识别数据中的界外值和极端值?知识准备知识准备?SPSS的数据探索通过绘制茎叶图和箱图,对数据的频数分布情况进行较为细致的考察,识别出极端值、界外值和奇异值,以及错误的数据,决定在对数据进行更为深入的分析前的处理方案;?通过正态性检验,判断数据是否服从正态分布,以便决定是否使用只适用于服从正态分布的数据的分析方法;?通过方差齐性检验,决定拒绝或不拒绝方差齐性假设,从而决定采用方差齐性或方差不齐性的假设条件下得出的数据处理结果。实验三 数据探索?实验内容实验内容?运用数据文件3-1.sav,对机械厂男职工和女职工的
11、工龄分布进行频数分析。人数进行统计,输出频数分布表和条形图。实验三 数据探索?实验步骤实验步骤(1)打开数据文件3-1.sav。(2)执行“分析(A)描述统计探索(E)”命令,打开“探索”对话框,如图所示。(3)在“探索”对话框中,从左边源变量列表中选择“工龄(年)”、“性别”和“Employee code(id)”,分别移入右边的“因变量列表(D)”、“因子列表(F)”和“标注个案(C)”下面的空白框中;“输出”栏下下选择“图”选项,如图所示。(4)在“探索”对话框中点击“统计量(S)”按钮,选择“探索:统计量”对话框中的系统默认设置,如图所示。(5)在“探索”对话框中点击“绘制(T)”按钮
12、,选择“探索:图”对话框中的默认系统设置,如图所示。在“探索”对话框中点击“选项(O)”按钮,选择“探索:选项”对话框中的默认系统设置,如图所示。(6)在“探索”对话框中,点击“确定”按钮,提交系统运行。得到男职工和女职工龄分布的统计量和图(茎叶图和箱图)。?实验结果实验结果不同性别的工龄描述性统计不同性别的工龄描述性统计不同性别的工龄描述性统计不同性别的工龄描述性统计女性工龄茎叶图女性工龄茎叶图女性工龄茎叶图女性工龄茎叶图男性工龄茎叶图男性工龄茎叶图工龄箱图工龄箱图?实验总结实验总结?SPSS的数据探索主要运用茎叶图和箱图,简明直观地表示总体或样本中种类别或分组中个案的分布频数。它能够帮助研
13、究者把握数据的分布情况,发现数据的错误或异常情况。数据探索能够适用于个案数量不是很大的总体或样本的分析。实验四 交叉表?实验目的实验目的?了解交叉表的结构和用途,熟悉交叉表中行、列和层的意义和构造方法?熟练掌握SPSS 交叉表分析的操作方法?学习运用交叉表进行联合频数分布分析准备知识准备知识交叉表考察数据在两个或两个以上的因素上的联合频数分布二维交叉表或多维交叉表P-P图P-P图图是根据变量的累积比例与指定分布的累积比例之间的关系绘制的图形Q-Q图Q-Q图图是用变量数据分布的分位数与指定分布的分位数之间的关系曲线进行数据检验的。?卡方统计检验用于检验行变量与列变量之间是否相关。f0 和fe 分
14、别为观测频数和期望频数。列联系数用于名义变量之间的相关系数计算。和N分别为卡方统计量和总体中的个数。X,N和K分别为卡方统计量、总体中的个数和行数与列数中较小的数。实验四 交叉表?实验内容实验内容?对数据文件3-1.sav中的雇员薪金按30000、30001,50000、50001,80000、80001,100000和100000的标准进行分为15级,用交叉表统计各薪级中不同性别和不同工作类别的雇员的数量。实验四 交叉表?实验步骤实验步骤(1)打开数据文件3-1.sav。(2)执行“转换(T)重新编码为不同变量(R)”命令,打开“重新编码为其他变量”对话框,如图所示。在“重新编码为其他变量”
15、对话框的源变量列表中选择“薪金”移入“输入变量输出变量(V)”下面的空白框中;在“输出变量”栏下的“名称(N)”框中输入新变量名(sgrade),“标签(L)”框中输入新变量标签(薪金等级),点击“更改(H)”按钮,如图所示。点击“旧值和新值(O)”按钮,打开“重新编码到其他变量:旧值和新值”对话框,如图所示。在“重新编码到其他变量:旧值和新值”对话框中,在左边“旧值”栏中选择相应的选项(如“范围,从最低到值(G)”),在下面的空白框中输入薪金五个等级区间(30000、30001,50000、50001,80000、80001,100000 和100000)的相应数字(如“30000”),在右
16、边“新值”栏下的“值(L)”后的空白框中输入对应的等级数字(如“1”)后,点击“添加(A)”。在“重新编码到其他变量:旧值和新值”对话框中,点击“继续”按钮,返回“重新编码到其他变量”对话框。在“重新编码到其他变量”对话框中,点击“确定”按钮,完成“薪金”变量向“薪金等级”变量的转换,如图所示。(3)执行“分析(A)描述统计交叉表(C)”命令,打开“交叉表”对话框,如图所示。(4)在“交叉表”对话框中,从左边源变量列表中选择“性别”、“薪金等级”和“工作类别”,分别移入右边的“行(s)”、“列(C)”和“层1的1”后面的空白框中,如图所示。(5)在“交叉表”对话框中,点击“确定”按钮,提交系统
17、运行,得出“性别*薪金等级*工作类别工作类别”三维交叉表。?实验结果实验结果性别*薪金等级*工作类别 交叉制表?实验分析实验分析?上面的交叉表是职工人数(频数)在薪金等级、性别和工作类别三个变量中的联合分布。它不仅给出了职工在三个变量上的联合频数分布,而且给出了职工在三个变量中任意两两的联合频数分布。?采用三个二维交叉表(性别*薪金等级、工作类别*薪金等级、薪金等级*工作类别)的方式也可以达到本实验的分析目的,但表达效果显然没有上面的三维交叉表好。?实验总结实验总结?交叉表分析是对总体或样本中的个案,满足或具备两个或两个以上的条件的联合频数分析。它可以用于考察个案在多个因素(条件)上的分布情况,便于进一步分析样本中数据的相关性或因素的交互效应。