1、SPSS分析调查问卷数据分析调查问卷数据问卷数据的预处理SPSSSPSS分析调查问卷数据的方法分析调查问卷数据的方法 当我们的调查问卷在把调查数据拿回来后,我们该做的工作就是用相关的统计软件进行处理,在此,我们以spss为处理软件,来简要说明一下问卷的处理过程,它的过程大致可分为四个过程:下面将从这四个方面来对问卷的处理做详细的介绍.定义变量定义变量 大多数情况下我们需要从头定义变量,在打开SPSS后,我们可以看到和excel相似的界面,在界面的左下方可以看到Data View,Variable View两个标签,只需单击左下方的Variable View标签就可以切换到变量定义界面开始定义新
2、变量。在表格上方可以看到一个变量要设置如下几项:name(变量名)、type(变量类型)、width(变量值的宽度)、decimals(小数位)、label(变量标签)、Values(定义具体变量值的标签)、Missing(定义变量缺失值)、Colomns(定义显示列宽)、Align(定义显示对齐方式)、Measure(定义变量类型是连续、有序分类还是无序分类).调查问卷中的数据编码和录入调查问卷中的数据编码和录入调查问卷中的数据编码和录入调查问卷中的数据编码和录入 把一份问卷上面的每一个问题设为一个变量,这样一份问卷有多少个问题就要有多少个变量与之对应,每一个问题的答案即为变量的取值.现在我
3、们以问卷第一个问题为例来说明变量的设置.为了便于说明,可假设此题为:1.请问你的年龄属于下面哪一个年龄段()?A:2029B:3039C:4049D:50-59变量设置可如下变量设置可如下:name即变量名为即变量名为1,type即类型可根据答案的类型设置即类型可根据答案的类型设置,答案我答案我们可以用们可以用1、2、3、4来代替来代替A、B、C、D,所以我们选择数字型的,即选择所以我们选择数字型的,即选择Numeric,width宽度为宽度为4,decimals即小数位数位为即小数位数位为0(因为答案没有小数点),(因为答案没有小数点),label即变量即变量标签为标签为“年龄段查询年龄段查
4、询”。Values用于定义具体变量值的标签用于定义具体变量值的标签,单击单击Value框右半部的框右半部的省略号,会弹出变量值标签对话框省略号,会弹出变量值标签对话框,在第一个文本框里输入在第一个文本框里输入1,第二个输入第二个输入2029,然后单击添加即可然后单击添加即可.同样道理我们可做如下设置同样道理我们可做如下设置,即即1=2029、2=3039、3=4049、4=50-59;Missing,用于定义变量缺失值,用于定义变量缺失值,单击单击missing框右侧的省略号,会框右侧的省略号,会弹出缺失值对话框弹出缺失值对话框,界面上有一列三个单选钮,默认值为最上方的界面上有一列三个单选钮,
5、默认值为最上方的“无缺失值无缺失值”;第二项为第二项为“不连续缺失值不连续缺失值”,最多可以定义,最多可以定义3个值;最后一项为个值;最后一项为“缺失值范围加可选缺失值范围加可选的一个缺失值的一个缺失值”,在此我们不设置缺省值,在此我们不设置缺省值,所以选中第一项如图;所以选中第一项如图;Colomns,定义,定义显示列宽显示列宽,可自己根据实际情况设置;可自己根据实际情况设置;Align,定义显示对齐方式,定义显示对齐方式,有居左、居右、有居左、居右、居中三种方式;居中三种方式;Measure,定义变量类型是连续、有序分类还是无序分类。,定义变量类型是连续、有序分类还是无序分类。开放式题型的
6、设置:诸如你所在的省份是_这样的填空题即为开放题,设置这些变量的时候只需要将Value、Missing两项不设置即可.数据录入:数据录入:Spss数据录入方式在spss的数据录入窗口中直接输入就可以了,几点注意事项:a.在数据录入窗口,可看到有一个表格,这个表格中的每一行代表一份问卷,也称为一个个案.b.在数据录入窗口中,可看到表格上方出现了1、2、3、4、5.的标签名,这其实是我们在第一步定义变量中,我们为问卷的每一个问题取的变量名,即1代表第一题,2代表第二题.以次类推.只需要在变量名下面输入对应问题的答案即可完成问卷的数据录入.比如上述年龄段查询的例题,如果问卷上勾选了A答案,在1下面输
7、入1就行了(不要忘记我们通常是用1、2、3、4来代替A、B、C、D的).c.一行代表一份问卷,所以有几分问卷,就要有几行的数据.在数据录入完成后,要做的关键部分就是 问卷的统计分析了.1.读取SPSS格式的数据2.读取Excel等格式的数据3.读取文本数据(Fixed和Delimiter)4.读取数据库格式数据(分如下两步)(1)配置ODBC(2)在SPSS中通过ODBC和数据库进行Rich.sav数据Rich.xls数据录入数据录入(rich.sav):福布斯世界富豪排行榜Rank:排名Name:姓名Citizenship:国籍Region:地区Age:年龄NetWorth:净财富(10亿美
8、元)Residence:居住地问卷调查数据常用的统计分析方法频数分析、描述统计分析和列联表分析频数分析、描述统计分析和列联表分析这是问卷调查最基本、这是问卷调查最基本、最常用的分析方法。频数分析是描述统计的初步,分门别类的最常用的分析方法。频数分析是描述统计的初步,分门别类的统计有效样本量,计算其比重。频数分析可以计算的统计量有:统计有效样本量,计算其比重。频数分析可以计算的统计量有:分位数、中位数、众数等,并可以绘制柱状图、直方图、饼图。分位数、中位数、众数等,并可以绘制柱状图、直方图、饼图。描述统计分析主要是计算一些 基本的统计量,其中比较重要的统计量有均值、方差和标准差、峰度、偏度。数据
9、的描述 在对数据进行深入加工之前,在对数据进行深入加工之前,总应该对数据有所印象。总应该对数据有所印象。可以借助于图形和简单的运算,可以借助于图形和简单的运算,来了解数据的一些特征。来了解数据的一些特征。由于数据是从总体中产生的,由于数据是从总体中产生的,其特征也反映了总体的特征。其特征也反映了总体的特征。对数据的描述也是对其总体的对数据的描述也是对其总体的一个近似的描述。一个近似的描述。1 1 如何用图来表示数据?如何用图来表示数据?定量变量的图表示定量变量的图表示:1.:1.直方图直方图对于一个定量变量,比如某个地区对于一个定量变量,比如某个地区(地区(地区1 1)测量了)测量了16316
10、3个高三男生的身个高三男生的身高高(S3height1.txtS3height1.txt)。用图形来表示这个数据,使人们能够用图形来表示这个数据,使人们能够看出这个数据的大体分布或看出这个数据的大体分布或“形状形状”的一个办法是画的一个办法是画直方图直方图(histogram)(histogram)。图图1 1就是利用这个数据由就是利用这个数据由SPSSSPSS软件所软件所画的直方图。画的直方图。图3.1 地区1高三男生身高的直方图200.0195.0190.0185.0180.0175.0170.0165.0160.0155.0150.0Std.Dev(标准差)=10.91,Mean(均值)
11、=170.9,N(人数)=163403020100该图的横坐标是身高区间,这里每一格代表该图的横坐标是身高区间,这里每一格代表5cm的身高范围(格子的身高范围(格子宽度因不同的数据性质或要求而定,这里的格子宽度为宽度因不同的数据性质或要求而定,这里的格子宽度为5cm),而),而纵坐标为各种身高区间的身高的频数。纵坐标为各种身高区间的身高的频数。直方图直方图定量变量的图表示定量变量的图表示:2.:2.盒型图盒型图简单一些的是简单一些的是盒形图盒形图(boxplot(boxplot,又称,又称箱图、箱线图、盒子图箱图、箱线图、盒子图)。图图2 2的左边一个是根据地区的左边一个是根据地区1 1高三男
12、生高三男生的身高数据所绘的盒形图;其右边的的身高数据所绘的盒形图;其右边的图代表另一个地区(地区图代表另一个地区(地区2 2)的高三)的高三学生的身高学生的身高(height.txtheight.txt,height.savheight.sav,第三章例第三章例.xls.xls)。175163N=地区地区2地区1高三男生身高210200190180170160150140323259250248596158盒型图盒型图盒子的中间横线是数据的中位数盒子的中间横线是数据的中位数(median),封闭盒子的上下两横线,封闭盒子的上下两横线(边)为上下四分位数(点);按照(边)为上下四分位数(点);按
13、照SPSS的默认选项,如果所有的默认选项,如果所有样本中的数目都在离四分位点样本中的数目都在离四分位点1.5倍盒子长度之内,则线的端点为倍盒子长度之内,则线的端点为最大和最小值,否则线长就是最大和最小值,否则线长就是1.5倍的盒子长度(盒子长度称为四倍的盒子长度(盒子长度称为四分位间距),在其外面的度量单独点出分位间距),在其外面的度量单独点出定量变量的图表示定量变量的图表示:3.:3.茎叶图茎叶图 在直方图和盒形图中,很难恢复数据在直方图和盒形图中,很难恢复数据的原貌。而另一种图:的原貌。而另一种图:茎叶图茎叶图(stem-(stem-and-leaf plots)and-leaf plot
14、s)可以恢复数据可以恢复数据以地区以地区1 1高三男生身高为例(图高三男生身高为例(图3 3),),茎叶图既展示了分布形状又有原始数茎叶图既展示了分布形状又有原始数据。它象一片带有茎的叶子。茎为较据。它象一片带有茎的叶子。茎为较大位数的数字,叶为较小位数的数字。大位数的数字,叶为较小位数的数字。茎叶图茎叶图其中茎叶图中茎的单位为其中茎叶图中茎的单位为10cm,而叶子单位为,而叶子单位为1cm。比如,由于。比如,由于第一行茎为第一行茎为150cm,因此叶子中的九个数字,因此叶子中的九个数字001223344代表九个数代表九个数目目150、150、151、152、152、153、153、154、1
15、54cm等。每等。每行左边有一个频数(比如第一行有行左边有一个频数(比如第一行有9个数目,第二行有个数目,第二行有17个等等);个等等);可以看出最长的一行为从可以看出最长的一行为从165cm到到169cm的一段(有的一段(有35个数)。个数)。定量变量的图表示定量变量的图表示:4.:4.散点图散点图 数据会有两个变量,如美国男士和女数据会有两个变量,如美国男士和女士初婚年限数据(士初婚年限数据(marriage.txtmarriage.txt)。)。该数据描述了自该数据描述了自19001900年到年到19981998年男女年男女第一次婚姻延续的时间。第一次婚姻延续的时间。这里年份是一个变量,
16、婚姻延续时间这里年份是一个变量,婚姻延续时间是第二个变量。由于不可能将所有人是第二个变量。由于不可能将所有人的婚姻年限都给出来,所以每年就取的婚姻年限都给出来,所以每年就取了一个中间的值了一个中间的值(中位数中位数)作为代表。作为代表。200019801960194019201900282726252423222120女男散点图散点图定性变量的图表示:饼图定性变量的图表示:饼图 定性变量(或属性变量,分类变定性变量(或属性变量,分类变量)不能点出直方图、散点图或量)不能点出直方图、散点图或茎叶图,但可以描绘出它们各类茎叶图,但可以描绘出它们各类的比例。的比例。下面用下面用SPSSSPSS绘的图
17、绘的图5 5(饼图,(饼图,pie pie chartchart)表示了说世界各种主要语表示了说世界各种主要语言人数的比例言人数的比例(language.txtlanguage.txt).).饼图饼图定性变量的图表示:条形图定性变量的图表示:条形图 而用同样数据画的图而用同样数据画的图6 6称为称为条形条形图(图(bar chartbar chart)。从每一条可以看出讲各种语言从每一条可以看出讲各种语言的实际人数,而且分别给出了的实际人数,而且分别给出了每个语种中母语和日常使用的每个语种中母语和日常使用的人数(在图中并排放置)。条人数(在图中并排放置)。条形图显示比例不如饼图直观。形图显示比
18、例不如饼图直观。条形图条形图如何用少量数字来概括数据?如何用少量数字来概括数据?大量的数字既繁琐又不直观;需大量的数字既繁琐又不直观;需要对数据做人们时间和耐心所允要对数据做人们时间和耐心所允许的简化许的简化 我们可以用我们可以用 “平均平均”,“差距差距”或百分比等来概括大量数字。或百分比等来概括大量数字。由于定性变量主要是计数,比较由于定性变量主要是计数,比较简单,常用的概括就是比例或百简单,常用的概括就是比例或百分比。下面主要介绍关于定量变分比。下面主要介绍关于定量变量的数字描述。量的数字描述。小结小结 例(rich.sav):福布斯世界富豪排行榜 Rank:排名 Name:姓名 Cit
19、izenship:国籍 Region:地区 Age:年龄 NetWorth:净财富(10亿美元)Residence:居住地37定量变量的图表示定量变量的图表示 直方图直方图 Age,NetWorth SPSS:GraphsInteractiveHistogram10.0020.0030.0040.00NetWorthNetWorth0200400600CountCount40.0060.0080.00A Ag ge e0255075C Co ou un nt t38 横坐标横坐标 要研究的变量的取值范围 格子的宽度因数据性质而定 纵坐标纵坐标 频数 百分比 数据分布的简单描述数据分布的简单描述
20、 单峰/双峰 对称/非对称 数据的疏密39 盒型图盒型图 不同区域年龄分布 SPSS:GraphsInteractive BoxplotAfricaAsia and PacificEuropeNorth AmericaSouth AmericaR Re eg gi io on n25.0050.0075.00100.00A Ag ge e40 中间横线中间横线 中位数 封闭盒子的上下两边封闭盒子的上下两边 上下四分位点 线段的端点线段的端点 最大值,最小值(线长小于1.5倍盒长)离群点离群点(outlier),极端值极端值(extreme)41 茎叶图茎叶图 欧洲区域富人的年龄 SPSS:An
21、alyzeDescriptive Statistics ExploreFrequencyStem&Leaf1.00Extremes(=22)2.003.449.003.78999999918.004.00000111233334444414.004.5555567778999927.005.00001111111222333333334444422.005.555566666677788888999927.006.00011111111222222233344444423.006.5555556667888888889999916.007.000000011112333318.007.5556
22、6667788899999912.008.0002222333447.008.55668992.009.221.009.5Stemwidth:10.00Eachleaf:1case(s)42 茎的单位茎的单位:10岁 叶的单位:叶的单位:1岁 优点优点 还原原始数据 类似直方图显示数据分布 缺点缺点 无法描述大量数据 不常用43 散点图散点图 两个定量变量之间的关系:年龄和财富 SPSS:GraphsInteractive Scatterplot25.0050.0075.00100.00A Ag ge e0.0010.0020.0030.0040.0050.00N N e e t t W W
23、o o r r t t h h44定性变量的图表示定性变量的图表示 饼图饼图 Region SPSS:GraphsInteractive Pie 类别不宜过多AfricaAsia and PacificEuropeNorth AmericaSouth AmericaR Re eg gi io on nA A f f r r i i c c a a 0 0.6 6 5 5%A A s s i i a a a a n n d d P P a a c c i i f f i i c c1 1 8 8.4 4 5 5%E E u u r r o o p p e e2 2 6 6.9 9 7 7%N N
24、 o o r r t t h h A A m m e e r r i i c c a a5 5 0 0.9 9 7 7%S S o o u u t t h h A A m m e e r r i i c c a a 2 2.9 9 7 7%45 条形图条形图 Region SPSS:GraphsInteractive Bar 不同于直方图Bars show countsAfricaAsia and PacificEuropeNorth AmericaSouth AmericaR Re eg gi io on n100200300400C Co ou un nt t462 2 如何用少量数字来概
25、括数据?如何用少量数字来概括数据?可用少量所谓汇总统计量或可用少量所谓汇总统计量或概括概括统计量统计量(summary statistic)(summary statistic)来描来描述定量变量的数据。述定量变量的数据。这些数字是从样本数据得来的,这些数字是从样本数据得来的,因而也是样本的函数,因而也是样本的函数,任何样本的函数,只要不包含总任何样本的函数,只要不包含总体的未知参数,都称为体的未知参数,都称为统计量统计量(statistic)(statistic)。样本的随机性决定统计量的随机样本的随机性决定统计量的随机性(统计量也是随机变量)性(统计量也是随机变量)2 2 如何用少量数字来
26、概括数据?如何用少量数字来概括数据?概括统计量经常对应于总体概括统计量经常对应于总体的无法观测到的某些参数。的无法观测到的某些参数。这时,统计量可作为这些参这时,统计量可作为这些参数的估计。一些统计量还可数的估计。一些统计量还可以用来检验样本和假设的总以用来检验样本和假设的总体是否一致。体是否一致。2 2 如何用少量数字来概括数据?如何用少量数字来概括数据?注:注:一些统计量前面有时加一些统计量前面有时加上上“样本样本”二字,以区别于二字,以区别于总体的同名参数。如总体的同名参数。如“样本样本均值均值”和和“样本标准差样本标准差”,以区别于总体均值和总体标以区别于总体均值和总体标准差;但在不会
27、混淆时可以准差;但在不会混淆时可以只说只说“均值均值”和和“标准差标准差”。数据的数据的“位置位置”数据有位置吗?数据有位置吗?这里三个数据的位置一样吗?这里三个数据的位置一样吗?数据的数据的“位置位置”“位置位置”一般是关于数据中某变一般是关于数据中某变量观测值的量观测值的“中心位置中心位置”或者数或者数据分布的中心(据分布的中心(centercenter或或center center tendencytendency)。)。和这种和这种“位置位置”有关的统计量就有关的统计量就称为称为位置统计量位置统计量(location(location statistic)statistic)。位置统计
28、量当然不一定都是描述位置统计量当然不一定都是描述“中心中心”了,比如后面要讲的了,比如后面要讲的k k百百分位数(或分位数(或k k分位数)。分位数)。数据的数据的“位置位置”最常用的位置统计量就是小学时所学最常用的位置统计量就是小学时所学到的算术平均数,它在统计中叫做均到的算术平均数,它在统计中叫做均值值(mean);严格地说叫做样本均值;严格地说叫做样本均值(sample mean),以区别于总体均值。,以区别于总体均值。如果记样本中的观测值为如果记样本中的观测值为x1,xn,则,则样本均值定义为样本均值定义为(样本样本)中位数中位数(median)是数据按照大小排列之是数据按照大小排列之
29、后位于中间的那个数后位于中间的那个数(如如果样本量为奇数果样本量为奇数),或者,或者中间两个数目的平均中间两个数目的平均(如如果样本量为偶数果样本量为偶数)。由于中位数不易被极端由于中位数不易被极端值影响,所以中位数比值影响,所以中位数比均值稳健均值稳健(robust)。数据的数据的“位置位置”上下四分位数(或分别称为第一四分位数和第三四分位数,firstquantile,thirdquantile)则分别位于(按大小排列的)数据的上下四分之一的地方。数据的数据的“位置位置”数据的数据的“位置位置”一般地还称上四分位数为一般地还称上四分位数为75百分位数百分位数(75 pecentile,有,
30、有75的观测值小于的观测值小于它),下四分位数为它),下四分位数为25百分位数百分位数(有(有25的观测值小于它)。的观测值小于它)。一般地,一般地,k百分位数百分位数(k-pecentile)意)意味着有味着有k的观测值小于它。的观测值小于它。如果令如果令a a=k%,则则k百分位数也称为百分位数也称为a a分位数分位数(a a-quantile)。样本中出现最多的数目,称为样本中出现最多的数目,称为众数众数(mode)数据的数据的“尺度尺度”这两个数据“胖瘦”一样吗?数据的数据的“尺度尺度”数据中数目的分散程度由尺度统计量(scale statistic)来描述。尺度统计量是描述数据散布,
31、即描述集中与分散程度或变化(spread或variability)的度量。数据的数据的“尺度尺度”从前面两个高三男生身高数据的盒从前面两个高三男生身高数据的盒形图。左边的数据平均要高些,但形图。左边的数据平均要高些,但右边的数据散布范围要小得多。右边的数据散布范围要小得多。175163N=地区地区2地区1高三男生身高210200190180170160150140323259250248596158统计中有许多尺度统计量。一般来说,数据越分散,尺度统计量的值越大。数据的数据的“尺度尺度”极差极差(range)(range);就是极大值和极小值;就是极大值和极小值之间的差。之间的差。前面两个高三
32、男生身高数据的极差分前面两个高三男生身高数据的极差分别为别为50cm50cm和和32cm32cm。盒形图盒子的长度为两个四分位数之盒形图盒子的长度为两个四分位数之差,称为差,称为四分位数极差或四分位间距四分位数极差或四分位间距(interquantile range)(interquantile range);它描述了;它描述了中间半数观测值的散布情况。极差和中间半数观测值的散布情况。极差和四分位极差实际上各自只依赖于两个四分位极差实际上各自只依赖于两个值,信息量太少。值,信息量太少。数据的数据的“尺度尺度”另一个常用的尺度统计量为(样本)另一个常用的尺度统计量为(样本)标准差标准差(stan
33、dard deviation)。度量样。度量样本中各数值到均值距离的一种平均。本中各数值到均值距离的一种平均。标准差实际上是标准差实际上是方差方差(variance)的平方的平方根。如果记样本中的观测值为根。如果记样本中的观测值为x1,xn,则样本方差为则样本方差为数据的数据的“尺度尺度”两个均值一样,但右边的要两个均值一样,但右边的要“胖胖”些,方差为左边的一些,方差为左边的一倍倍数据的标准得分数据的标准得分 假定两个水平类似的班级(一假定两个水平类似的班级(一班和二班)上同一门课,班和二班)上同一门课,但是由于两个任课老师的评分但是由于两个任课老师的评分标准不同,使得两个班成绩的标准不同,
34、使得两个班成绩的均值和标准差都不一样均值和标准差都不一样(数据:数据:grade.txt)grade.txt)。数据的标准得分数据的标准得分 一班分数的均值和标准差分别一班分数的均值和标准差分别为为78.5378.53和和9.439.43,而二班的均值,而二班的均值和标准差分别为和标准差分别为70.1970.19和和7.007.00。那么得到那么得到9090分的一班的张颖是分的一班的张颖是不是比得到不是比得到8282分的二班的刘疏分的二班的刘疏成绩更好呢?怎么比较才能合成绩更好呢?怎么比较才能合理呢?理呢?数据的标准得分数据的标准得分虽然这种均值和标准差不同的数据不虽然这种均值和标准差不同的数
35、据不能够直接比较,但是可以把它们进行能够直接比较,但是可以把它们进行标准化,再比较标准化后的数据。标准化,再比较标准化后的数据。一个标准化的方法是把某样本原始观一个标准化的方法是把某样本原始观测值(亦称得分,测值(亦称得分,score)和该样本均)和该样本均值之差除以该样本的标准差;得到的值之差除以该样本的标准差;得到的度量称为度量称为标准得分标准得分(standard score,又称为又称为z-score)。数据的标准得分数据的标准得分即,某观测值xi的标准得分定义为ixxzs数据的标准得分数据的标准得分 在我们的例子中,张颖的标准在我们的例子中,张颖的标准得分为得分为(90-78.53)
36、/9.43(90-78.53)/9.431.221.22,而 刘 疏 的 标 准 得 分 为而 刘 疏 的 标 准 得 分 为(8 2-(8 2-70.19)/770.19)/71.691.69。显然如果两个班级平均水平差显然如果两个班级平均水平差不多,刘疏的成绩应该优于张不多,刘疏的成绩应该优于张颖的成绩;这是在标准化之前颖的成绩;这是在标准化之前的数据中不易看到的。的数据中不易看到的。可以看出,原始数据是在各自的均值附近,而散布也不一可以看出,原始数据是在各自的均值附近,而散布也不一样。但它们的标准得分则在样。但它们的标准得分则在0 0周围散布,而且散布也差不周围散布,而且散布也差不多。实
37、际上,任何样本经过这样的标准化后,就都变换成多。实际上,任何样本经过这样的标准化后,就都变换成均值为均值为0 0、方差为、方差为1 1的样本。标准化后不同样本观测值的比的样本。标准化后不同样本观测值的比较只有相对意义,没有绝对意义。较只有相对意义,没有绝对意义。小结小结 统计量统计量:(:(s statistictatistic)样本的函数,不包括总体的未知参数 随机变量(样本的随机性)作为总体参数的估计68 数据的位置(数据的位置(locationlocation)样本均值(sample mean)中位数(median):稳健k百分位数(k-percentile)众数(mode):定性变量6
38、9 SPSS:AnalyzeDescriptive Statistics Explore/Frequencies/Descriptives 例(rich.sav):AgeS St ta at ti is st ti ic cs sAge7433263.309664.000064.0044.000053.000064.000074.000081.0000ValidMissingNMeanMedianMode1025507590Percentiles70 数据的尺度(数据的尺度(scalescale)极差(range)四分位数极差(interquantile range)方差(variance)标
39、准差(standard deviation)标准误差(standard error)71 SPSS:AnalyzeDescriptive Statistics Explore/Frequencies/Descriptives 例(rich.sav):AgeS St ta at ti is st ti ic cs sAge7433263.3096.5059964.000064.0013.79230190.22775.0022.0097.0044.000053.000064.000074.000081.0000ValidMissingNMeanStd.Error of MeanMedianMode
40、Std.DeviationVarianceRangeMinimumMaximum1025507590Percentiles72 数据的标准得分数据的标准得分 样本原始观测值与样本均值之差除以样本标准差 新样本:均值0,方差:1(grade.sav)数据的变换数据的变换 指数 对数7310097N=班级二班一班得分1101009080706050402110097N=班级二班一班标准得分3210-1-2-3-42174基本背景调查基本背景调查 样本量:样本量:65(out of 81)SPSS:AnalyzeDescriptive Statistics Frequencies学学 院院23.13
41、.13.111.51.54.611.51.56.246.26.212.35686.286.298.511.51.5100.065100.0100.0财政金融学院经济学院商学院社会与人口学院统计学院信息资源管理学院TotalValidFrequencyPercentValid PercentCumulativePercent75系系11.51.51.511.51.53.111.51.54.6812.312.316.9913.813.830.811.51.532.311.51.533.811.51.535.434.64.640.03756.956.996.923.13.1100.065100.01
42、00.0MBA保险档案风险管理与精算概率论与数理统计金融经济学人口社会学统计卫生统计TotalValidFrequencyPercentValid PercentCumulativePercent76本科专业本科专业23.13.13.111.51.54.611.51.56.211.51.57.711.51.59.211.51.510.823.13.113.811.51.515.411.51.516.923.13.120.03655.455.475.411.51.576.911.51.578.534.64.683.11015.415.498.511.51.5100.065100.0100.0保险
43、档案风险管理与精算国际贸易计算机经济精算贸易经济人口社会学统计外贸日语西班牙语信息与计算科学应用数学应用物理TotalValidFrequencyPercentValid PercentCumulativePercent77S SA AS S4163.163.163.146.26.269.21726.226.295.434.64.6100.065100.0100.00123TotalValidFrequencyPercentValid PercentCumulativePercentSPSSSPSS1624.624.624.623.13.127.73350.850.878.51421.521.
44、5100.065100.0100.00123TotalValidFrequencyPercentValid PercentCumulativePercent78M MA AT TL LA AB B5787.787.787.711.51.589.269.29.298.511.51.5100.065100.0100.00123TotalValidFrequencyPercentValid PercentCumulativePercentR R5584.684.684.634.64.689.257.77.796.923.13.1100.065100.0100.00123TotalValidFrequ
45、encyPercentValid PercentCumulativePercent79S Sp pl lu us s4873.873.873.81421.521.595.434.64.6100.065100.0100.0023TotalValidFrequencyPercentValid PercentCumulativePercentE Ev vi ie ew ws s4873.873.873.811.51.575.41320.020.095.434.64.6100.065100.0100.00123TotalValidFrequencyPercentValid PercentCumulat
46、ivePercent80t to ot ta al l913.813.813.81523.123.136.92132.332.369.21320.020.089.246.26.295.434.64.6100.065100.0100.0012345TotalValidFrequencyPercentValid PercentCumulativePercent81 统计眼光,统计思想 分析方法,实际应用 软件使用82Frequencies过程可以做单变量的频数分布表;显示数据文件中由用户指定的变量的特定值发生的频数;获得某些描述统计量和描述数值范围的统计量。适用范围:单选题,排序题,多选题的方法二
47、实现:Descriptive statisticsFrequencies Descriptives:过程可以计算单变量的描述统计量。这些述统计量有平均值、算术和、标准差,最大值、最小值、方差、范围和平均数标准误等。适用范围:选择并排序题、开放性数值题。实现:Descriptive statisticsDescriptives,需要的统计量点击按钮Statistics中选择 总结适用范围:多选题的二分法实现:第一步在Multiple ResponseDefine Sets把一道多选问题中定义了的所有变量集合在一起,给新的集合变量取名,在Dichotomies Counted value中输入1。
48、第二步在Multiple ResponseFrequencies中做频数分析。解决对多变量的各水平组合的频数分析的问题适用范围:,适用于由两个或两个以上变量进行交叉分类形成的列联表,对变量之间的关联性进行分析。比如要知道不同工作性质的人上班使用交通工具的情况,可以通过交叉分析得到一个二维频数表则一目了然。实现:第一步根据分析的目的来确定交叉分析的选项,确定控制变量和解释变量(如上例中不同工作性质的人是控制变量,使用交通工具是解释变量)。第二步选择Descriptive statisticsCrosstabs 忧国忘家,捐躯济难,忠臣之志也。三国曹植求自诚表。22.7.2622.7.26Tues
49、day,July26,2022墨守成规,四平八稳,优柔寡断,畏首畏尾,不是企业家的气质。11:30:4611:30:4611:307/26/202211:30:46AM心境,是一种情感状况,领有了好心情,也就拥有了,继而占有了年青跟健康。就拥有了对将来生活的憧憬,充斥等待,让咱们拥有一份善意情吧,由于生涯着就是荣幸和快活。22.7.2611:30:4611:30Jul-2226-Jul-22帮别人的事做完就忘记,别人为自己做的事时时记着,哪怕这个人只有那么一次好,他也是曾经赞助过你的人。11:30:4611:30:4611:30Tuesday,July26,2022每个人都是自己命运的建筑师。
50、22.7.2622.7.2611:30:4611:30:46July26,2022沙漠里的脚印很快就消逝了。一支支奋进歌却在跋涉者的心中长久激荡。2022年7月26日上午11时30分22.7.2622.7.26君子务本,本立而道生。论语。2022年7月26日星期二上午11时30分46秒11:30:4622.7.26人生成功的秘诀是当好机会来临时,立刻抓住它。2022年7月上午11时30分22.7.2611:30July26,2022所谓企业管理就是解决一连串关系密切的问题,必须有系统地予以解决,否则将会造成损失。2022年7月26日星期二11时30分46秒11:30:4626July2022经
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。