1、1数据的测量尺度定类尺度定类尺度(Nominal)定序尺度定序尺度(Ordinal)定距尺度定距尺度(Interval)定比尺度定比尺度(Scale)2数据的测量尺度和SPSS实现测量尺度测量尺度功能功能数学特征数学特征典型例子典型例子定类尺度(定类尺度(Nominal)分类 性别、品牌、地区定序尺度(定序尺度(Ordinal)分类排序 满意度、学历、职务定距尺度(定距尺度(Interval)分类排序差距 等级、温度定比尺度(定比尺度(Scale)分类排序差距比例 身高、收入、价格3指出下面问卷题型中各变量的测量尺度实训二:实训二:A1.您的性别您的性别1.男2.女A2.您的身高是您的身高是_
2、厘米厘米A3.您对目前所从事的工作的满意程度您对目前所从事的工作的满意程度1.非常满意2.比较满意3.一般 4.不是很满意 5.很不满意A4.您的年龄是您的年龄是_岁岁A5.您的职务您的职务1.普通员工2.部门主管3.经理A6.您从事的职业您从事的职业1.会计 2.保险 3.计算机 4.银行 5.房地产 6.企业管理 7.其他A7.您的手机价格您的手机价格_元元A8.您的手机价格您的手机价格1.1000元以下2.10011500元 3.15012000元 4.2001元以上A9.品牌级别品牌级别1.AAAAA 2.AAAA3.AAA4.AA5.A A10.品牌排名品牌排名12345定类定比定序
3、定比定序定类定比定序定距定距4问卷的数据分析:描述性分析实训三:实训三:下面是一份美国2000年总统大选的抽样调查数据,其中受访人数达1847位,调查的目的是对本次总统竞选进行选前预测。调查项目如下:A1.受访者性别受访者性别1.Mail2.FemailA2.受访者的年龄受访者的年龄_岁。岁。A3.受访者的学历受访者的学历0.It high school1.high school2.junior college 3.bachelor 4.graduate degree A4.受教育时间受教育时间_年。年。A5.准备投谁的票准备投谁的票1.Bush2.Perot3.Clinton应该如何对上述调
4、查问卷进行分析呢?(数据文件:voter.sav)定类定序定类定比定比5问卷的数据分析:描述性分析分析步骤分析步骤步骤一:步骤一:单个定类、定序尺度变量分析;对定距、定比尺度变量可以通过转换,单个定类、定序尺度变量分析;对定距、定比尺度变量可以通过转换,将测量尺度降为定类、定序尺度来分析。将测量尺度降为定类、定序尺度来分析。分析工具:指标、表格、图形分析工具:指标、表格、图形软件实现:软件实现:AnalyzeDescriptive Statistics Frequencies对定类尺度变量“性别”、“候选人”和定序变量“学历”进行描述性分析对定比尺度变量“年龄”、“受教育时间”进行分段,将其降
5、为定序尺度变量后进行描述性分析6“性别性别”、“学历学历”、“候选人候选人”的频数分析的频数分析78“年龄年龄”、“受教育时间受教育时间”按如下标准进行转换,生成新变量按如下标准进行转换,生成新变量“年龄段年龄段”、“受教育受教育时间段时间段”,然后再进行频数分析,然后再进行频数分析 年龄年龄 年龄段年龄段 受教育时间受教育时间受教育时间段受教育时间段34岁以下岁以下1 11年以下年以下13554岁岁2 1213年年25574岁岁3 1416年年375岁以上岁以上4 17年以上年以上4910问卷的数据分析:描述性分析步骤二:单个定距、定比尺度变量分析步骤二:单个定距、定比尺度变量分析分析工具:
6、指标、表格、图形分析工具:指标、表格、图形软件实现:软件实现:AnalyzeDescriptive Statistics Frequencies Statistics对定比尺度变量“年龄”和“受教育时间”进行描述性分析分布状况描述离散趋势描述其他趋势描述集中趋势描述111213问卷的数据分析:描述性分析步骤三:步骤三:双变量定类(或定序)双变量定类(或定序)定类(或定序)描述性分析定类(或定序)描述性分析分析工具:指标、表格、图形分析工具:指标、表格、图形软件实现:软件实现:AnalyzeDescriptive Statistics Crosstabs”性别学历”、“性别候选人”、“学历候选人
7、”描述性分析14”性别学历”、“性别候选人”、“学历候选人”描述性分析学历*性别 CrosstabulationCount8310618940554294756761321602263861009319380410431847lt high schoolhigh schooljunior collegebachelorgraduate degree学历Totalmailfemail性别Total15总统候选人*性别 CrosstabulationCount31534666115212627833757190880410431847BushPerotClinton总统候选人Totalmailfe
8、mail性别Total16总统候选人*学历 CrosstabulationCount55121221893491594399474826581321466217838663191111936612789081847lt high schoolhigh schooljunior collegebachelorgraduate degree学历TotalBushPerotClinton总统候选人Total17问卷的数据分析:描述性分析步骤四:步骤四:双变量定类(或定序)双变量定类(或定序)定距(或定比)描述性分析定距(或定比)描述性分析分析工具:指标、表格、图形分析工具:指标、表格、图形软件实现:
9、软件实现:AnalyzeDescriptive Statistics Explore”性别年龄”、“候选人年龄”、“学历年龄”描述性分析18Descriptives47.68.54746.6048.7547.1546.00240.82215.51822896724.467.086-.549.17248.09.52547.0649.1247.4045.00286.99816.94122896725.551.076-.591.151MeanLower BoundUpper Bound95%Confidence Intervalfor Mean5%Trimmed MeanMedianVariance
10、Std.DeviationMinimumMaximumRangeInterquartile RangeSkewnessKurtosisMeanLower BoundUpper Bound95%Confidence Intervalfor Mean5%Trimmed MeanMedianVarianceStd.DeviationMinimumMaximumRangeInterquartile RangeSkewnessKurtosis性别mailfemail年龄StatisticStd.Error1920问卷的数据分析:描述性分析A1.被调查者的年龄_岁。A2.被调查者的收入水平1.2.5万以下
11、2.2.5万5万3.5万7.5万4.7.5万以上A3.被调查者的学历1.初中及以下2.高中3.大专4.大学5.研究生A4.被调查者的性别1.男性2.女性A5.被调查者对目前工作的满意度1.满意2.态度中立3.不满意实训四:实训四:下面是一份有关工作满意度调查的抽样调查问卷,参与调查的人员总共有6400位,数据文件名“工作满意度调查.sav”,请对此次调查作数据分析。21问卷的数据分析:描述性分析1.对定类尺度变量“性别”作频数分析,要求绘制频数分析表;2.对定序尺度变量“收入水平”作频数分析,要求制作频数分析表并绘制条形图;3.对定序尺度变量“文化程度”作频数分析,要求制作频数分析表并绘制饼图
12、;4.对定序尺度变量“工作满意度”作频数分析,要求制作频数分析表并绘制柏拉图;5.对定比尺度变量“年龄”进行如下转换后,对新变量“年龄段”作频数分析并绘制条形图;25岁以下1 2635岁2 3645岁3 4655岁4 56岁以上56.对定比尺度变量“年龄”进行描述性分析,要求计算“年龄的”如下指标:(1)集中趋势:算数平均数、中位数和众数;(2)离散趋势:标准差、方差和全距;(3)分布状况:偏度系数、峰度系数;(4)其他趋势:四分位数、10分位数和90分位数;7.对定比尺度变量“年龄”绘制直方图,要求间隔为5;8.对定比尺度变量“年龄”绘制枝叶图和箱形图;22问卷的数据分析:描述性分析9.对定
13、类尺度变量“性别”和定序尺度变量“收入水平”作双变量列联分析,要求绘制列联表;10.对定序尺度变量“文化程度”和定序尺度变量“收入水平”作双变量列联分析,要求制作列联表,并根据“文化程度”绘制“收入水平”的堆栈条形图;11.对定类尺度变量“性别”和定序尺度变量“工作满意度”作双变量列联分析,要求制作列联表,并根据“性别”绘制“满意度”的堆栈条形图;12.根据定类尺度变量“性别”对定比尺度变量“年龄”作数据描述性分析。23问卷的数据分析:描述性分析A1.被调查者的性别。1.mail2.femailA2.被调查者的肤种。1.white2.black3.otherA3.被调查者所在地区1.north
14、 east2.south east3.westA4.被调查者的健康状况(可复选)。1.Ill Enough to Go to a Doctor 2.Counselling for Mental Problems 3.Infertility,Unable to Have a Baby4.Drinking Problem5.Illegal Drugs(Marijuana,Cocaine)6.Partner(Husband,Wife)In Hospital7.Child in Hospital8.Child on Drugs,Drinking Problem9.Death of a Close Fr
15、iendA5.被调查者最近12个月遇到的最为严重的问题(可复选,最多选4项)1.Health2.Finances3.Lack of Basic Services4.Family 5.Personal 6.Legal7.Miscellaneous实训五:实训五:下面是一份1991年美国社会状况的抽样调查问卷,参与调查的人员总共有1517位,数据文件名“199 U.S.General Social Survey.sav”,请对此次调查作数据分析。24问卷的数据分析:描述性分析步骤五:对复选题进行描述性分析步骤五:对复选题进行描述性分析(1)二分法(Dichotomies)数据录入格式下复选题的分析
16、方法。(2)分类法(Categories)数据录入格式下复选题的分析方法。软件实现,需要分两步实现:第一步:设置多重响应集AnalyzeMultiple Response Define Sets第二步:对复选题进行单变量频数分析和多变量列联分析AnalyzeMultiple Response Frequencies/Crosstabs实例演示:对 定类变量“健康状况“作单变量频数分析(二分法格式数据)。对定类变量”问题“作单变量频数分析(分类法格式数据)。分”性别“对”健康状况“作双变量列联分析。分”肤种“对”问题“作双变量列联分析。对”问题“进行图形描述。25设置多重响应集频数分析和列联分析
17、二分法格式设置分类法格式设置26对 定类变量“健康状况“作单变量频数分析(二分法格式数据)。多重响应集设置(二分法数据格式)单变量频数分析27对定类变量”问题“作单变量频数分析(分类法格式数据)。设置多重响应集(分类法数据格式)单变量频数分析28分”性别“对”健康状况“作双变量列联分析。29分”肤种“对”问题“作双变量列联分析。30对”问题“进行图形描述。(注意:(注意:SPSS并没有提供可以直接对多重响应集进行图形描述的菜单,因此这里列举了并没有提供可以直接对多重响应集进行图形描述的菜单,因此这里列举了一种能对分类法数据格式下的多选题进行图形描述的特殊方法)一种能对分类法数据格式下的多选题进
18、行图形描述的特殊方法)分两步:分两步:第一步:DataRestructure对数据进行预处理,将按分类法保存下的所有数据保存至一个新变量下;第二步:进行图形描述。31问卷数据分析流程第一阶段:问卷数据第一阶段:问卷数据描述性描述性分析流程分析流程步骤一:区分问卷中各变量的测量尺度步骤二:单变量定类(定序)测量尺度步骤三:单变量定距(定比)测量尺度步骤四:双变量定类(定序)定类(定序)步骤五:双变量定类(定序)定距(定比)步骤六:双变量定距(定比)定距(定比)步骤七:多变量(三个以上)第二阶段:问卷数据第二阶段:问卷数据推断性推断性分析流程分析流程32问卷的数据分析:描述性分析实训四:实训四:下
19、面是一份有关投保满意度的调查问卷,调查部分题目如下:A1.受访者性别受访者性别1.男性2.女性A2.受访者的年保费购买支出受访者的年保费购买支出_元。元。A3.受访者对所购买保险产品的满意度受访者对所购买保险产品的满意度1.非常满意2.比较满意3.一般/无所谓4.不是很满意5.很不满意A4.受访者年收入受访者年收入_元。元。A5.受访者购买了何种保险产品(受访者购买了何种保险产品(可复选可复选)。)。1.意外伤害险 2.健康险 3.投资连结保险 4.万能寿险 5.分红保险6.团险 7.财产损失险 8.责任险 9.信用保证险 10.其它如何对上述问卷进行描述性分析?如何对上述问卷进行描述性分析?
20、定类尺度定比尺度定类尺度定序尺度定比尺度33问卷的数据分析:描述性分析数据描述性分析流程:(三个工具:指标、表格和图形)1.对“性别”、“满意度”、“保险产品”做分析;频数分析表、条形图、饼图、线性图、面积图、柏拉图2.对“年保费购买支出”、“年收入”进行分析;指标描述(集中、离散、分布)、直方图、枝叶图、箱形图4.对“性别满意度”、“性别保险产品”、“保险产品满意度”做分析;列联分析表、复合条形图、饼图5.对“性别年保费购买支出”、“满意度年保费购买支出”分析;分类指标描述、分类直方图、枝叶图、复合箱形图、人口金字塔图6.对“年收入年保费购买支出”分析散点图34问卷的数据分析:复选题的描述性
21、分析A1.受访者性别1.男性2.女性A2.受访者婚姻状况1.已婚2.其他A3.受访者家庭固定成员数1.12人2.34人3.5人以上 A4.受访者年龄_周岁。A5.A5.受访者目前状况(受访者目前状况(可复选可复选)1.1.经济负担重经济负担重 2.2.精神压力大精神压力大 3.3.健康状况差健康状况差 4.4.家庭负担重家庭负担重5.5.工作压力大工作压力大 6.6.人际关系紧张人际关系紧张 7.7.缺乏基本保障缺乏基本保障 实训五:实训五:(数据文件投保需求调查.sav)下面是一份有关投保需求抽样调查问卷的数据,其中受访人数1500位,调查的目的是对投保需求进行调查。部分调查项目如下:35复
22、选题的分类法和二分法数据录入格式A5.A5.受访者目前状况(受访者目前状况(可复选可复选)1.1.经济负担重经济负担重 2.2.精神压力大精神压力大 3.3.健康状况差健康状况差 4.4.家庭负担重家庭负担重5.5.工作压力大工作压力大 6.6.人际关系紧张人际关系紧张 7.7.缺乏基本保障缺乏基本保障 5位受访者的填答数据受访者1:1 23受访者2:1 3 4 5 7受访者3:2 3 4 7受访者4:6 7受访者5:436第一步:分类法(Categories)变量设置和数据录入5位受访者的填答数据受访者1:1 2 3受访者2:1 3 4 5 7受访者3:2 3 4 7受访者4:6 7受访者5
23、:4分类法(Dichotomies)下的变量设置和数据录入A5.受访者目前状况(可复选)1.经济负担重 2.精神压力大 3.健康状况差 4.家庭负担重 5.工作压力大 6.人际关系紧张 7.缺乏基本保障 37第二步:分类法(Categories)多重响应集设置38第二步:分类法(Categories)多重响应集设置39第一步:二分法(Dichotomies)变量设置和数据录入5位受访者的填答数据受访者1:1 2 3受访者2:1 3 4 5 7受访者3:2 3 4 7受访者4:6 7受访者5:4A5.受访者目前状况(可复选)1.经济负担重 2.精神压力大 3.健康状况差 4.家庭负担重 5.工作
24、压力大 6.人际关系紧张 7.缺乏基本保障 40第二步:二分法(Dichotomies)多重响应集设置41第三步:分类法和二分法下多重响应集的数据分析一、单变量的频数分析$目前状况(分类法)Frequencies87716.3%58.7%85415.8%57.2%72513.4%48.5%72213.4%48.3%61111.3%40.9%5299.8%35.4%107619.9%72.0%5394100.0%361.0%经济负担精神压力健康状况家庭负担工作压力人际关系基本保障$目前状况(分类法)TotalNPercentResponsesPercent ofCases42第三步:分类法和二分法下多重响应集的数据分析二、双变量的列联分析$目前状况(分类法)*性别 Crosstabulation38049587533851485231340972230041971925935161023329552845362010736298601489CountCountCountCountCountCountCountCount经济负担精神压力健康状况家庭负担工作压力人际关系基本保障$目前状况(分类法)Total男性女性性别TotalPercentages and totals are based on respondents.