1、第一讲:统计分析概述与第一讲:统计分析概述与SPSS软件软件同济大学社会学系2019年本讲内容本讲内容o数据处理的目的及一般过程o变量的基本定义与测量o统计分析过程方法论应用:案例展示oSPSS for Windows的各个模块简介oSPSS Help帮助系统数据处理的目的数据处理的目的o简化数据资料;o揭示我们所关注问题的本质;o发现不同社会现象的影响因素,及社会现象之间的因果关系。数据处理的一般过程数据处理的一般过程o收集收据:问卷调查,编码录入o清理数据:根据分析需要,重新定义各类变量o分析数据:根据研究目的,选择适当的统计模型数据处理的主要方法及软件数据处理的主要方法及软件o量化数据处
2、理方法;如何选择统计方法?建立统计模型?o常见统计软件有:SPSS,SAS,Stata,等;还有很多专门统计软件,如lem,Lisrel,Amos,HLM等等;o质性资料处理方法;如何建立理论模型?o常用软件有:QSR(software of qualitative research)。变量的基本定义与测量变量的基本定义与测量o变量变量:与常量相对,在统计学中用来指代社会现象(事件),其取值具有2种或以上的可能性,而且在不同情况下会发生变化。如性别的取值分为男性和女性两种。根据不同标准可以将变量划分为很多种类型;如离散型变量&连续型变量;自变量&因变量;定类变量&定序变量&定距变量&定比变量。
3、o测量测量:运用各种统计指标将变量操作化。变量的测量层次变量的测量层次o变量在测量之后将会具有不同的数学特征和属性。据此,可以将变量划分为以下四个层次:o定类变量:变量的取值只能把研究对象分类,具有=或的数学特征;o定序变量:变量的取值能够确定研究对象的顺序,具有或的数学特征;o定距变量:变量的取值能够确定研究对象之间的距离,具有+或-的数学特征;o定比变量:变量的取值能够确定研究对象之间的倍数或比率,具有或的数学特征;变量的测量层次比较变量的测量层次比较o高层次变量可以当做低层次变量使用,但是,低层次变量不能当做高层次变量使用;o数据处理过程中将根据变量的多少以及因果变量的层次来选择不同的统
4、计方法。练习:区分以下变量的层次练习:区分以下变量的层次1、妇女结婚年龄:14,15,16.2、城市家庭平均月收入:少于500,500-1000,1000-2000,2000以上3、个人职业:工人,农民、干部、其他4、个人自我评价:很高、高、低、很低5、生活幸福的影响因素:金钱、爱情、健康、自由、其他6、青年人对改革的信心:毫无信心,还算有信心,很有信心7、个人社会流动:向上、向下、稳定8、农村老年人口比例:5%、8%、10%.9、夫妻结合途径:父母包办、亲戚介绍、朋友介绍、自己认识、其他10、与不同住父母交往次数:每天一次、每周一次、两周一次、每月一次、几月一次、很少统计分析过程方法论应用统
5、计分析过程方法论应用案例一:教育获得研究案例一:教育获得研究o分析人们受教育程度的影响因素;o核心因变量:教育水平(年限);o主要解释变量及控制变量:性别、居住地、年龄组、家庭阶层地位、家庭教育地位、家庭经济地位、家庭文化资本等;分析结果分析结果案例二:劳动力收入研究案例二:劳动力收入研究o分析人们收入水平的影响因素,是社会学和经济学研究中的核心主题之一;o核心因变量:收入的自然对数;o核心自变量及控制变量:教育水平,工作部门,性别,年龄,户口、党员身份;分析结果SPSS for Windows的各个模块简介的各个模块简介SPSSSPSS的数据编辑窗口的数据编辑窗口o SPSS主界面主要有两个
6、,一个是SPSS数据编辑窗口,另一个是SPSS输出窗口。o 数据编辑窗口由标题栏、菜单栏、工具栏、编辑栏、变量名栏、内容区、窗口切换标签页和状态栏组成,如图1-1所示。o SPSS中各统计分析功能都是针对该窗口中的数据进行的;窗口中的数据以.sav存于磁盘上。标题栏 菜单栏 工具栏 编辑栏 变量名栏 内容区 窗口切换标签页 状态栏 变 量观测值案 例样 本因素或分组变量o 一个列对应一个变量,即每一列代表一个变量(Variable)或一个被观测量的特征。例如问卷上的每一项就是一个变量。o 行是观测,即每一行代表一个个体、一个观测、一个样品,在SPSS中称为事件(Case)。例如,问卷上的每一个
7、人就是一个观测。o 单元包含值,即每个单元包括一个观测中的单个变量值。单元(Cell)是观测和变量的交叉。o 数据文件是一张长方形的二维表。数据文件的范围是由观测和变量的数目决定的。可以在任一单元中输入数据。如果在定义好的数据文件边界以外键入数据,SPSS将数据长方形延长到可包括那个单元和文件边界之间的任何行和列。SPSSSPSS结果输出窗口结果输出窗口o SPSS结果输出窗口名为Viewer,它是显示和管理SPSS统计分析结果、报表及图形的窗口。研究者可以将此窗口中的内容以结果文件.spo的形式保存。o见图1-2;索 引 输 出 区 详 解 输 出 区 o 结果输出部分分成左右两个部分,左边部分是索引输出区,用于显示已有的分析结果标题和内容索引;右边部分是各个分析的具体结果,称为详解输出区。这和Word的文档结构视图十分类似。SPSS Help帮助系统帮助系统 p SPSS的主界面有两个,一个是SPSS数据编辑窗口,一个是SPSS结果输出窗口。数据编辑窗口主要包括数据的编辑和统计分析;结果输出窗口主要的功能是显示和管理SPSS的各种统计分析的结果。p SPSS的帮助系统可提供各种丰富详尽的在线帮助。