1、SPSS统计方法及应用统计方法及应用第一章 初识SPSS第一章 初识SPSS一、名称 SPSS:Statistical Package for Social Sciences 的简称,即社会科学统计软件包Statistical Product and Service Solutions 的缩写,即统计产品与服务解决方案2009年,PASW:Predictive Analytics Software预测统计分析软件2010年,IBM SPSS第一章初识SPSS二、SPSS的特点与功能 (1)使用简单,便于学习。(2)统计功能强大,使用方便。(3)灵活方便。(4)开放性好。(5)绘图能力强。(6)
2、便捷的数据输入第一章初识SPSS三、SPSS界面(5大窗口)1.数据编辑窗口:行:个案case 列:变量variable2.结果管理窗口:3.语法编辑窗口:4.脚本窗口:5.草稿结果窗口:在没有安装SPSS的设备上打开。第一章初识SPSS四、SPSS的3种运行方式1.完全窗口菜单方式2.语法运行方式3.混合运行方式第二章 数据的录入与编辑一、数据的录入一、数据的录入(一)定义变量名变量命名规则变量命名规则(1)不多于64个字符组成;(2)变量名不能使用SPSS保留字。ALL,AND,OR,NOT,EQ,GE,GT,LE,LT,NE,TO,WITH等以及一些常用函数符号;(3)系统不区分大小写;
3、(4)变量名唯一.一、数据的录入一、数据的录入(二)指定变量属性变量类型:数值型、字符型、日期型变量的测量尺度:定类、定序、定距、定比 高层次向低层次转换,不可逆变量名与变量值标签变量名与变量值标签变量类型变量类型说明说明数值默认长度为8,小数位数为2加逗号的数值整数部分每3位加一个逗号,用圆点做小数点3位加点数值型无论数值大小,均已整数形式显示。每3位加一小点,可定义小数位置,但都显示0.小数点用逗号表示。如1.2345显示为12.345,00(实际是12345E-4)科学计数法它的值以嵌入的E或D以及带符号的10次幂指数形式显示。如123、1.23E2。日期型输入日期时可用斜杠、连字符、句
4、号、逗号或空号作为分隔符美元主要用来表示货币数据用户自定义用户自定义类型字符串型不用与计算。可以包含任何字符,不能超过定义的长度。字符串变量区分大小写。表 变量类型说明变量值标签缺失值系统缺失值:点(.),系统自动生成;用户缺失值:离散型/连续型。对齐测量尺度:定类(Nominal)、定序变量(Ordinal)、定距变量(Scale)变量名变量名值值值标签值标签性别0男1女例:变量值标签一、数据的录入一、数据的录入(二)录入数据1.直接录入练习1:把电脑使用情况数据录入SPSS数据编辑窗口。或把自带数据录入SPSS数据编辑窗口。一、数据的录入一、数据的录入(二)录入数据1.直接录入练习2:把下
5、表数据录入SPSS数据编辑窗口。职称年龄段35岁以下3649岁50岁以上教授0158副教授10202讲师20101助教3520一、数据的录入一、数据的录入(二)录入数据1.直接录入练习3:想一想,如何把下列数据录入SPSS数据编辑窗口。一、数据的录入一、数据的录入一、数据的录入3.录入数据(1)直接录入一、数据的录入一、数据的录入2.外部数据的获取(1)*.xls文件直接打开:将第1行作为变量名打开;复制+粘贴打开局部:选择相应表格、列出excel中数据的范围。一、数据的录入一、数据的录入2.外部数据的获取(2)其他类型文件一、数据的录入一、数据的录入2.外部数据的获取练习:针对demo.xl
6、s,进行以下练习:(1)将该文件读入SPSS中,仅包含:年龄、婚姻状况、家庭住址、收入;(2)对变量Marital设置值标签。二、数据的保存二、数据的保存(一)直接保存数据保存*.sav结果输出*.spv选择变量进行保存三、数据的编辑三、数据的编辑(一)文件级别的数据管理(数据)(二)变量级别的数据管理(转换)三、数据的编辑三、数据的编辑(一)编辑数据1.数据的基本操作“转至个案”、“转至变量”“插入个案”、“插入变量”“查找和替换”“删除个案/变量”“复制”、“剪切”、“粘贴”三、数据的编辑三、数据的编辑(二)数据预处理1.标识重复个案2.排序个案 在变量名上右键进行简单排序3.转置 注意变
7、量类型:变量(成为数据)/称名变量(变量名)4.分类汇总 根据需要选择是否新建文件5.拆分数据6.合并文件7.选择个案集变量做过滤器时,系统将变量值为0的数据过滤8.重组 三、数据的编辑三、数据的编辑8.重组(1)纵向合并文件:从外部数据文件增加观测量(个案)到当前数据文件中。或称追加观测量。通常要注意以下两个问题:第一,两个待合并的SPSS数据文件的内容合并起来应是有实际意义的。第二,为方便SPSS数据文件的纵向合并,不同数据文件中数据含义相同的数据项最好起相同的变量名,且数据类型也最好相同。三、数据的编辑三、数据的编辑8.重组(2)横向合并文件:从外部数据文件增加变量到当前数据文件中。通常
8、要注意以下三个问题:第一,两个数据文件必须至少有一个名称相同的变量,该变量是两个数据文件横向拼接的依据,称为关键变量。第二,两个数据文件必须事先按关键变量进行升序排序。第三,为方便SPSS数据文件的横向合并,不同数据文件中数据含义不相同的数据项,变量名不应相同。四、变量的编辑四、变量的编辑1.计算变量2.重新编码为相/不同变量划分等级、反向题3.对个案值计数4.可视化离散(变量)您在进行教学设计时,是否感觉有难度?12345您经常参加学校组织的教学经验交流会吗?54321练习考号考号报考部门报考部门行测行测申论申论笔试综合笔试综合成绩成绩面试成绩面试成绩101022102574.56469.2
9、5 80.43 10101610267268.570.25 77.00 10172910268057.568.75 78.79 10073010257262.567.25 76.21 10040810267065.567.75 74.43 1009151025746167.50 72.71 101818102670.56366.75 73.14 101817102571.56367.25 67.86 101329102575.567.571.50 65.061.建立一个以score.sav的文件;2.将“报考部门”分为两类;3.分类后按照“报考部门”将数据进行拆分;4.选择“面试成绩”大于75
10、的考生,并按照降序排列;5.将“考号”“笔试综合成绩”“面试成绩”转置。四、变量的编辑四、变量的编辑五、数据的清理五、数据的清理(一)奇异数据的检查与清理1.奇异数据的检查缺失值、错误的值分析描述统计频率:统计出奇异值数据选择个案:筛选出奇异值2.变量间逻辑检查与清理剔除不合逻辑的数据方法同上第三章第三章 数据的基本统计量数据的基本统计量一、常用统计量一、常用统计量(一)集中趋势均值、中位数、众数(二)离散趋势方差、标准差、全距、四分位数(三)分布形态峰度、偏度Skewness偏度SK0 正偏、右偏SK0 正偏、尖耸SK30n30)1(nV4-1Tn)52(2)1(3ZnnnTn=30原假设为
11、:H0:r=0,相关系数不显著案例:某校随机抽取10名学生,对其语言清楚与流利之间的内在联系进行测定。评定等级结果如下:73页例4一、定量相关一、定量相关案例:3名专家对9篇论文评分。论文分为1-6共6个级别。评分结果如下。分析3名专家评分结果是否一致。一、定量相关一、定量相关练习:4位教师对5名学生的论文水平按等级评定。求其一致性程度。73页练习5一、定量相关一、定量相关一、定量相关一、定量相关偏相关房价与儿童体重:夸大身高与体重:削弱偏相关分析指在研究两个变量间的相关系数时,将与这两个变量有联系的其它变量进行控制使其保持不变的统计方法。检验变量:要研究的变量控制变量:控制不变的变量偏相关系数的阶数:控制变量的个数1个控制变量为1阶偏相关系数,2个,0个一、定量相关一、定量相关偏相关2r-12-k-nrtdf=n-k-2一、定量相关一、定量相关偏相关案例:工酬水平中,剔除“之前工作时间”因素后,学历、工资间的相关关系。一、定量相关一、定量相关偏相关练习:car_sales中,汽车价格、耗油量的相关关系。并将重量设为控制变量,求汽车价格、耗油量的偏相关关系。