1、描述性统计分析方法第一节 基本问题n意义 一般的数据资料都来源于样本的调查。只有通过对样本的研究,才能做好对实际问题的可能的推断。因此,描述性分析是统计数据分析的第一步。n定义 通过对现象进行调查研究,将大量数据加以整理,简化,制成图标,并就这些数据的分布特征进行计算,如集中趋势、离中趋势等。n主要内容(1)整理。主要是做统计分组及频数统计。(2)计算分布特征指标。如平均数、众数、中位数、标准差,等。(3)做图表。如条形图、饼图、直方图等。 第二节 统计整理一、统计整理的内容 主要是对原始数据进行统计分组并做频数统计。二、统计分组的类型 根据原始数据的类型,统计分组有:(1)单项式分组。一般适
2、用于数值型和字符串型数据。(2)组距式分组。一般适用于数值型。三、spss相关操作序号性别考试成绩1男782男683女454男725女936女567男858男84将8个同学的考试成绩建立为SPSS文件,并对学生的性别及考试成绩进行频数统计。步骤1:建立数据文件n定义变量视图。(重点在于数据类型、值标签)n数据视图中输入数据。步骤2:对性别进行统计分组 (单项式分组)n分析描述统计频率n注意输出结果的解释。 (此频率非彼频率)步骤3:对考试成绩进行统计分组 (组距式分组)n对考试成绩进行可视离散化可视离散化(即将原始数据转化为统计组别的离散数据,如1、2、3、4、5)n对分组后的离散数据进行频数
3、分析。 步骤4:作出性别与考试成绩的交叉表n分析描述统计交叉表三、多选题的统计整理问题 多选题又称多重应答,是在社会调查中常见的一种数据记录类型。它本质上属于分类数据,但由于其数据格式较为特殊,所以SPSS中专门的模块来分析。(一)多选题的记录格式例1:确诊高血压后,您按医生的建议采取了哪些非药物方法控制高血压? A.调理饮食 B.做适宜运动 C.保持情绪稳定 D.其它措施例2:请在下面列出的20个品牌中选择您认为最信得过几个(最多列五个),并将代码按照顺序排列。候选品牌列表:1.长虹 2.海尔 3.1.多重二分法记录格式n一个多选题要根据它的选项设定对应的变量。如例1有四个选项,对应这个多选
4、题就应该有4个变量。n每个变量代表对一个选项的选择结果,是或不是,均为二分类变量。nSPSS中演示数据建立情况2.多重分类法记录格式n同样,每个多选题根据5个选项设计5个变量。每个变量均为多分类变量。n注意:多重分类法记录格式中常见数据缺失的现象。nSPSS中演示数据建立过程(二)多选题常用分析指标n应答人数百分比(percent of cases) 即,选择该项的人占总人数的比重。应答人数百分比加总不等于100%。n应答次数百分比(percent of responses) 即,在做出的所有选择中,选择该项的次数占总次数的比例。应答次数百分比加总等于100%。(三)SPSS相关操作n定义多选
5、题变量集(分析多重响应定义变量集)n频数表(分析多重响应频率)注意:缺失值的处理问题。n交叉分析第三节 统计指标计算一、指标类型n集中趋势指标 反映分布的平均水平。如平均数、众数、中位数等。n离中趋势指标 反映分布的离散程度。如标准差、极值、等。n百分位数指标 四分位数、各个百分位数等。n分布指标 偏度系数、峰度系数。n其它 M统计量、极端值等。二、数据类型及SPSS一般实现操作n基于未分组的原始数据资料n基于某种标志的分组数据资料三、EXPLORE模块 Explore过程(探索性分析)主要用于对资料的性质、分布特点等完全不清楚的情况下。在常用描述性统计指标的基础上,又增加了有关数据详细分布特征的文字及图形等。n一般的图形:箱式图、茎叶图n考察数据是否为正态分布(1)正态QQ概率图、去势QQ正态概率图。(2)正态性检验n分组情况下对不同组别方差齐性进行检验第四节 统计图制作n略