1、社会统计学与SPSS应用第四章 数据的组织与展示第四章 数据的组织与展示 第一节 数据的特征与类型 第二节 定类数据的组织与展示 第三节 定序数据的组织与展示 第四节 定距数据的组织与展示 第五节 数据组织与展示的SPSS应用第一节 数据的特征与类型 一、一、数据的概念与特征数据的概念与特征 测量是获得数据的基础性工作,人们对社会现象的某种属性测量之后而要分派给它一个数字序列或符号,这个数字序列或者符号就是数据,比如某个人的性别(男)、年龄(34岁)、身高(170厘米)、婚姻状况(已婚)、受教育程度(本科)、月收入(3000元)等。第一节 数据的特征与类型 一、一、数据的概念与特征数据的概念与
2、特征 社会研究中的数据具有具体性、变异性与规律性等特征。 具体性指的是研究者搜集的数据不是数学中的抽象的数量,而是有一定的现实意义。 变异性是指观察到的一组数据总是在一定的范围内最大值与最小值之间变化,表现出不同程度的差异。 规律性是指数据在一定范围内表现出差异性外,还存在着一定的规律性。第一节 数据的特征与类型 二、数据的类型二、数据的类型 (一)定类数据(一)定类数据 定类数据本质上是一个分类体系的结果,是研究对象的属性和特点被分类之后而被分派的数字或符号。婚姻状况分成未婚、已婚、离婚、丧偶与分居五种类别,这里的测量是定类尺度的测量。第一节 数据的特征与类型 二、数据的类型二、数据的类型
3、(二)定序数据(二)定序数据 当研究者对研究对象分类之后,并且按照研究对象某一特性的程度对之进行排序时,就是在进行定序尺度的测量,该种尺度的测量获得的是定序数据。下表除了可以得到5位老人受教育程度的信息外,还得到了类别间顺序的信息。第一节 数据的特征与类型 二、数据的类型二、数据的类型 (三)定距数据(三)定距数据 定距尺度测量获得的定距数据除了能反映社会现象属性的等级顺序外,还能反映出它们之间的确切距离。以年作为定距等级,不但获得了5个老人文化程度的等级信息,还获得了5人文化程度的差异程度方面的信息。第一节 数据的特征与类型 二、数据的类型二、数据的类型 (四)定比数据(四)定比数据 定比尺
4、度测量获得的定比数据除了具有“+”和“-”的数学性质外,还具有“”与“”的数学性质,因为定比数据往往拥有一个绝对的零点,所以数据之间构成了有意义的比值。有数学意义的零点,这是定距数据与定距数据的唯一区别。第二节 定类数据的组织与展示 一、定类数据的组织一、定类数据的组织 定类数据本身是一个分类体系,社会科学家面对收集到的一堆原始数据,往往先列出分类的类别,以表格的形式建立频数(频次)分布,再计算出每一类别的频数和百分比。第二节 定类数据的组织与展示 一、定类数据的组织一、定类数据的组织第二节 定类数据的组织与展示 二、定类数据的图示二、定类数据的图示 (一)条形图(一)条形图 条形图(又称为长
5、条图)使用宽度相同的长方形的高度或长度来表示频次和百分比,优点在于分类标志容易识别。第二节 定类数据的组织与展示 二、定类数据的图示二、定类数据的图示 (二)对比条形图二)对比条形图 绘制条形图时,当每一单个的类别在不同的时间或空间上的取值不同,并且想把这种不同表示出来时,可以选择对比条形图。第二节 定类数据的组织与展示 二、定类数据的图示二、定类数据的图示 (三)饼图 饼图(又称为扇形图)是将一个圆划分为几个扇区用来表示频数或百分比之间的相对关系,能够反映一个样本(总体)各组成类别的频数占总频数的比例,对于研究不同类别之间的结构关系相当有用。第三节 定序数据的组织与展示 一、定序数据的整理一
6、、定序数据的整理 将各个定序类别或组的频次累积相加得到的频次是累积频次(cumulative frequencies),将各个定序类别或组的百分比累积相加得到的百分比是累积百分比(cumulative percentages)。累积频次和累积百分比分为两类:一类是向上累积,一类是向下累积,需要明确的是累积是按照变量的等级顺序而非表中上下的方向进行的。第三节 定序数据的组织与展示 二、定序变量的图示:累积频数分布图二、定序变量的图示:累积频数分布图城 市 老 人 对 自 己 年 老 烦 恼 的 评 价非 常 同 意同 意不 确 定同 意非 常 不 同 意频 数 /个100080060040020
7、00第三节 定序数据的组织与展示 二、定序变量的图示:累积频数分布图二、定序变量的图示:累积频数分布图第四节 定距数据的组织与展示 一、数据分组一、数据分组 某中学有130名教师, 这些教师的年龄分布。第四节 定距数据的组织与展示 一、数据分组一、数据分组第四节 定距数据的组织与展示 二、分组的步骤二、分组的步骤 一般情况下组数不少于3不大于20。 为了分析的方便,组距往往取5或10的倍数。组数确定之后下一步要确定组距,组距由数据的最大值、最小值和组数来确定。这里有一点需要注意的是,每一组两端的数字并非一定是该组真正的上限和下限。最大值-最小值组距=组数第四节 定距数据的组织与展示 二、分组的
8、步骤二、分组的步骤第四节 定距数据的组织与展示 二、分组的步骤二、分组的步骤 分组之后为了反映一组数据的一般水平,一般采用组中值(class midpoint)作为该组数据的代表值。真正上限+真正下限组中值=2第四节 定距数据的组织与展示 三、定距数据的图示:直方图三、定距数据的图示:直方图 在平面直角坐标系中,以横轴表示数据分组,以纵轴表示频数或概率,这样各组与对应的频数或百分比就形成了一个矩形,就是直方图(histogram),又称为矩形图。 某中学教师年龄分组的直方图 第五节 数据组织与展示的SPSS应用 一、频次分布一、频次分布 1、依次点击AnalyzeDescreptionFreq
9、uencies第五节 数据组织与展示的SPSS应用 一、频次分布一、频次分布 2、单击选择要分析的变量并点击中间的箭头将之放置在Variable(s)框中第五节 数据组织与展示的SPSS应用 二、条形图和饼图二、条形图和饼图 条形图和饼图主要用来进行定类变量各种类别的频数和百分比的比较,获得条形图与饼图的步骤如下: 1、依次点击AnalyzeDescreptionFrequencies。 2、单击选择要分析的变量,并点击中间的箭头将之放置在Variable(s)栏中。 3、点击Charts,弹出一个新窗口。 4、完成设置后,点击Continue, 返回上一级窗口,点击Ok。第五节 数据组织与展
10、示的SPSS应用 三、累积频次分布图:三、累积频次分布图: 1、依次点击GraphsBar,弹出一个窗口, 该窗口有上下两部分。 2、对Bar charts 窗口的上部分和下部分设置之后,点击Define按钮,弹出一个窗口, 3、设置完毕后,点击Ok按钮,提交运行。第五节 数据组织与展示的SPSS应用 四、定距变量的分组四、定距变量的分组 (一)(一)Automatic Recode分组操作分组操作 1、依次点击TransformAutomatic Recode,弹出一个窗口。 2、将要分组的变量放置在VariableNew Name栏中。 3、在New Name框中放入分组之后的新生成的变量
11、的名字,点击New Name按钮。 4、Recode Starting from下面有两个连个选项,选择Lowest value则分组按升序排列,选择Highest value则分组按降序排列。 5、设置完毕后,点击Ok按钮,提交运行。第五节 数据组织与展示的SPSS应用 四、定距变量的分组四、定距变量的分组 (二)(二)Into Same Variables分组操作分组操作 1、依次点击TransformRecodeInto Same Variables,弹出一窗口。 2、将要分组的变量放置在Numeric Variables栏中。 3、单击Old and New values按钮出现窗口,
12、进行分组区间的设置。 4、如果仅仅对符合特定条件的个案分组,在点击If按钮后弹出的窗口中进行设置。 5、设置完毕后,返回上一级窗口,点击Ok按钮,提交运行。第五节 数据组织与展示的SPSS应用 四、定距变量的分组四、定距变量的分组 (三三) Into Different Variables分组操作分组操作 1、依次点击TransformRecodeInto Different Variables,弹出一个窗口。 2、将要分组的变量放置在Numeric VariablesOutput栏中。 3、在Output Variable一栏的Name中输入新变量的名字,Label一栏中输入新变量的标签,并
13、且点击Change按钮使得新变量的名字能出现在Numeric VariablesOutput栏中。 4、点击Old and New values按钮出现一对话框,进行分组区间的设置。第五节 数据组织与展示的SPSS应用 四、定距变量的分组四、定距变量的分组 (三三) Into Different Variables分组分组操作操作 5、如果仅仅对符合特定条件的个案分组,则在点击If按钮后弹出的窗口中进行设置。 6、设置完毕后,返回上一级窗口,点击Ok按钮,提交运行。第五节 数据组织与展示的SPSS应用 五、直方图五、直方图 定距数据分组之后,其图示一般采用直方图的形式。具体的步骤如下: (1)
14、首先对数据进行分组。 (2)依次点击GraphsHistogram,弹出一个窗口。 (3)将要分析的变量放置在Variable框中。 (4)选择Display normal curve则在生成的直方图中出现一条拟合的正态曲线。 (5)点击Titles之后可以在弹出的窗口中设置生成的直方图的主标题和副标题。 (6)设置完毕后,点击Ok按钮。思考题思考题 1. 变量与数据有什么关系? 2. 定类数据、定序数据与定距数据的整理与展示各有哪些方法? 3. 统计表一般由哪些部分组成?练习题练习题 1. 有240个贫困家庭接受调查,被问及对政府的廉租房政策是否满意,有180个家庭表示不满意,40个家庭表示
15、满意,20个家庭不置可否,请计算表示满意的家庭占被调查家庭的比例和百分比? 2. 某中学初三数学教研室在课程改革后对初三(一)班的数学成绩做了分析,45名学生的成绩由好到差分为A、B、C与D四种,统计结果如下表所示: (1)此表的数据属于什么类型的数据? (2)请用SPSS绘制此表的频数分布表,然后再绘制一个饼形图或条形图。AABCBCACDBBBBAAACAACBBCCAAAACACACABBBBBBCBBDB练习题练习题练习题练习题 4根据武汉市初中生日常行为状况调查的数据(data9),运用SPSS绘制饼状图说明武汉市初中生中独生子女和非独生子女的分布状况。 5根据武汉市初中生日常行为状况调查的数据(data9),绘制武汉市初中生家庭总体经济状况的累积频次图。 6根据武汉市初中生日常行为状况调查的数据(data9),将节假日初中生与父母聊天的时间以12分钟为组距进行分组,并绘制新生成的分组的直方图。