1、1谢谢观赏2019-8-232第一节第一节 数据的预处理数据的预处理 第二节第二节 数据的整理与展示数据的整理与展示第三节第三节 统计表统计表主要学习内容谢谢观赏2019-8-233第一节第一节 数据预处理数据预处理一、数据预处理的概念一、数据预处理的概念 数据预处理,数据预处理,就是对统计调查得来的各种原始资料,进行就是对统计调查得来的各种原始资料,进行科学的分类和汇总,使之系统化,从而得出能够反映总体数量特科学的分类和汇总,使之系统化,从而得出能够反映总体数量特征的综合资料的工作过程。征的综合资料的工作过程。统计预处理是统计分析阶段的前提,在统计工作中起着承统计预处理是统计分析阶段的前提,
2、在统计工作中起着承先启后的作用。因此,数据预处理工作的质量直接影响统计工作先启后的作用。因此,数据预处理工作的质量直接影响统计工作的整体效果。的整体效果。谢谢观赏2019-8-234第一节第一节 数据预处理数据预处理(一)数据预处理的内容(一)数据预处理的内容1 1、设计、设计整理汇总方案整理汇总方案。具体包括两个方面:。具体包括两个方面:一是对总体的处理方法;二是确定用哪些统计指标来一是对总体的处理方法;二是确定用哪些统计指标来说明总体。说明总体。2 2、根据汇总方案,对各个调查项目的资料进行汇总。、根据汇总方案,对各个调查项目的资料进行汇总。3 3、通过统计表的形式,描述整理的结果。、通过
3、统计表的形式,描述整理的结果。谢谢观赏2019-8-235第一节第一节 数据预处理数据预处理二二、数据预处理的程序数据预处理的程序1 1、对原始资料进行审核。完整性、准确性。、对原始资料进行审核。完整性、准确性。2 2、资料的分组和汇总。分组和汇总是整理的中心工作。、资料的分组和汇总。分组和汇总是整理的中心工作。3 3、编制统计图表。、编制统计图表。4 4、统计资料的积累和保管。、统计资料的积累和保管。谢谢观赏2019-8-236第一节第一节 数据预处理数据预处理三、统计分三、统计分组组(一一)统计分组的概念统计分组的概念 统计分组就是根据统计研究的目的和客观现象的内在特点,将统计总体按照一定
4、的标志区分为若干个不同性质的组。谢谢观赏2019-8-237第一节第一节 数据预处理数据预处理253342谢谢观赏2019-8-238第一节第一节 数据预处理数据预处理(二二)统计分组的作用统计分组的作用1.1.划分性质不同的各种类型,研究其特征和规律性划分性质不同的各种类型,研究其特征和规律性.分析总体中各个组成部份的构成情况分析总体中各个组成部份的构成情况可以揭示现象之间的依存关系可以揭示现象之间的依存关系谢谢观赏2019-8-239第一节第一节 数据预处理数据预处理1.穷尽原则穷尽原则2.2.互斥原则互斥原则 问题:某商场的服装分为男问题:某商场的服装分为男装、女装、童装三类,是否符合装
5、、女装、童装三类,是否符合互斥原则?互斥原则?(三)分组的原则(三)分组的原则谢谢观赏2019-8-2310第一节第一节 数据预处理数据预处理(四)统计分组的种类(四)统计分组的种类简单分组与复合分组简单分组标标 志志人数(人)人数(人)比重(比重(%)按性别分组按性别分组男性男性女性女性按企业性质分按企业性质分组组国有企业国有企业独资企业独资企业其他企业其他企业按规模分组按规模分组大型企业大型企业中型企业中型企业小型企业小型企业 对研究对象按一个标志进行分组,就叫简单分组。多个简单分组构成平行分组体系。谢谢观赏2019-8-2311第二节第二节 数据的整理和展数据的整理和展示示一、频数分布的
6、概念一、频数分布的概念(一)频数分布和分布数列在统计分组的基础上,将总体中所有单位按组归类整理,形成总体中各单位数在各组间的分布称为频数分布或次数分布。谢谢观赏2019-8-2312第二节第二节 数据的整理和展数据的整理和展示示(二)分布数列的种类(二)分布数列的种类 分布数列 单项式分布数列组距式分布数列等距分组 异距分组品质分布数列变量分布数列谢谢观赏2019-8-2313第二节第二节 数据的整理与展数据的整理与展示示二二、统计分组的方法统计分组的方法1.品质标志分组表3-1 某班学生的性别构成情况按性别分组按性别分组绝对数(人数)绝对数(人数)比重(比重(%)男男女女3030101075
7、752525合计合计4040100100谢谢观赏2019-8-2314第二节第二节 数据的整理与展数据的整理与展示示2.数量标志分组按数量标志分组,应注意如下两个问题:按数量标志分组,应注意如下两个问题:n首先,分组时各组数量界限的确定必须能反映事物质的差别。首先,分组时各组数量界限的确定必须能反映事物质的差别。n其次,选择适当的分组形式,确定合适的组数、组距和组限。其次,选择适当的分组形式,确定合适的组数、组距和组限。谢谢观赏2019-8-2315第二节第二节 数据的整理与展数据的整理与展示示(1 1)单项式分组和组距式分组)单项式分组和组距式分组 单项式分组假设某班30个同学年龄数据如下:
8、17,17,18,18,18,18,18,19,19,19,19,19,19,19,19,19,20,20,20,20,20,20,20,21,21,21,22,22,23,23谢谢观赏2019-8-2316第二节第二节 数据的整理和展数据的整理和展示示(2 2)间断式分组和连续式分组)间断式分组和连续式分组 间断组距式分组间断组距式分组:例如,某地儿童按年龄分组为:未满1周岁,12岁,34岁,59岁,1014岁。连续组距式分组连续组距式分组:分数人数(人)比率(%)50-602560-70717.570-801127.580-90123090-100820合计40100表3-2 某班学生考试
9、成绩上组限不在内谢谢观赏2019-8-2317第二节第二节 数据的整理和展数据的整理和展示示(3 3)等距分组和异距分组)等距分组和异距分组 分数人数(人)比率(%)50-602560-70717.570-801127.580-90123090-100820合计40100表表3 3-3 3 某班学生考试成绩某班学生考试成绩谢谢观赏2019-8-2318第二节第二节 数据的整理和展数据的整理和展示示(4)(4)组距的计算组距的计算组距上限组距上限下限下限 该公式只适用于计算连续组距式,例如成绩分组中,60一70分,70一80分,其组距为10分。例如,商店规模按职工人数分组,分为;15人,610人
10、,11一15人等。组距是多大?谢谢观赏2019-8-2319第二节第二节 数据的整理和展数据的整理和展示示间断式分组:间断式分组:请注意这两个计算式的适用差别!请注意这两个计算式的适用差别!组距本组上限(下限)组距本组上限(下限)-前组上限(下限)前组上限(下限)组距本组上限组距本组上限-本组下限本组下限+1谢谢观赏2019-8-2320第二节第二节 数据的整理和展数据的整理和展示示组中值的计算:组中值的计算:对于连续组距:组中值组中值=(上限(上限+下限)下限)/2/2例例1 1:职工按月工资分组(连续组距):职工按月工资分组(连续组距)工资分组 组中值工资分组 组中值400500 450
11、700800 750500600550 8001000 850600700650 10001200 1100谢谢观赏2019-8-2321第二节第二节 数据的整理和展数据的整理和展示示例例2 2:职工按年龄分组(不连续组距):职工按年龄分组(不连续组距)年龄分组 组中值 年龄分组 组中值 16-20 18.5 41-50 46 21-30 26 51-60 56 31-40 36 谢谢观赏2019-8-2322第三节第三节 统计表统计表一、统计表的构成一、统计表的构成 统计表是用来表示经过汇总加工后的综合统计资料的一种表格形式。统计表的构成 横向总标题横栏标题纵栏标题指标数值纵向主词栏宾词栏谢
12、谢观赏2019-8-2323第三节第三节 统计表统计表 表表3 3-4 4 某市某年人口的产业分布某市某年人口的产业分布人口数绝对人数(万人)比重(%)第一产业第二产业第三产业40050030033.341.725.0合计1200100.0总标题横栏标题纵栏标题指标数值主词栏宾词栏谢谢观赏2019-8-2324第三节第三节 统计表统计表二、统计表的种类二、统计表的种类(一)简单表:主词未经任何分组的统计表称为简单表。320合计13810280一车间二车间三车间产值(万元)车间 表表3 3-5 5 某企业某年总产值某企业某年总产值谢谢观赏2019-8-2325第三节第三节 统计表统计表(二)简单
13、分组表(二)简单分组表 主词栏按某一个标志进行分组的统计表。表表3 3-6 6 某市某年人口的产业分布某市某年人口的产业分布劳动人口按产业分组人口数绝对数(万人)比重(%)第一产业第二产业第三产业40050030033.341.725.0合计1200100.0谢谢观赏2019-8-2326第三节第三节 统计表统计表(三)复合分组表(三)复合分组表 按两个及两个以上标志进行重叠分组的统计表。表表3 3-7 7 某地区某年工业企业人员的构成某地区某年工业企业人员的构成男女男女男女国有企业集体企业其他企业所有制企业数工人总数工龄1年以下2年以上谢谢观赏2019-8-2327第三节第三节 统计表统计表
14、三、统计表的设计三、统计表的设计 1总标题简明扼要。2上下两端的端线用粗线,其他线条用细线。3左右两端习惯上均不划线,采用开口式。4.指标数值应有计算单位。5.表中需有“合计”一栏,一般列在表的最后一行。6.对某些资料必须进行说明时,在表的下面注明。谢谢观赏2019-8-2328第三节第三节 统计表统计表四、统计图四、统计图运用统计图形描述次数分布的类型特征,常用的图形有三种:直方图、折线图、曲线图。下面举例说明:表表3 3-8-8 某班学生某班学生统计学统计学考试成绩分布表考试成绩分布表按成绩分组按成绩分组次数次数频率(频率(%)50-6050-6060-7060-7070-8070-808
15、0-9080-9090-10090-1002 27 7111112128 85 517.517.527.527.530302020合计合计4040100100谢谢观赏2019-8-2329第三节第三节 统计表统计表人数(人)8124频率(%)20301040 50 60 70 80 90 100(一)直方图次数分布直方图示意图谢谢观赏2019-8-2330第三节第三节 统计表统计表异距数列绘制直方图异距数列绘制直方图 表3-9 某班学生统计学考试成绩次数分布表按成绩分组组距次数频数密度=次数/组距56-60420.560-66650.8366-8216140.8882-9210111.192-
16、100881.0合计-40-谢谢观赏2019-8-2331第三节第三节 统计表统计表(二)折线图人数(人)8124频率(%)20301040 50 60 70 80 90 100学生成绩次数分布状况次数分布折线图示意图谢谢观赏2019-8-2332第三节第三节 统计表统计表(三)曲线图学生成绩次数分布状况人数频率(%)40 50 60 70 80 90 1008412201030谢谢观赏2019-8-2333本章小结:1 1、数据整理的内容与步骤;统计分组原则与方法。、数据整理的内容与步骤;统计分组原则与方法。2 2、频数分布的概念,分布数列有两个要素,变量数、频数分布的概念,分布数列有两个要素,变量数列的编制;频数分布有三种类型。列的编制;频数分布有三种类型。3 3、统计表的结构和分类,统计图的种类。、统计表的结构和分类,统计图的种类。谢谢观赏2019-8-23