1、统计学 主主 讲:王育晓讲:王育晓 主要内容 2.1 数据的计量与类型 2.2 统计数据的收集 2.3 统计数据的整理 2.4 统计数据的显示 2.1 数据的计量与类型 2.1.1 数据的计量尺度 2.1.2 数据的类型 2.1.1 数据的计量尺度 统计数据是对现象进行计量的结果,对于不同事物 我们能够予以计量或测度的程度是不同的。 2.1.1 数据的计量尺度 (1)也称名义尺度或分类尺度 (2)计量层次最低 (3)对事物进行平行的分类 (4)各类别可以指定数字代码表示 (5)使用时必须符合类别穷尽和互斥的要求 (6)数据表现为“类别” (7)具有=或的数学特性 定类尺度(Nominal sc
2、ale) 2.1.1 数据的计量尺度 例: 性别:男,女 民族:汉族、壮族、满族、回族共56个民族。 企业按性质分:国有、集体、私营、独资 定类尺度(Nominal scale) 2.1.1 数据的计量尺度 (1)也称顺序尺度 (2)对事物分类的同时给出各类别的顺序 (3)比定类尺度精确 (4)未测量出类别之间的准确差值 (5)数据表现为“类别”,但有序 (6)具有或的数学特性 定序尺度(Ordinal scale) 2.1.1 数据的计量尺度 例:考察课成绩分:优、良、中、及格、不及格 消费者满意度:非常不满意、不满意、一般、满意、非 常满意 产品质量等级:一等品、二等品、三等品 获奖等级:
3、特等奖、一等奖、二等奖 定序尺度(Ordinal scale) 2.1.1 数据的计量尺度 定距(间隔)尺度(Interval scale) (1)也称间隔尺度 (2)对事物的准确测度 (3)比定序尺度精确 (4)数据表现为“数值” (5)没有绝对零点 (6)具有 + 或 - 的数学特性 2.1.1 数据的计量尺度 定距(间隔)尺度(Interval scale) 例:百分制学生成绩:90分,87分,60分,55分,45分 温度:41度,36度,25度,18度 2.1.1 数据的计量尺度 定比(比率)尺度(Ratio scale) (1)也称比率尺度 (2)对事物的准确测度 (3)与定距尺度处
4、于同一层次 (4)数据表现为“数值” (5)有绝对零点 (6)具有 或 的数学特性 2.1.1 数据的计量尺度 定比(比率)尺度(Ratio scale) 例:月收入:6000元,5000元,4000元,3000元 年龄:80岁,60岁,40岁,30岁 四种计量尺度的比较四种计量尺度的比较 定类尺度定类尺度定序尺度定序尺度定距尺度定距尺度定比尺度定比尺度 分类分类( = ( = , ) ) 排序排序( ( ) ) 间距间距( + ( + ,-)-) 比值比值( ( ,) ) 计量尺度计量尺度 数学特性数学特性 “” 2.1.1 数据的计量尺度 2.1.2 数据的类型 分类数据、顺序数据、数值型
5、数据 定类尺度定类尺度分类数据分类数据 定序尺度定序尺度 定距尺度定距尺度 定比尺度定比尺度 顺序数据顺序数据 定距数据定距数据 定比数据定比数据 品质数据品质数据 数值型数据数值型数据 (1)分类数据(Categorical Data)是对事物进行分类的结果,由定类尺 度计量而得。通常表现为文字、代码或符号。 例如:例如:性别,男,女可用0,1表示。 (2)顺序数据(Rank Data)又称为等级数据,由定序尺度计量而得,与 分类数据一样都属于定性数据,但含有的信息量更多,能够进行差别 与优劣的比较。 例如:例如:消费者满意度:非常不满意(1)、不满意(2)、一般(3)、 满意(4)、非常满
6、意(5) 分类数据与顺序数据说明的是事物的品质特征,因此被统称为定性数 据或品质数据(Qualitative Data)。 2.1.2 数据的类型 分类数据、顺序数据、数值型数据 (3)数值型数据(Metric Data)是使用自然或度量衡单位对事物进行测 量的结果,其结果表现为具体数值。 例如,例如,身高、体重、收入、百分制成绩、温度 由定距尺度和定比尺度度量得到,说明的是现象的数量特征,通常用 数值来表现,因此也称为定量数据或数量数据(Quantitative Data)。 2.1.2 数据的类型 分类数据、顺序数据、数值型数据 2.1.2 数据的类型 观测数据和实验数据 (1)观测数据(
7、Observational Data)是通过调查或观测而 收集到的数据。 例如:例如:据新闻报道,某省下属某市的环境监测站的工作人员脚踏黄 土采水样,手攀云梯测烟囱,坚持每天出具监测数据,每年 汇总10万多个环境监测数据。 (2)实验数据(Experimental Data)是在实验中控制实验对 象而收集到的数据。多用于自然科学领域中的数据收集。 2.1.2 数据的类型 截面数据和时间序列数据 (1)截面数据(Cross-sectional Data)是在相同或近似相 同的时间点上收集到的,描述现象在某一时刻变化情况 的数据。 例如:例如:2013年我国的GDP数据。 (2)时间序列数据(Ti
8、me Series Data)是在不同时间收集 到的,描述现象随时间变化情况的数据。 例如:例如:19902013年我国历年的GDP所形成的数据。 随堂练习 1.指出下面的变量是定性的还是定量的,并说明每一变 量适用的计量尺度。 A. 性别 B. 年龄 C. 成绩 D. 月工资 2.2 统计数据的搜集 2.2.1 统计调查的基本概念 2.2.2 统计调查的组织形式 2.2.3 统计调查的具体方法 2.2.4 统计调查方案 2.2.1 统计调查的基本概念 统计调查是根据统计研究 的目的要求和任务,运用科学 的调查方法,有计划、有组织 地向客观实际收集资料的过程 统计调查的资料必须准确、 全面、及
9、时 来源于别人调查或 试验的资料 2.2.2 统计调查的组织形式 统计调查的类别 2.2.2 统计调查的组织形式 统 计 报 表 抽 样 调 查 统计调查方式 普 查 重 点 调 查 典 型 调 查 统计调查的组织方式 1. 普查 2.2.2 统计调查的组织形式 (1)为特定目的专门组织的非经常性全面调查。 (2)对国情国力的调查一般采用普查。 (3)一般需要规定统一的标准调查时间。 (4)数据的规范化程度较高。 (5)通常是一次性或周期性的。 统计调查的组织方式 2.2.2 统计调查的组织形式 例例1 1:人口普查是一项重大的国情国力调查。2000年第五次全国人口普查 以来,我国的人口状况发
10、生了很大变化。组织开展第六次全国人口 普查,将普查我国人口在数量、结构、分布和居住环境等方面的变 化情况,为科学制定国民经济和社会发展规划,统筹安排人民的物 质和文化生活,实现可持续发展战略,构建社会主义和谐社会,提 供科学准确的统计信息支持。 1. 普查 统计调查的组织方式 2.2.2 统计调查的组织形式 例例2 2: 第三次全国经济普查 目的:全面调查了解我国第二产业和第三产业的发展规模及布局,了 解我国产业组织、产业结构、产业技术的现状以及各生产要素 的构成,进一步查实服务业、战略性新兴产业和小微企业的发 展状况,摸清我国各类单位的基本情况,全面更新覆盖国民经 济各行业的基本单位名录库、
11、基础信息数据库和统计电子地理 信息系统。通过普查,进一步夯实统计基础,健全统计工作的 部门协调机制和信息共享机制,为加强和改善宏观调控,加快 经济结构战略性调整,科学制定中长期发展规划,提供科学准 确的统计信息支持。 1. 普查 统计调查的组织方式 2.2.2 统计调查的组织形式 例例2 2: 第三次全国经济普查 时点与期限:第三次全国经济普查登记工作已从2014年1月1日正式启动, 利用3个月时间,约300万名普查人员将对中国1000多万户法 人单位和产业活动单位、约6000万名个体经营户进行入户登 记。普查标准时点为2013年12月31日,普查时期资料为2013 年年度资料。 1. 普查
12、统计调查的组织方式 2.2.2 统计调查的组织形式 (1)从总体中随机抽取一部分单位(样本)进行调查。 (2)目的是推断总体的未知数字特征。 (3)最常用的调查方式。 (4)具有经济性、时效性强。 (5)适应面广、准确性高。 2. 抽样调查特点 统计调查的组织方式 2.2.2 统计调查的组织形式 (1)是用于认识那些不能或难以进行全面调查的总体的数量特征以及 具有破坏性的产品质量检测等。 (2)是用于认识那些发展变化比较稳定和有规律性而不必进行全面调 查的现象总体的数量特征等。 (3)是用于收集灵敏度高、时效性强或时间要求紧迫的统计数据。 (4)是用于与其他数据收集方式相结合,相互补充和核对。
13、 2. 抽样调查适用范围 统计调查的组织方式 2.2.2 统计调查的组织形式 (1)是国家和地方政府部门获取统计数据的主要统计调查组织方式。 (2)按照国家有关法规的规定、自上而下地统一布置、自下而上地逐 级提供基本统计数据。 (3)以原始数据为基础,按照统一的表式、统一的指标、统一的报送 时间和统一的报送程序填报。 (4)经常地、定期地搜集反映国民经济和社会发展基本情况的资料, 为各级政府和有关部门制定国民经济和社会发展计划,以及检查 计划执行情况服务。 3. 统计报表 统计调查的组织方式 2.2.2 统计调查的组织形式 3. 统计报表 统计调查的组织方式 2.2.2 统计调查的组织形式 3
14、. 统计报表 统计调查的组织方式 2.2.2 统计调查的组织形式 按报表内容和实施范围按报表内容和实施范围 国国 家家 统统 计计 报报 表表 地地 方方 统统 计计 报报 表表 部部 门门 统统 计计 报报 表表 3. 统计报表 统计调查的组织方式 2.2.2 统计调查的组织形式 按报送周期长短按报送周期长短 旬旬 报报 年年 报报 半半 年年 报报 季季 报报 日日 报报 3. 统计报表 统计调查的组织方式 2.2.2 统计调查的组织形式 (1)从调查对象的全部单位中选择少数重点单位进行调 查。 (2)重点单位的选择不要带有主观因素。 (3)调查结果不能用于推断总体。 重点单位,是指在全部
15、总体单位中出现的频数极少,但 其某一数量标志却在所要研究的标志总量中占有很大的比重 的单位。 4. 重点调查 统计调查的组织方式 2.2.2 统计调查的组织形式 例:例:要了解全国煤炭的生产变化情况, 只要对全国几个大型 矿务局进行调查, 就可以及时地了解全国煤炭生产的基 本情况。 例:例:对为数不多的大型钢铁企业进行调查, 就可以对全国钢 铁产品的产量、品种、质量等变化情况作出基本分析。 例:例:对我国32个大中城市的零售商品价格的变化进行调查, 可以及时了解全国城市零售商品价格变化的趋势。 4. 重点调查 统计调查的组织方式 2.2.2 统计调查的组织形式 特点: (1)重点单位的选择不带
16、有主观因素,但有量的限制。 (2)目的在于反映现象总体的基本情况,搜集重点单位详细的调查资 料。因此能以较少的投入,较快的速度了解取得某些标志的主要 情况或基本趋势。 适用情况: (1)当调查目的只要求了解总体基本情况、发展趋势,不要求全面数 据,而总体中又确实存在重点单位时,就可以采用该调查方法。 (2)重点调查可以用于不定期的一次性调查,也可以用于经常的连续 性调查。 4. 重点调查 统计调查的组织方式 2.2.2 统计调查的组织形式 (1)从调查对象的全部单位中选择少数典型单位进行调查,有以下三 种选典方法: “解剖麻雀”的方法 “划类选典”的方法 “抓两头”的方法 (2)目的是描述和揭
17、示事物的本质特征和规律。 (3)调查结果不能用于推断总体。 典型单位,是指在同一事物中能最充分、最集中地体现总体某方面 共性的代表单位 。 5. 典型调查 统计调查的组织方式 2.2.2 统计调查的组织形式 例:例:江苏如皋、湖北钟祥、广西巴马、四川乐山市、辽宁辽阳兴隆村、新 疆克拉玛依为中国六大长寿之乡,超过联合国规定的长寿之乡的标准, 每万人中拥有百岁寿星.人。如皋地处长江下游北岸平原,隶 属江苏省南通市。作为世界知名长寿之乡,如皋不在高寒地带,也不 在偏僻山区,而是地处江海平原、中国沿海经济较发达地带。研究如 皋的长寿经验。 5. 典型调查 统计调查的组织方式 2.2.2 统计调查的组织
18、形式 例:例:江苏省吴江县开展一次对县属镇中的“农民工”的典型调查,来认 识“农民工”是否有利于城镇建设等问题。在对全县7个县属镇进行 粗略分析的基础上,最后选定了震泽镇作为典型调查,因为震泽在7 个镇中算发展较快的一个镇,而且该镇农民工占职工总数的20.4%, 超过全县15%的比例。通过调查分析得出结论是推动该镇发展的, 一个重要因素是该镇吸收了大量农民工。因此,通过典型分析,最 后可以推论出农民工是有利于城镇发展等结果。 5. 典型调查 统计调查的组织方式 2.2.2 统计调查的组织形式 特点: (1)有意识选取调查单位。(主观性较强) (2)掌握现象总体发展变化的规律和总结经验。 适用情
19、况:典型调查虽选取单位不能排除主观性,推断总体只能是 近似值,但选取单位数量少,取得资料快,调查效率高, 特别适用于了解新情况、解决新问题的调查。 5. 典型调查 统计调查的组织方式 2.2.3 统计调查的具体方法 统计调查的具体方法 观察法 访问法 实验法 报告法 文献法 网上调查法 观察法 2.2.3 统计调查的具体方法 (1)就调查对象的行动和意识,调查人员边观察边记录以收 集所需信息。 (2)调查人员不是强行介入。 (3)能够在被调查者不察觉的情况下获得资料。 观察法 2.2.3 统计调查的具体方法 例:例:调查研究幼儿园社会领域教学活动状况,观察某个幼儿园班级中的 社会领域教学活动的
20、整个过程,对该活动过程中的每个细节都作详 细的描述。 例:例:在幼儿园中观察一个班幼儿的一日活动,可以从幼儿入园至午睡或 从下午起床至离园进行观察。又比如在幼儿自由游戏时间观察幼儿 的相互交往行为。 例:例:研究2-5岁儿童在游戏中的社会参与行为,研究者预先将 这类行为分为无所事事、旁观、独自游戏、平行游戏、 联合游戏、协作游戏六类,并将其制成观察表格,观察 时判断幼儿从事哪类社会性参与行为。 访问法 2.2.3 统计调查的具体方法 访问法是由调查人员通过口头、书面等方式向被调查者 了解情况,取得第一手资料的调查方法。 访问法 2.2.3 统计调查的具体方法 面谈访问法:调查者与被调查者通过面
21、对面地交谈而获得 资料。 又分: (1)标准式访问(结构式访问),即按照事先设计的、有一定结构的 访问问卷进行的访问,是一种高度控制的访问方法。常用于大规 模的社会调查。 (2)非标准式访问(非结构式访问),通常只给出一个题目,没有预 定的问卷、表格、提问的标准程序。 1. 面谈访问法 访问法 2.2.3 统计调查的具体方法 电话访问法:调查者利用电话与被调查者进行语言交流以 获得信息。 特点:时效快、成本低,但问题的数量不宜过多。 2. 电话访问法 访问法 2.2.3 统计调查的具体方法 邮寄访问法(邮寄问卷调查):通过某种方式将调查表 或问卷送至某调查者手中,由被调查者填写,然后将问卷寄
22、回。一种标准化调查,调查者与被调查者没有直接的语言交 流,信息的传递依赖于问卷。 问卷或表格的发放方式有邮寄、宣传媒介传送、专门场所 分发三种。 3. 邮寄访问法 实验法 2.2.3 统计调查的具体方法 (1)在设定的特殊实验场所、特殊状态下,对调查对象进行 实验以获得所需资料。 (2)有室内实验法和市场实验法。 报告法 2.2.3 统计调查的具体方法 由被调查单位按照调查机关的调查方案要求,及时向调查机 关报告统计资料的调查方法。 统计报表就属于这种方法。 文献法 2.2.3 统计调查的具体方法 文献法是调查人员根据调查方案的内容和要求,收集文献 资料的一种方法。 文献包括报纸、书籍以及数据
23、表格等文字数字文献,也包 括影视、图画、磁带和唱片等声音、图像文献。 网上调查法 2.2.3 统计调查的具体方法 网上调查法指利用互联网进行调查,获取调查资料的统计 调查方法。 它有两种方式: (1)是利用互联网直接进行问卷调查等方式搜集一手资 料,称为网上直接调查。 (2)是利用互联网的媒体功能,从互联网上搜集二手资 料,称为网上间接调查。 网上调查法 2.2.3 统计调查的具体方法 特点: 及时性和共享性 便捷性和低费用 交互性和充分性 可靠性和客观性 无时空、地域限制 2.2.4 统计调查方案 调查方案的内容调查方案的内容 调查目的 (1)调查要达到的具体目标 (2)回答“为什么调查?”
24、 (3)调查之前必须明确 2.2.4 统计调查方案 调查目的 例:例:人口普查是一项重大的国情国力调查。 第一次(1953.7.1零时):配合各级人民代表大会的选举,为第一个五年计划 提供依据。 第二次(1964.7.1零时):为制定第三个五年计划和长远规划提供依据。 第三次(1982.7.1零时):结束动乱,为给国家制定政策和计划提供人口数 据。 第四次(1990.7.1零时):为检验“七五”计划执行情况,制定“八五”计划 提供数据。 第五次(2000.11.1零时) :为了制定国民经济和社会发展战略规划,实现人 口与资源、环境的协调发展。 第六次(2010.11.1零时):调查我国人口在数
25、量、结构、分布和居住环境等 方面的变化情况,为科学制定国民经济和社会发 展规划,统筹安排人民的物质和文化生活,实现 可持续发展战略,构建社会主义和谐社会,提供 科学准确的统计信息支持。 2.2.4 统计调查方案 调查对象和调查单位 (1)调查对象:根据调查的目的而确定被调查的统计总体。 (2)调查单位:构成调查对象的每一个总体单位称为填报单 位也称报告单位,它是填写调查内容、提交 调查资料的单位。填报单位与调查单位有时 有交叉。 (3)回答“向谁调查?” 2.2.4 统计调查方案 调查对象和调查单位 例:例:人口普查的对象是在中华人民共和国境内居住的自然人。 例:例:要了解全国商业企业的生产经
26、营情况,则: 调查对象全国所有商业企业 调查单位每一个商业企业 报告单位每一个商业企业 例:例:要了解全国工业企业设备利用情况,则: 调查对象工业企业的所有设备 调查单位每一台设备 报告单位每一个企业 2.2.4 统计调查方案 调查项目和调查表 (1)调查项目:调查的具体内容。 (2)调查表:表现调查项目的表格或问卷。 (3)回答“调查什么?” 2.2.4 统计调查方案 调查项目和调查表 例例: : 人口普查: 第一次(1953.7.1零时):6项(本户地址、姓名、性别、年龄、民族、与 户主关系) 第二次(1964.7.1零时):9项(新增本人成分、文化程度、职业) 第三次(1982.7.1零
27、时):19项(新增本户人数、本户出生人数、本户死亡 人数等) 第四次(1990.7.1零时):21项(新增五年前常住地状况、迁来本地原因) 第五次(2000.11.1零时) :短表:9项。长表:26项。(增加生育、婚姻、 学业、职业等项目) 第六次(2010.11.1零时):长表共有45个项目,按户填报的有17项,按人填 报的有28项,反映了人口的迁移流动、身体健康 状况、就业状况、妇女生育状况和住房情况等; 短表共有18个项目,按户填报的有6项,按人填 报的有12项,项目内容反映了人口基本状况、受 教育程度和户的基本情况等。 2.2.4 统计调查方案 调查时间和调查期限 (1)调查时间是指调
28、查资料所属的时间。 例如:例如:第六次人口普查的标准时点是2010年11月1日零时。 (2)调查期限是指进行调查工作的起止时间,包括收集资料 和报送资料整个工作所需的时间。 例如:例如:第六次人口普查的调查期限是2010年11月1日到11月10日共10天。 2.2.4 统计调查方案 调查的组织和实施 (1)调查工作的领导机构和办事机构。 (2)调查人员的组织和业务培训。 (3)调查经费的预算和开支方法。 (4)工作进度安排。 (5)调查资料的报送方法。 (6)公布调查结果的时间等。 2.2.4 统计调查方案 调查的组织和实施 例:例: 国务院决定成立第六次全国人口普查领导小组,负责人口普查的组
29、织和实 施。普查领导小组办公室设在统计局,具体负责人口普查的日常组织和协 调。 第六次全国人口普查所需经费,由中央和地方各级人民政府共同负担,并 列入相应年度的财政预算,按时拨付、确保到位。 领导小组: 组长:李克强(现任中共中央政治局常委,国务院总理、党组书记 ) 副组长:4人(国务院副秘书长,统计局、公安部、人口计生委等部门相关 人员构成) 成员:23人(国务院各职能部相关人员构成)。 2.2.4 统计调查方案 随堂练习 1.要研究在校大学生生活时间的分配状况,宜采用哪些 调查方法?如何确保调研结果的质量?请简要说明理 由。 2.3 统计数据的整理 2.3.1 统计整理的内容与程序 2.3
30、.2 统计分组 2.3.3 频数分布 统计整理,就是根据统计研究的目的,对所搜集到的资料 进行科学的加工,使之系统化,条理化的工作过程。 统计整理的含义 2.3.1 统计整理的内容与程序 (1)根据研究目的设计整理汇总方案。 (2)根据汇总方案,对各个调查项目的资料进行汇总,通过汇 总计算各项指标。 (3)通过统计表的形式,描述整理的结果。 统计整理的内容 2.3.1 统计整理的内容与程序 数据预处理数据预处理分组分组汇总汇总显示显示 数据预处理: 数据的审核 数据的筛选 数据的排序 统计整理的程序 2.3.1 统计整理的内容与程序 (1)数据的审核 发现数据中的错误 (2)数据的筛选 找出符
31、合条件的数据 (3)数据排序 发现数据的基本特征 升序和降序 数据预处理 统计整理的程序 2.3.1 统计整理的内容与程序 审核的内容: (1)完整性审核:检查应调查的单位或个体是否有遗漏; 所有的调查项目或指标是否填写齐全。 (2)准确性审核:检查数据是否真实反映客观实际情况,内 容是否符合实际;检查数据是否有错误, 计算是否正确等。 数据预处理 统计整理的程序 2.3.1 统计整理的内容与程序 审核数据准确性的方法: (1)逻辑检查: 从定性角度,审核数据是否符合逻辑,内容是否合 理,各项目或数字之间有无相互矛盾的现象;主要用于 对定类数据和定序数据的审核。 (2)计算检查: 检查调查表中
32、的各项数据在计算结果和计算方法上 有无错误;主要用于对定距和定比数据的审核。 数据预处理 统计整理的程序 2.3.1 统计整理的内容与程序 二手数据还需: (1)适用性审核:弄清楚数据的来源、数据的口径以及有关 的背景;材料确定这些数据是否符合自己 分析研究的需要。 (2)时效性审核:应尽可能使用最新的统计数据;确认是否 必要做进一步的加工整理。 数据预处理 统计整理的程序 2.3.1 统计整理的内容与程序 数据的筛选: (1)对审核过程中发现的错误应尽可能予以纠正。 (2)当发现数据中的错误不能予以纠正,或者有些数据不符合调查的要 求而又无法弥补时,需要对数据进行筛选。 (3)数据筛选的内容
33、包括:将某些不符合要求的数据或有明显错误的数 据予以剔除;将符合某种特定条件的数据筛 选出来,而不符合特定条件的数据予以剔 出。 数据预处理 统计整理的程序 2.3.1 统计整理的内容与程序 数据的排序: (1)按一定顺序将数据排列,以发现一些明显的特征或趋势, 找到解决问题的线索。 (2)排序有助于对数据检查纠错,以及为重新归类或分组等 提供依据。 (3)在某些场合,排序本身就是分析的目的之一。 (4)排序可借助于计算机完成。 数据预处理 统计整理的程序 2.3.1 统计整理的内容与程序 排序的方法: (1)定类数据的排序: 字母型数据,排序有升序降序之分,但习惯上用升序。 汉字型数据,可按
34、汉字的首位拼音字母排列,也可按 笔画排序,其中也有笔画多少的升序降序之分。 (2)定距和定比数据的排序 : 设一组数据为X1,X2,Xn, 递增排序后可表示为:X1X2X2Xn 数据预处理 统计整理的程序 2.3.1 统计整理的内容与程序 统计分组及其类型 2.3.2 统计分组 统计分组就是根据统计研究的需要,将统计总体按照一定 的标志区分为若干组成部分的一种统计方法。 1. 统计分组的含义 (1)划分现象的类型:以便揭示不同社会经济现象的质的差异。 (2)反映现象的内部结构:从数量上反映总体的内部结构是统计研究 的重要任务。社会现象包含大量的单位, 它们在性质上不尽相同,而且在各种类型 总体
35、中的比例不同,因而所处的地位和对 总体的影响程度也不同,不同的类型分布 决定了不同的总体。通过分组,可以计算 总体内部各组成部分占总体的比例,分析 总体各部分的性质、结构和比例关系。 (3)分析现象间的依存关系:不仅可以帮助我们了解这些依存关系中 的影响因素与结果因素之间的变动规律, 还可进一步从数量上描述依存关系的密 切程度。 统计分组及其类型 2.3.2 统计分组 2. 统计分组的作用 (1)按统计分组的作用和目的划分为类型分组、结构分 组和分析分组。 统计分组及其类型 2.3.2 统计分组 3. 统计分组的类型 (2)按统计分组标志的多少及其排列形式划分分为简单分组、复合分 组和分组体系
36、。 简单分组:对总体只按一个标志进行分组。 复合分组:对总体按两个或两个以上的标志进行的层叠分组。 分组体系:采用一系列相互联系、相互补充的并列标志对被研究 对象总体进行的分组而结合成的体系。 统计分组及其类型 2.3.2 统计分组 3. 统计分组的类型 (3)按分组标志的性质划分为品质分组和数量分组。 统计分组及其类型 2.3.2 统计分组 3. 统计分组的类型 品质分组的方法:分类整理 数量分组的方法:分组整理 各组数量界限的确定必须能反映事物质的差别,并且 分组的形式与相应的组距、组限应符合现象总体的数量特 征。 单项式分组就是用一个变量值作为一组。一般适用于离散变量并且 变量值的变动范
37、围不大的场合。 组距式分组就是按变量值的一定范围对现象总体进行的分组。适用 于连续变量或者变动范围较大的离散变量的分组。 统计分组方法 2.3.2 统计分组 频数分布的概念与种类 2.3.3 频数分布 在统计分组的基础上,将总体的所有单位按组进行归类整理汇总, 并按一定顺序排列,形成总体中各单位在各组间的分布,称为频数分布 或次数分布。所得的分布数列是统计整理的一种重要形式,也是进行统 计描述和统计分析的基础。它可以反映总体的结构状况和分布特征,并 且可以分析研究总体中某一标志的平均水平及其变动规律。 分布数列由两个要素构成: (1)总体按某标志所分的组。 (2)各组所出现的单位数,即频数,亦
38、称次数。 频数分布的概念与种类 2.3.3 频数分布 品质分组形成品质分布数列,亦称品质数列,主要用于 研究总体构成情况。 表 某城市居民关注广告类型的频数分布 广告类型人数比例频率(%) 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告 112 51 9 16 10 2 0.560 0.255 0.045 0.080 0.050 0.010 56.0 25.5 4.5 8.0 5.0 1.0 合计2001100 频数分布的概念与类型 2.3.3 频数分布 数量分组形成变量分布数列,亦称变量数列,主要用于 反映不同变量值在各组的分布情况。变量,一般用x表示; 频数(次数)用f
39、表示。 变量数列的编制 2.3.3 频数分布 概念:简称单项数列,是由单项式分组形成的变量数列, 每个变量值是一个组,顺序排列。 特点: 将一个变量值作为一组; 适合于离散变量; 适合于变量值较少的情况 1. 单项式变量数列 变量数列的编制 2.3.3 频数分布 概念:是由组距式分组形成的变量数列,简称组距数列。 每个组的变量区间每个组的变量区间 2. 组距式变量数列 特点: 将变量值的一个区间作为一组。 适合于连续变量。 适合于变量值较多的情况。 必须遵循“不重不漏”的原则。 可采用等距分组,也可采用不等距分组。 变量数列的编制 2.3.3 频数分布 2. 组距式变量数列 组距数列与单项数列
40、的编制不同,它要涉及组距大小、组 数多少及表示方法等问题。 确 定 组 数 组距式变量数列的 编制步骤 确 定 组 距 计 算 频 数 编 制 表 格 变量数列的编制 2.3.3 频数分布 2. 组距式变量数列 (1)组距与组数 组距:是各组上下限之间的距离,即:组距=上限-下限。 组限:相邻两组的界限。 组数:是指将某个变量数列划分为多少组。 美国学者H.A.Sturges于1926年提出的经验公式 式中,n为组数,N为总体单位数,d为组距,R为全距,即最大 变量值xmax与最小变量值xmin之差 变量数列的编制 2.3.3 频数分布 2. 组距式变量数列 (2)类型: 等距数列与不等距数列
41、 各组组距都相等各组组距都相等 各组组距不完全相等各组组距不完全相等 变量数列的编制 2.3.3 频数分布 2. 组距式变量数列 (2)类型:间断组距数列和连续组距数列 各组组限不相连各组组限不相连 各组组限相连各组组限相连 (或相重叠)(或相重叠) 上限不在内上限不在内 变量数列的编制 2.3.3 频数分布 2. 组距式变量数列 离散变量既可以采用间断组距分组,也可采用连续 组距分组,形成间断组距数列和连续组距数列。 连续变量,只能进行连续组距分组,形成连续组距 数列。 (2)类型:间断组距数列和连续组距数列 变量数列的编制 2.3.3 频数分布 2. 组距式变量数列 各组上限与下限的中点数
42、值,用来反映各组实际变量值的一般水 平。 组中值与各组的实际平均水平仍有一定的差距,它只是各组实际平均 值的近似值。 (2)组中值 变量数列的编制 2.3.3 频数分布 2. 组距式变量数列 变量数列的编制 2.3.3 频数分布 例例2-12-1:频数分布表的编制频数分布表的编制 变量数列的编制 2.3.3 频数分布 例例2-12-1:频数分布表的编制频数分布表的编制 变量数列的编制 2.3.3 频数分布 例例2-12-1:频数分布表的编制频数分布表的编制 变量数列的编制 2.3.3 频数分布 例例2-12-1:频数分布表的编制频数分布表的编制 变量数列的编制 2.3.3 频数分布 例例2-1
43、2-1:频数分布表的编制频数分布表的编制 变量数列的编制 2.3.3 频数分布 例例2-12-1:频数分布表的编制频数分布表的编制 频数分布的类型 2.3.3 频数分布 中间多中间多 两头少两头少 对称分布对称分布 非对称分布非对称分布 一头大一头大 一头小一头小 两头多两头多 中间少中间少 累计频数与累计频率 2.3.3 频数分布 各组上限以下总各组上限以下总 共包含的单位数共包含的单位数 各组下限以上总各组下限以上总 共包含的单位数共包含的单位数 随堂练习 1.如何利用洛伦茨曲线对社会财富的分配的公平与否进 行研究? 随堂练习 洛伦茨曲线由来: 洛伦兹曲线(Lorenz curve),也译
44、为“劳伦兹曲线”。就是,在一个总体 (国家、地区)内,以“最贫穷的人口计算起一直到最富有人口”的人口百分比 对应各个人口百分比的收入百分比的点组成的曲线。为了研究国民收入在国民之 间的分配问题,美国统计学家(或说奥地利统计学家)M.O.洛伦兹(Max Otto Lorenz,1903- )1907年(或说1905年)提出了著名的洛伦兹曲线。 洛伦兹曲线用以比较和分析一个国家在不同时代或者不同国家在同一时代的 财富不平等,该曲线作为一个总结收入和财富分配信息的便利的图形方法得到广 泛应用。通过洛伦兹曲线,可以直观地看到一个国家收入分配平等或不平等的状 况。 随堂练习 洛伦茨曲线简介: 矩形的高衡
45、量社会财富的百分比,将之分为五等份,每一等 分为20的社会总财富。 在矩形的长上,将100的家庭从最贫者到最富者自左向右排 列,也分为5等分,第一个等份代表收入最低的20的家庭。 在这个矩形中,将每一等分的家庭所有拥有的财富的百分比 累计起来,并将相应的点画在图中,便得到了一条曲线就是 洛伦兹曲线。 整个的洛伦兹曲线是一个正方形,正方形的底边即横轴代表 收入获得者在总人口中的百分比,正方形的左边即纵轴显示 的是各个百分比人口所获得的收入的百分比。 从坐标原点到正方形相应另一个顶点的对角线为均等线,即 收入分配绝对平等线,这一般是不存在的。实际收入分配曲 线即洛伦兹曲线都在均等线的右下方。 随堂
46、练习 洛伦茨曲线意义: 洛伦兹曲线的弯曲程度有重要意义。 一般来讲,它反映了收入分配的不平等程度。 弯曲程度越大,收入分配越不平等,反之亦 然。特别是,如果所有收入都集中在一人手 中,而其余人口均一无所获时,收入分配达 到完全不平等,洛伦兹曲线成为折线OHL。 另一方面,若任一人口百分比均等于其收入 百分比,从而人口累计百分比等于收入累计 百分比,则收入分配是完全平等的,洛伦兹 曲线成为通过原点的45度线OL。 随堂练习 洛伦茨曲线意义: 一般来说,一个国家的收入分配, 既不是完全不平等,也不是完全平 等,而是介于两者之间。 相应的洛伦兹曲线,既不是折线OHL, 也不是45度线OL,而是像图中
47、这样 向横轴突出的弧线OL,尽管突出的 程度有所不同。 随堂练习 洛伦茨曲线意义: 将洛伦兹曲线与45度线之间的部分A叫 作“不平等面积”,当收入分配达到 完全不平等时,洛伦兹曲线成为折线 OHL,OHL与45度线之间的面积A+B叫作 “完全不平等面积”。 不平等面积与完全不平等面积之比, 成为基尼系数,是衡量一国贫富差距 的标准。吉尼系数G=A/(A+B)。显然, 吉尼系数不会大于1,也不会小于零。 2.4 统计数据的显示 2.4.1 统计表 2.4.2 统计图 2.4.3 利用Excel进行统计数据的显示 2.4.1 统计表 (1)从形式上看,统计表是由总标题,横行标题、纵栏标 题和指标数
48、值四部分组成。 (2)从内容上看,统计表是由主词和宾词两部分构成。主 词是统计表要说明的总体或总体分成的多个组,宾词 是说明主词的统计指标。 统计表的构成 主词 宾词 宾词 2.4.1 统计表 统计表的分类 2.4.1 统计表 统计表的设计 (1)统计表应设计成由纵横交叉线条组成的长方形表格,长与宽之间 保持适当的比例。 (2)线条的绘制。表的上下两端应以粗线绘制,表内纵横线以细线绘 制;表格的左右两端一般不划线,采用“开口式”。 (3)合计栏的设置。统计表各纵列须合计时,一般应将合计列在最后 一行;各横行若须合计时,可将合计列在最前一栏或最后一栏。 (4)栏数的编号。如果栏数较多,应当按顺序
49、编号,习惯上主词栏部 分分别编以“甲乙丙丁”等序号,宾词栏编以(1)(2)(3) 序号。 1. 表式 2.4.1 统计表 统计表的设计 (1)标题设计应简明扼要,简练而又准确地表述出统计资料的内容及 其所属的时间和空间范围。 (2)表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小 数点的位数应统一。当数字本身为0或因数字太小而忽略不计时, 可填写为“0”;当缺某项数字资料时,可用符号“”表示;不 应有数字时用符号“”表示。 (3)必须注明计量单位。当全表只有一种计量单位时,可以把它写在 表头的右上方。如果表中各栏的指标数值计量单位不同,可在横 行标题后添一列计量单位。 (4)应注明注解
50、与资料来源,必要时还应在表下加注解或说明 2. 内容 2.4.2 统计图 条形图 (1)条形图是用宽度相同的条形的高度或长短来表示数据变 动的图形。 (2)条形图有单式、复式等形式。 (3)在表示定类数据的分布时,是用条形图的高度来表示各 类别数据的频数或频率。 (4)绘制时,各类别可以放在纵轴,称为条形图,也可以放 在横轴,称为柱形图。 2.4.2 统计图 条形图 2.4.2 统计图 条形图 2.4.2 统计图 条形图 2.4.2 统计图 饼图 (1)也称圆形图,是用圆形及圆内扇形的面积来表示数值大小的图形。 (2)主要用于表示总体中各组成部分所占的比例,对于研究结构性问题 十分有用。 (3