统计学基础第三章课件.pptx

上传人(卖家):三亚风情 文档编号:3147249 上传时间:2022-07-22 格式:PPTX 页数:39 大小:366.95KB
下载 相关 举报
统计学基础第三章课件.pptx_第1页
第1页 / 共39页
统计学基础第三章课件.pptx_第2页
第2页 / 共39页
统计学基础第三章课件.pptx_第3页
第3页 / 共39页
统计学基础第三章课件.pptx_第4页
第4页 / 共39页
统计学基础第三章课件.pptx_第5页
第5页 / 共39页
点击查看更多>>
资源描述

1、第三章第三章 统计数据的整理和统计数据的整理和展示展示第一节第一节 统计数据的审核统计数据的审核 对于通过直接调查取得的原始数据,应主要从完整性和准确性两个方面去审核。对于通过其他渠道取得的第二手数据,除了对其完整性和准确性进行审核外,还应着重审核数据的适用性和时效性。第二节第二节 统计统计分组分组 一、统计分组的概念一、统计分组的概念 统计分组就是根据统计研究的需要,将统计总体按照一定的变量区分为若干个组成部分的一种统计方法。总体的这些组成部分称“组”。统计分组同时具有两个方面的含义:对总体而言是“分”,即将总体区分为性质相异的若干部分;对个体单位而言,是“合”,即将性质相同的个体单位组合起

2、来。二、统计分组的作用二、统计分组的作用 统计分组的作用可以归纳为三个方面:1.区分区分不同事物的性质不同事物的性质 2.反映反映事物的内部构成及其变化规律事物的内部构成及其变化规律 3.揭示揭示现象之间的数量依存关系现象之间的数量依存关系 三、统计分组的原则与分组标志三、统计分组的原则与分组标志(一)统计分组的原则(一)统计分组的原则 统计分组有两点原则:一是要符合周延性,即不遗漏,每一个体单位都有所归属。二是要符合互斥性,即不重复,每一个体单位只能归属于某一组而不能归属于另一组。(二)统计分组的标志(二)统计分组的标志 分组标志就是将总体分为各个性质不同的标准或根据。根据分组标志的特征不同

3、,总体可按品质标志分组,也可按数量标志分组。1按品质标志分组 按品质标志分组就是以品质标志作为分组标志,并在品质标志的变异范围内划分各组界限,将总体分为若干组。按品质标志分组,有些很容易确定分组的组数,并能将所有个体既不遗漏又不重复地分别归入各组,有些就不容易确定。2按数量标志分组 按数量标志分组就是以数量标志作为分组标志,并在数量标志的变异范围内划分各组界限,将总体分为若干组。按数量标志分组,不仅体现出各组现象的数量差别,而且要通过各组的数量变化区分现象的不同性质。因此,各组的数量界限如何确定也是比较复杂的。例如,四、简单分组和复合四、简单分组和复合分组分组(一)简单(一)简单分组分组 对总

4、体只按一个标志分组称为简单分组。(二)复合(二)复合分组分组 对总体按两个或两个以上标志层叠起来进行 分组称为复合分组。复合分组比简单分组能说明更多的问题,可以对总体作比较全面深入的分析。第三节第三节 次数次数分布分布 一、次数分布的概念一、次数分布的概念 将组中的所有个体单位按组归类整理,形成总体中各个个体单位在各组间的分布,就称为次数分布次数分布。分布在各组的个体单位数称为次数次数,又称频数。各组次数与总次数之比称为比率比率,又称频率。将各组组别与次数依次编排而成的数列就叫做次数分布数列,简称分布数列分布数列。有时也可把比率列入分布数列中。分布数列又称分配数列或次数分布。二、次数分布的种类

5、二、次数分布的种类 品质次数分布品质次数分布就是按品质标志分组所形成的次数分布。它有两个构成要素:一是以品质标志表现为各组的名称,二是各组的次数。例如表3-3就是一个品质次数分布。性 别人 数(万人)占总人口比重(%)男女700796670351.248.8合 计136782100.0表表3-3 20143-3 2014年我国人口按性别分组的情况年我国人口按性别分组的情况 数量次数分布数量次数分布就是按数量标志分组所形成的次数分布。它也有两个构成要素:一是以数量标志作为各组的名称,二是各组的单位数。例如表3-4。表表3-4 某班组学生年龄某班组学生年龄情况情况数量次数分布又分为单项次数分布和组

6、距次数分布。数量次数分布中的每个组只用一个标志值来表示就是单项次数分布单项次数分布。如果标志值的变动范围较小,项数不多,在这种情况下,就可以采用单项次数分布反映总体的分布状态。如表3-5就是单项次数分布。年龄人数(人)比 率(%)181920101525203050合 计50100.00 数量次数分布中的每个组用一定范围的标志值来表示就是组距次组距次数分布数分布。如果标志值的变动范围较大,项数较多,在这种情况下,就要采用组距次数分布反映总体的分布状态。如表3-5就是组距次数分布。表表3-5 某班级学生统计学成绩某班级学生统计学成绩成绩人数60以下60-7070-8080-9090 以上5 81

7、2106合 计41 三、数量次数分布的编制三、数量次数分布的编制方法方法 编制数量次数分布步骤有:编制序列和计数、确定组数和组距、确定组限和组中值。10682106979681108841051109811412892112111122104111103911099110710810710411297110861258510510910510396124125931131151061011061028986119例如,对某工厂某日50名工人生产零件个数情况进行调查,得到下列原始数据:1.编制编制序列和计数序列和计数 按一定顺序排列的数值称为序列,即把数值从小到大,或从大到小的顺序排列起来。编制

8、成单项次数分布表如表3-6所示。表表3-6 某企业日工人生产量分布表某企业日工人生产量分布表生产量 人数/人生产量 人数/人生产量人数/人81828384858689919293961111111211297981011021031041051061071081092111223422211011111211311411511912212412512822211111121合 计-50 2.确定确定组数和组距组数和组距 组数组数是指对总体划分为几个组。组距组距是指分组条件下每组标志值的变化范围。对同一总体,组数的多少和组距的大小成反比。如果将表3-6重新分组,取组数为5,组距为10,就得到表3

9、-8的次数分布。通过这个次数分布就能够清晰地看到工人生产量的分布特征。表表3-7 工人日生产量分布表工人日生产量分布表日生产零件数人 数/人比 率(%)80-9090-100100-110110-120120-13079191051418382010合 计50100 在连续式组距情况下,计算组距的公式为:组距=上限-下限 在离散式组距情况下,计算组距的公式为:组距=本组上限-前组上限 在组距次数分布中,各组组距相同的次数分布称为等距次数分布。各组组距不同的次数分布称为异距次数分布。等距次数分布一般在现象性质差异变动比较均衡条件下使用。在等距的情况下,确定组数、组距可参考下面的公式:组数 全距/

10、组距 组距全距/组数在表3-6的资料中,全距为47(128-81),假定组距为10,则组数47/104.7,取整数分为5组。表3-7就是等距次数分布。表表3-7 工人日生产量分布表工人日生产量分布表日生产零件数人 数/人比 率(%)80-9090-100100-110110-120120-13079191051418382010合 计50100 异距次数分布异距次数分布一般在现象性质差异变动非均衡的条件下使用。它也有两个优点:一是能准确地描述偏态分布。二是能将性质相同的总体个体单位归为一组。例如,某地区按农民平均收入分组,绝大多数农民的平均收入在1000元以下,而少数农民竟达10000元以上。

11、很明显,不能一律用1000元为组距,否则将使绝大多数的农民都分布在第一组内,从而使现象之间的性质差异不能反映出来。同时也不能用50元为组距,因为这样组数太多,还会出现一些空设的组。所以,这种情况就必须采用异距分组。在总体单位密集的地方采用较小组距,而在总体单位稀少的地方采用较大组距。3确定组限和组中值确定组限和组中值 组限就是各组间的数量界限。一般情况下,每组有两个组限:下限和上限。如表3-7中,第一组8090,80为下限,90为上限。对于连续变量来说,由于变量的数值是连续不断的,相邻两值之间可取无限数值,因此,相邻组的组限必须重合。如表3-7按工人日产量分组,第一组的上限与第二组的下限相同,

12、均为90。按习惯规定,各组包括下限数值,但不包括上限数值,如上例,若日生产零件数为90个的工人,应归入第二组,而不归入第一组。这种规定,统计中叫做“上限不在内”原则。这样,既保证了各个个体单位不被遗漏,又保证了各个个体单位不被重复。日生产零件数人 数/人比 率(%)80-9090-100100-110110-120120-13079191051418382010合 计50100 对于离散变量来说,变量的数值只能取整数,因此,相邻组的组限一般要间断。如表3-8中“100199”一组的上限199和“200299”一组的下限200并不需要重合,只需互相衔接就行了,因为在199和200间不会出现小数。

13、有时,为了方便起见,可以把相邻组的组限重合,但必须遵循“上限不在内”原则。表表3-8 按工人人数划分的工业企业分布情况按工人人数划分的工业企业分布情况工 人 数(人)工 业 企 业 数(个)100以下100-199200-299300-399400以上 8012060205合 计285 组距次数分布掩盖了分布在各组内单位的实际变量值。为了反映分布在各组中个体单位变量值的一般水平,往往用组中值作为各组变量值的代表值。组中值是上限与下限之间的中点数值。计算公式为:组中值 用组中值来代表组内变量值的一般水平有一个假定的前提:各个个体单位的标志值在本组内呈均匀分布或在组中值两侧呈对称分布。2下限上限

14、根据表3-7和表3-8计算各组组距和组中值,如表3-9和3-10所示。表表3-9 某企业工人日生产量分布某企业工人日生产量分布(单位:件)表表 3-10 按工人人数分组按工人人数分组(单位:人)在表3-9中,各组都有一个下限和上限,形成一个封闭的区间,这样的组叫做“闭口闭口组组”。表3-10中第一组100人以下和最末组400人以上。这样的组叫“开口组开口组”。对“开口组”的组距和组中值的确定,一般是以邻近一组的组距作为开口组的组距,然后再按组中值的公式计算,或者按下面的公式计算:缺下限的开口组组中值本组上限-邻组组距/2 缺上限的开口组组中值本组下限邻组组距/2 日生产量组距 组中值80-90

15、90-100100-110110-120120-13010101010108595105115125 工人数/人组距组中值100以下100-199200-299300-399400以上 100100100100100 50150250350450 四、累计次数分布表四、累计次数分布表 在表3-11中,我们可能很想知道有多少(或比率)工人的装配零件数低于(或高于)100件。为了回答这一问题,就要编制累计次数分布表。表表3-11 工人生产量累计次工人生产量累计次数表数表 计算累计次数的方法有两种:一种叫向上累计,一种叫向下累计。向上累计向上累计是从变量值最小一组的次数起逐项累计,每组累计次数表示小

16、于该组上限值的次数共有多少。向下累计向下累计是从变量值最大一组累计的次数共有多少。生产量 次 数向 上 累 计次数向 下 累 计次数人数/人比率(%)人数/人比率(%)人数/人比率(%)80-9090-100100-110110-120120-130791910514183820107163545501432709010050433415510086683010合计50100-第四节第四节 数据的图表数据的图表展示展示 一、统计图 统计图是以点、线、面、形状等方法描述、显示统计数据的形式,是统计数据直观的表现形式。1、直方图 在等距分组的条件下,图上横轴表示变量,纵轴(直方形的高度)表示各组次

17、数,其宽度与各组组距相适应,这样绘制的各直方形的面积可以用来表示各组次数的分布状态,称为次数直方图。根据表3-7的资料,利用 Excel绘制次数直方图,如图3-1所示。装配零件数图3-1 工人日生产量次数直方图 2折线图 折线图和次数直方图一样,也可以反映总体的次数分布情况。以横轴表示变量,变量值用组中值表示。纵轴表示次数,在每组组中值上方按该组的次数描一个点,然后用直线连接起来,即成为次数折线图。根据表3-7的资料,利用Excel绘制次数折线图如图3-2。3累计次数分布图 向上累计次数曲线以各组上限为横坐标,向下累计次数曲线以各组下限为横坐标,其纵坐标都是累计次数。根据表3-11的资料,用E

18、xcel绘制累计次数分布图如图3-3所示。图图3-3 生产量累计次数分布图生产量累计次数分布图 累计次数%4洛伦茨曲线图 美国洛伦茨博士(Dr.M.O.lorenz)把累计频数(或频率)分布曲线用于研究社会财富、土地和工资收入的分配是否公平。这种累次曲线又称为洛伦茨曲线图。绘制方法如下:将分配对象和接受分配者的数量化成结构相对数并进行向上累计。纵轴和横轴均为比例尺度,纵轴自下而上,用以测定分配的对象横轴从左向右用以测定接受分配者 根据计算所得的分配对象和接受分配者的累计百分数,在图中标出相应的绘示点,连接各点使之平滑,所得曲线即所要求的洛伦洛伦茨曲线茨曲线。表表3-12 某国某年家庭家收入所得

19、的分配某国某年家庭家收入所得的分配情况情况按收入的水平分组人口收入累计收入的(%)人口数(万)结构(%)累计(%)月收入额(亿美元)结构(%)实际情况绝对平等绝对不平等12345678最低128.512.8512.851.575512.850中下等348.034.847.654.08131847.650中等466.946.6994.3416.33527094.340较高45.64.5698.97.54249498.90最高11.01.11001.886100100100合计1000.0100-31.4100-先将人口数及其收入额第(1)(4)列化为结构相对数第(2)(5)列,再求出其累计的百分

20、比第(3)(6)列,然后在制好的比率图上依累计百分比标出点,平滑地连接各点即可,如图所示。5饼形图 饼形图用以表示把总体分为各个组成部分,各组成部分占全体的百分数用圆内的各个扇形的中心角度占360度的相应百分数来表示。根据表3-1绘制的饼形图如图3-5。表表3-1 2014年我国年我国产业结构产业结构图图3-5 我国我国2014 年三次产业的构成年三次产业的构成产业增 加 值(亿元)比重%第一产业第二产业第三产业583322713923067399.242.648.2合 计636463100.0 6环形图 环形图与饼形图类似,但又有区别。环形图中间有一个“空洞”,总体中的每一个数据用环中的一段

21、表示。可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环。因此环形图可显示各部分所占的相应比例,从而有利于比例研究。在一项有关住房问题的研究中,研究人员在甲、乙两个城市各抽样调查300户家庭,其中的一个问题是:“您对您家庭目前的住房状况是否满意?”(a)非常不满意;(b)不满意;(c)一般;(d)满意;(e)非常满意。调查结果经整理如表3-13和表3-14所示。表表3-13 甲城市家庭对住房状况的甲城市家庭对住房状况的评价表评价表 3-14 乙城市家庭对住房状况的评价乙城市家庭对住房状况的评价回答类别户 数(户)百 分 比(%)非常不满意不满意一般满意非常满意241089345308

22、36311510合 计300100回答类别 户 数(户)百 分 比(%)非常不满意不满意一般满意非常满意 21997864387.033.026.021.312.7合 计300100.0图图3-6 甲、甲、乙两城市家乙两城市家庭对住房状庭对住房状况的评价况的评价 7雷达图 雷达图是显示多个变量的常用图示方法。设有n组样本S1,S2,Sn,每个样本测得P个变量X1,X2,Xp。要绘制这P个变量的雷达图,其具体做法是:先做一个圆,然后将圆P等分,得到P个点,令这P个点分别对应P个变量,再将这P个点与圆心连线,得到P个辐射状的半径,这P个半径分别作为P个变量的坐标轴,每个变量值的大小由半径上的点到圆

23、心的距离表示,再做同一样本的值在P个坐标上的点连线。这样,n个样本形成的n个多边形就是一个雷达图。例如,2014年某地城乡居民平均每人各项生活消费支出数据见表3-15。试绘制雷达图。表表3-15 2014年某地城乡居民年某地城乡居民家庭家庭人均人均生活消费支出生活消费支出 单位单位:元:元类 别城 镇 居 民农 村 居 民食品衣着设备用品及服务医疗保健交通和通讯娱乐文教服务居住杂项商品和服务 1 958.31 500.46 439.29 318.07 395.01 627.82 500.49 258.54 820.52 95.95 75.45 87.57 93.13 186.72 258.34

24、 52.46合 计 4 997.991 670.14图图3-7 2014年某地城乡居民家庭平均每人生活消费支出年某地城乡居民家庭平均每人生活消费支出 二、二、统计表统计表 统计表是以横纵交叉的线条所绘制的表格来表现统计资料的一种形式。统计表是表现统计数据最常用的形式。它的主要优点一是能有条理、有系统的排列统计数据,使人在阅读时一目了然。二是能合理地、科学地组织统计数据,使人在阅读时便于对照比较。(一)、统计表的构成(一)、统计表的构成 1.统计表的形式构成统计表的形式构成 统计表是由总标题、横行标题、纵栏标题、指标数值四部分所构成的,如表3-16。表表3-16 2014年某市各类工业企业的总产

25、值年某市各类工业企业的总产值总标题按经济类型分组 工业企业数(个)总产值(亿元)(甲)(1)(2)国有企业 集体企业 中外合资 1 2361 8573513767 6 合 计3 128 210纵栏标题指标数值横行标题 2.统计表统计表的内容构成的内容构成 可以分为两个组成部分,一部分是统计表所要说明的总体,它可以是各个个体单位的名称、总体的各个组、或者是个体单位的全部,这一部分习惯上称为主词或主体栏。另一部分则是说明总体的统计指标,包括指标名称和指标数值,这一部分习惯上称为宾词或叙述栏。如表3-17。表表3-17 2014年某市工业生产构成年某市工业生产构成社会产品生产 产 值 绝对数/亿元

26、比重(%)生产资料生产 消费资料生产 37944045 48.451.6 合 计 7839 100.0主词主词 宾宾 词词(二)、统计表的设计(二)、统计表的设计 设计统计表必须遵循科学、实用、简练、美观的原则。1.统计表形式的设计统计表形式的设计(1)线条的绘制统计表都应设计成由纵横线条交叉组成的长方形表格,长宽之间应保持适当的比例。(2)栏号的书写统计表纵栏较多时,为便于阅读,可编栏号。习 2.统计表内容的设计统计表内容的设计(1)标题的书写统计表的总标题应当用简洁而又准确的文字来表述统计数据的内容,以及数据所属的空间和时间范围。(2)主词与宾词的位置统计表各主词之间或宾词之间的次序,应当根据诸如时间的先后、数量的大小、空间的位置等自然顺序合理编排。(3).指标数值的书写数字应填写整齐、数位对准。(4)计量单位的书写 思考题 1.统计资料整理的作用是什么?主要内容有哪些?2.影响频数分布的主要要素有哪些?3.统计分组的作用是什么?如何选择分组标志?4.什么是统计表?有什么优点?5.什么叫组中值?为什么说组中值只是每组变量值的代表数值而不是平均数?

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(统计学基础第三章课件.pptx)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|