1、分布数列的概念分布数列是指在统计分组的基础上,将总体单位按类入组,并汇总各组内单位数,形成总体中单位数在各组间的分布。分布数列或称次数分布,或称为分配数列。分布数列或称_,_。将统计数据按其分组标志进行分组的过程,实际上就是度量分布形成的过程。将分布数列的概念在分布数列中,各组拥有的总体单位数称为改组的次数(或频数),与总体单位总数的比值称为频率。分布数列的两个组成要素:一是分成的各组,二是各组的次数。. . 例如,例如,某班某班5050名学生,调查其考分资料如下:名学生,调查其考分资料如下:77 65 83 56 68 70 99 65 73 72 88 66 74 63 77 65 83
2、56 68 70 99 65 73 72 88 66 74 63 71 84 62 52 80 78 84 79 81 64 58 82 76 62 71 84 62 52 80 78 84 79 81 64 58 82 76 62 73 75 89 79 61 65 54 92 86 73 68 51 69 64 73 75 89 79 61 65 54 92 86 73 68 51 69 64 78 63 76 68 72 77 81 7678 63 76 68 72 77 81 76. . 按考分分组按考分分组(分)(分)学生人数学生人数(人)(人) 60 60以下以下60 60 707
3、070 70 808080 80 909090 90 100100 5 5 15 15 18 18 10 10 2 2合合 计计 50 50表表3-13-1 见后面统计整理的步骤见后面统计整理的步骤 练习次数分布中的次数是指( )A划分各组的数量标志B分组的组数C分布在各组的单位数D标志变异个数分布数列的概念频率表明各组标志值对总体的相对作用程度,频率越小,改组标志值所起的作用越小,若频率越大,改组标志值所起的作用越大。多选在次数分布数列中,( )A总次数一定,频数和频率成反比B各组的频数之和等于100C各组频率大于零,频率之和等于一D频率越小,则该组的标志值所起的作用越小请思考:判断:频数越
4、小,则该组的标志值所起的作用越小分布数列的分类用品质标志进行分组所得到的分布数列,叫做品质分布数列,简称品质数列;用数量标志进行分组得到的分布数列,叫做变量分布数列,简称变量数列。品质分布数列举例 按性别分组按性别分组人数人数(人)(人) 频率频率()()男男 生生 女女 生生30 30 2020 60 60 40 40合合 计计5050100100变量分布数列举例居民家庭按子女数分组居民家庭按子女数分组(个)(个)户数户数 (户)(户)0 01 12 23 34 4 20 20 60 60150150 90 90 40 40合合 计计360360变量分布数列举例按考分分组按考分分组人数人数(
5、人)(人)频率频率()()505060606060707070708080808090909090100100 5 5151518181010 2 21010303036362020 4 4合合 计计5050100100变量分布数列举例职工按工资分组职工按工资分组人数人数(人)(人)600600800800800800120012001200120015001500606060603030 合合 计计150150. . 单项式变量分布数列单项式变量分布数列组距式变量分布数列组距式变量分布数列变量分布数列的种类变量分布数列变量分布数列. . (即一个组只有一个变量值)(即一个组只有一个变量值)单
6、项式分组单项式分组 单项式分组适用于:变量值变化范围不单项式分组适用于:变量值变化范围不大、不同变量值个数较少的大、不同变量值个数较少的离散变量。离散变量。居民家庭按子女数分组:居民家庭按子女数分组:0 0 1 1 2 2 3 3 (离散变量)(离散变量)例如:例如:见后面见后面组距式分组组距式分组 单项式变量分布数列每一组都是由单个的组值(整数或小数)表示,则称为单项式变量分布数列。居民家庭按子女数分居民家庭按子女数分组组(个)(个)户数户数 (户)(户)0 01 12 23 34 4 20 20 60 60150150 90 90 40 40合合 计计360360若是离散变量,其变量值不多
7、,变动范围不大,宜编制单项式变量分布数列组距式变量分布数列每一组都是由数域(区间)表示,则称为组距式变量分布数列。若是离散型变量,其变量值较多,变动范围较大,或是连续变量宜编制组距式变量分布数列. . 将相邻几个变量值并为一组(形成一个区间),即一将相邻几个变量值并为一组(形成一个区间),即一个组有一个变量值的变动范围。个组有一个变量值的变动范围。例如:例如: 企业按人数分组企业按人数分组 499 499及以下及以下 500 500 999999 1000 1000 29992999 3000 3000及以上及以上 工人按工资分组工人按工资分组 600 600 700700 700 700 8
8、00800 800 800 12001200 1200 1200 1500 1500 组距式分组适用于:变量值变化范围较大、不同变量值组距式分组适用于:变量值变化范围较大、不同变量值个数较多的个数较多的离散变量离散变量及及连续变量连续变量。(离散变量离散变量)(连续变量连续变量) 注意:注意:连续型变量的数值不能一一列举,故其只能采用连续型变量的数值不能一一列举,故其只能采用组距式分组。组距式分组。 见前面见前面单项式分组与组距式分组单项式分组与组距式分组 组距式分组(应组距式分组(应注意注意)组距式变量分布数列举例按考分分组按考分分组人数人数(人)(人)频率频率()()50506060606
9、0707070708080808090909090100100 5 5151518181010 2 21010303036362020 4 4合合 计计5050100100组距式变量分布数列:等距式变量分布数列、异距式变量分布数列等距式变量分布数列按考分分组按考分分组人数人数(人)(人)频率频率()()505060606060707070708080808090909090100100 5 5151518181010 2 21010303036362020 4 4合合 计计5050100100异距式变量分布数列职工按工资分组职工按工资分组人数人数(人)(人)600600800800800800
10、120012001200120015001500606060603030 合合 计计150150练习属于变量数列的有( )A单项式数列B品质数列C等距数列D异距数列练习属于变量数列的有( )A按大学生所学专业分配B按运动员年龄分配C按企业利润分配D按工人劳动生产率分配练习企业资产总额分组( )A只能使用单项式分组B只能使用组距式分组C可以使用单项式分组,也可以使用组距式分组D无法分组将某地区30个商店按零售额多少分组而编制的分配数列,其变量值是( )A零售额B商店数C各组零售额D各组的商店数分布数列一些相关基本概念1.组限组限组限是指每个组两端的变量值,其中,每个组最小值为下限,每个组最大值为
11、上限。确定组限时,最小组的下限应小于最小变量值,最大组的上限应大于最大变量值。 499 499及以下及以下 500 500 999999 1000 1000 29992999 3000 3000及以上及以上 600 600 700700 700 700 800800 800 800 12001200 1200 1200 1500 1500 . . 组限及划分方法组限及划分方法工人按工资分组:工人按工资分组:企业按人数分组:企业按人数分组:重叠组限重叠组限不重叠组限不重叠组限见后面组限的划分方法见后面组限的划分方法 组限的划分组限的划分(只适用于(只适用于离散变量离散变量) 500 500及以下
12、及以下 500 500 10001000 1000 1000 30003000 3000 3000及以上及以上 当当某单位的变量值某单位的变量值刚好等于刚好等于相邻两组的上下限时相邻两组的上下限时,一般把,一般把此值归到作为下限的那一组中,即遵循此值归到作为下限的那一组中,即遵循“上限不在内上限不在内” 原则。原则。练习练习 按连续变量分组,第一组按连续变量分组,第一组4555,第二组,第二组5565,第三组第三组6575,第四组,第四组75以上,则(以上,则( ) A、55在第一组在第一组 B、65在第二组在第二组 C、65在第三组在第三组 D、75在第三组在第三组C分布数列一些相关基本概念
13、2.闭口组闭口组是指各组上下限齐备的组3.开口组开口组是指首组或者末组上限或下限不齐全的组。若组距分组中,出现极端值,即最大变量值和最小变量值相差悬殊,为避免出现空白组,首组或末组用“ 以下”或者“ 以上”来表示. . 例如:例如: 企业按人数分组企业按人数分组 499 499及以下及以下 500 500 999999 1000 1000 29992999 3000 3000及以上及以上 工人按工资分组工人按工资分组 600 600 700700 700 700 800800 800 800 12001200 1200 1200 1500 1500 (离散变量离散变量)(连续变量连续变量)判断
14、下列是闭口组还是开口组判断下列是闭口组还是开口组. . 组距组距= =本组上限本组上限前组上限前组上限(通用公式)(通用公式)组距组距= =本组上限本组上限本组下限本组下限(重叠组限)(重叠组限)组距与组数组距与组数一一般是用般是用整数整数表示。表示。学生按考分分组(分)学生按考分分组(分) 50 50 6060 60 60 7070 70 70 8080 80 80 9090 90 90 100100分布数列一些相关基本概念练习某小区居民人均月收入最高为5500元,最低为2500元,据此分为6组,形成等距数列,其组距应为( )A 500 B600 C550 D650分布数列一些相关基本概念全
15、距全距全距= =最大变量值最大变量值最小变量最小变量值值 分布数列一些相关基本概念组数组数是指某个变量数列划分成多少个组。组数的多少一般与变量的区间范围有关,组数应为整数。练习组数与组距的关系是( )A组数越多,组距越小B组数越多,组距越大C组数与组距无关D组数越少,组距越小. . 组中值组中值指各组上限和下限之间的中点数值。指各组上限和下限之间的中点数值。2 2下下限限上上限限组组中中值值(假定(假定组内标志值均匀分布组内标志值均匀分布)(考分(考分:52 54 57 58 5952 54 57 58 59) 按考分分组按考分分组 50 50 60 60 60 60 70 70 70 70
16、80 80 80 80 90 90 90 90 100 100 5555 7575 656585859595(考分:(考分:51 52 53 54 5551 52 53 54 55)不均匀分布不均匀分布5050 55 55 6060 均匀分布均匀分布 50 50 5555 6060 组中值组中值 闭口组组中值. . 开口组组中值开口组组中值 若若第一组出现第一组出现“以下以下”或或最末组出最末组出现现“以上以上”字样的组字样的组叫做叫做开口组开口组。首组组中值首组组中值 = =首组上限首组上限相邻组组距的一相邻组组距的一半半= =末组下限末组下限+ +相邻组组距的一半相邻组组距的一半末组组中值
17、末组组中值50 50 10102 2100 100 + 10 102 2其组中值的确定:其组中值的确定:. .首组:首组:末组:末组:按考分分组按考分分组 组中值组中值 50 50 60 55 60 55 60 60 70 65 70 65 70 70 80 75 80 75 80 80 90 85 90 85 90 90 100 95 100 955050以下以下100100以上以上4545105105练习在组距数列中,对各组的上限与下限进行简单平均,得到的是( )A组中值B组平均数C组距D组数练习某连续变量,其末组为开口组,下限为500,又知其邻组组中值为480,则其末组的组中值为( )A
18、490 B500 C510 D5201.1.对于连续变量划分组限时,相邻组的组限对于连续变量划分组限时,相邻组的组限必须必须_。2.2.次数分布数列是由次数分布数列是由_和和_两两个要素组成。个要素组成。. . 3.3.统计分组的关键在于统计分组的关键在于_。4.4.对总体只按一个标志进行分组称为对总体只按一个标志进行分组称为_分组,分组,对总体按两个或两个以上标志层叠起来进行分组对总体按两个或两个以上标志层叠起来进行分组称为称为_分组。分组。5.5.组距式分组根据其分组的组距是否相等可以分为组距式分组根据其分组的组距是否相等可以分为_ _ 分组和分组和_分组。分组。. . 单项式变量分布数列
19、的编制步骤1.将变量值按顺序排列起来2.每个变量为一组3.汇总出各组次数并编制整理表组距式变量分布数列的编制步骤1.将原始数据按顺序排列起来2.计算全距3.确定组限、组距和组数4.写出组限并据以归总计算各组次数。(不重复不遗漏)5.编制整理表变量数列的图形显示方法1.直方图直方图是指在横纵轴之间以直方条形来显示频数分布的图形。左纵轴表示频数,右纵轴表示频率,横轴表示变量值。判断直方图是指在横轴和纵轴之间以直方条形来显示频率的分布的图形( )变量数列的图形显示方法2.折线图折线图是指将直方图个条形顶端中点两两连接起来,所形成的的图形。变量数列的图形显示方法3.圆滑曲线图当各组组距无限缩小时,折线
20、图相邻条形的重点将无限接近。折线图的折现变圆滑,而成为曲线。常用的变量分布图形( )A直方图B折线图C面积图D圆滑曲线图三、统计汇总统计汇总是指在统计分组基础上,将总体各单位及其标志值归集到各组中,并计算出各组单位总量、总体单位总量和各组标志总量、总体标志总量,据以得到总体指标的工作过程。1.总体单位总量方面的汇总(次数汇总或频数汇总)是指汇总各组单位数和总体单位数,最终汇总结果就是总体单位总量,形成变量分布数列。例如:调查某中职学校财会班所有学生的基本情况,那么学生总数则是总体单位总量的汇总。2.绝对数标志值汇总指总体各单位的绝对数标志值在各组的加总,形成各组标志总量,最终汇总结果为总体标志
21、总量。例如:所有学生的成绩加总求和得到的总量就是绝对标志值的汇总。3.平均数和相对数标志值的汇总总体各单位的平均数和相对数标志值不能直接加总,因此,汇总这两类标志值的时必须先把他们的绝对数分子和分母分解出来,然后再把分子和分母进行加总,通过对加总结果的对比计算,来汇总总体各单位在各组的平均数和相对数的标志值。例如劳动生产率应该是总产出与对应对应的活劳动消耗之比,汇总结果也必须是这一含义。(二)统计汇总的技术和方法统计汇总按照组织方式或形式划分为:逐级汇总和集中汇总逐级汇总就是按照一定的统计管理体制,自上而下地对调查资料进行逐级汇总。逐级汇总的优点是:能满足各地区、各部门对统计资料的需要,同时便
22、于就地审核和订正原始资料缺点:费事较长,发生差错的概率大集中汇总就是将全部调查资料集中到组织统计调查的最高一级机关进行一次汇总优点:可以缩短汇总时间,减少汇总差错缺点:原始资料如有差错不能就地更正,整理结果有时不能及时满足各地区、各部门的需要统计汇总按照具体操作划分为:手工汇总和计算机汇总这里只介绍手工汇总的常用方法手工汇总使用算盘或小型计算器进行的汇总。1.划记法(又称“点线法”)通过画线等符号来计算各组单位数的一种手工汇总数据的方法。划记法优点:简单易行缺点是:只适合于汇总各组单位数与总体单位总量。步骤(1)先将调查资料按大小顺序排列(2)根据同限分组法的规定来逐个判断每个数据应属于哪一组
23、,便在该组名下划一下记号,最后依各组内记号的数目计算出各组次数。2.过录法(登记法)将调查资料过录到事先设计好的过录表上,计算出各组的单位数及标志值的合计数,从而得到汇总表的一种手工汇总数据的方法。优点:汇总内容适用广泛,既能汇总单位数,也能汇总标志值缺点:全部资料都要过录,工作量大,也容易产生过录差错3.折叠法折叠法是指在汇总大量格式相同的调查表时,将所有调查表或报表中需要汇总的项目和数值全部折叠,并一张一张地叠放在一起,然后直接汇总同一纵栏或同一横栏中的数字。4.卡片法将调查资料先摘录到特制的卡片上,一张卡片为一个调查单位,然后利用卡片进行分组汇总。优点:卡片无论进行多少次分组,各单位资料
24、只需要过录一次,检查也比较容易,一般用于大规模的专门调查和分组复杂的资料整理工作。5.分票法基层企业普遍使用的汇总方法,将采集来的原始记录,按照统计台账所设指标的要求进行分组和分类,然后将各组或各类原始记录加总计算,填写到统计台账 ,其实质就是过录法的简单运用。四、统计整理结果的显示(一)统计表统计是最常用、最规范的统计资料的表达方式。统计表包括一切编制和显示统计资料的表格,如调查表、整理表或汇总表、分析表。1.统计表的意义统计表是指统计资料经过准确的汇总后,得到了一系列说明总体特征的指标数值,将这些指标数值按一定的次序,用表格的形式显示出来。统计表不仅是表现统计资料的重要形式,而且是汇总和累
25、计统计资料的重要手段,还是统计分析的有力工具。2.统计表的结构(1)从形式上看,统计表由总标题、横行标题、纵栏标题、数字资料4部分构成(2)从内容上看,统计表包括主次和宾词两部分。主词是统计表所要说明的对象,通常列在统计表的左边宾词是说明总体特征的各种统计指标,包括指标名称和指标数值,通常列在统计表的右边。. . 按产业按产业分分 组组国内生产总值国内生产总值(亿元)(亿元) 比重比重 ()()第一产业第一产业第二产业第二产业第三产业第三产业1724717247617786177837669 37669 14.78 14.78 52.94 52.94 32.28 32.28合合 计计11669
26、4116694100.00100.0020032003年我国各产业国内生产总值及构成年我国各产业国内生产总值及构成总标题总标题指指标标数数值值纵栏纵栏标题标题横横行行标标题题见备注页见备注页 主词主词宾词宾词见后面统计表的种类(简单分组表)见后面统计表的种类(简单分组表) . . 统计统计表的表的结构结构外形结构外形结构总标题总标题横行标题横行标题纵栏标题纵栏标题指标数值指标数值内容结构内容结构主词主词宾词宾词见后面表见后面表3-93-9 统计表是一种由纵横交叉的直线所组成的、左右两边不封口的表格,一般应当包括( )A表名B行标题C列标题D表内的指标数值根据统计表在统计调查和统计资料整理分析中
27、的作用( )A简单分组表B调查表C整理表D分析表统计表的结构从内容上看,由( )构成A总标题B横行标题、总行标题C主词D宾词统计表是从内容上看包括主词和宾词两部分,前者是说明总体特征的统计指标,后者是统计表所要说明的总体( )3.统计表的分类(1)按照统计表的作用不同,统计表可以分为调查表、汇总表或整理表、分析表。调查表是在统计调查中登记、搜集原始资料的一种表格汇总表或整理表是用统计汇总或整理的一种表格分析表是用于对统计资料进行分析的一种表格按照统计表的主词是否分组和分组程度,即统计表可以分为简单表,分组表和复合表简单表是指统计总体未做任何分组的统计表,即统计表的主词仅罗列总体各单位的名称按时
28、间顺序排列起来的统计表第三章第三章 统计整理统计整理中国体育代表团在悉尼奥运会上获金牌的项目中国体育代表团在悉尼奥运会上获金牌的项目获金牌项目获金牌项目金牌数金牌数 占总数比例占总数比例跳水枚跳水枚 0.1786举重枚举重枚 0.1786乒乓球枚乒乓球枚 0.1429羽毛球枚羽毛球枚 0.1429体操枚体操枚 0.1071射击枚射击枚 0.1071柔道枚柔道枚 0.0714田径枚田径枚 0.0357跆拳道枚跆拳道枚 0.0357品质数列品质数列( (简单表简单表) )分组表,是指统计表的主词按某一个标志进行分组的统计表。分组的主词可以按品质标志分组,也可以按数量标志分组复合分组表,是指统计表的
29、主词按两个或者两个以上的标志进行分组的统计表。复合分组就是把几个分组标志结合在一起,可以揭示现象受多种因素影响的特征和规律性。 2012 2012年某地人口城乡及性别分布表年某地人口城乡及性别分布表(复合分组表)(复合分组表) 对统计总体按一个标志进行分组后形成的统计表叫( )A简单表B分组表C复合分组表D汇总表统计表的形式应该是( )A上下不封顶,左右不开口B上下要封顶,左右要开口C上下要封顶,左右不开口D上下不封顶,左右要开口(二)统计图统计图是利用几何图形或具体形象来表明现象数量关系的图形。将统计资料绘制成统计图,可使复杂的数字的通俗化、形象化、便于理解、记忆和比较。因此,统计图具有简明
30、具体、生动形象、通俗易懂、给人明确、深刻印象的特点下列关于统计表的说法中正确的是( )A统计表是最常用,最规范的统计资料表达形式B统计表由总标题、横行标题、纵栏标题和数字资料四个组成部分C分组表的主词只能按数量标志分组D统计表的左右两端习惯上不画线,采用不封闭的开口表示第五节 统计表第三章第三章 统计整理统计整理(二)统计表的编制规则 (1) (1) 统计表的各种标题要力求简明、确切和概括地反映出资统计表的各种标题要力求简明、确切和概括地反映出资料的主要内容,总标题还应标明资料所属的时间和地点。料的主要内容,总标题还应标明资料所属的时间和地点。 (2) (2) 表的内容要简明扼要,分组层次不宜
31、过多。表中主词各表的内容要简明扼要,分组层次不宜过多。表中主词各行和宾词各栏,一般应按先局部后整体的原则排列,即先列出行和宾词各栏,一般应按先局部后整体的原则排列,即先列出各个项目后列出总计;当不需要列出全部项目时,可先列出总各个项目后列出总计;当不需要列出全部项目时,可先列出总计,尔后列出一些必要的项目。计,尔后列出一些必要的项目。 (3) (3) 如果统计表的栏数较多,通常要加编号。主词栏和计如果统计表的栏数较多,通常要加编号。主词栏和计量单位等栏常用甲、乙等文字标明,其它各栏常用(量单位等栏常用甲、乙等文字标明,其它各栏常用(1 1)、)、(2 2)、()、(3 3)等数字编号。)等数字
32、编号。 第五节 统计表 (4) (4) 表中数字要填写整齐,位数对准。没有数字的格内表中数字要填写整齐,位数对准。没有数字的格内用用“”表示;缺某项数字或因小可略而不计时,用表示;缺某项数字或因小可略而不计时,用“”标明。统计表数字部分不就留下空白。标明。统计表数字部分不就留下空白。 (5) (5) 当表内指标数值的计量单位相同时,应将计量单位标当表内指标数值的计量单位相同时,应将计量单位标写在统计表的右上角;若计量单位不统一,但横行的计量单写在统计表的右上角;若计量单位不统一,但横行的计量单位相同,可单设计量单位栏,纵栏的计量单位相同可与纵栏位相同,可单设计量单位栏,纵栏的计量单位相同可与纵
33、栏标题写在一起。标题写在一起。 (6) (6) 统计表的表式一般是开口式的,即表的左右两端不统计表的表式一般是开口式的,即表的左右两端不画纵线,上下基线应用粗线。画纵线,上下基线应用粗线。 (7) (7) 对于某些需要特殊注明的统计资料,应在统计表的对于某些需要特殊注明的统计资料,应在统计表的下方加注说明。下方加注说明。 2.统计图的基本要素(1)图形(用图形来代表统计数值的大小)(2)坐标(3)图注(4)图目(5)标题3.常用的几种统计图(1)条形图以宽度相等、高低不同的条形来表示统计资料的图形(2)曲线图利用升降起伏的曲线来表示统计资料的图形(3)平面图以几何图形的面积大小或各组成面积大小来表示统计资料的图形(4)统计地图利用点、线、面或事物的形象,在地区上显示统计资料的图形(三)文字叙述文字叙述是以文章、字句的形式叙述整理结果。这种方法主要用于口头汇报或发言,目的是避免因现场组织语言出问题,在一般统计分析报告中,也多采用这种方法。