1、数值数据整理与图示AppliedApplied StatisticsStatistics1.数值数据整理数值数据整理2.数值数据图示数值数据图示数值数据的整理等距分组等距分组不等距分组不等距分组单值分组单值分组组距分组组距分组组距分组(关键步骤)1.确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按 Sturges 提出的经验公式来确定组数K2.确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即 组距(最大值-最小值)组数 3.确定各组组限组距分组(基本概念)1.下限(low limit):一个组
2、的最小值2.上限(upper limit):一个组的最大值3.组距(class width):上限与下限之差4.组中值(class midpoint):下限与上限之间的中点值下限值+上限值2组中值=组距分组(基本概念)只有当全部数据中的最大观察值和最小观察值与其他数据相差悬殊,为避免出现空白组(不包含有任何数据的组)或个别极端值被漏掉,第一组和最后一组可以采取“以下”及“以上”这样的开口组。开口组的情况下,一般以相邻组的组距作为其组距,使用下面的公式之一计算组中值:组中值=上限相邻组组距/2组中值=下限相邻组组距/2组距分组【例】为了解淘宝双十一购物节顾客消费的情况,阿里巴巴集团数据分析部门随
3、机抽取了100名顾客的消费额数据。编制频数分布表,分析顾客消费额的分布状况。组距分组730754801721864805718768828808735830798809894809801811812811830760853766756866865829794785868880815842778710838820791759745790815821824702722818836751812792724893859876727841783841776843829734782823762791806817810820812786803895792782764820815741815761817817
4、791758825829810821774806744808828785784800表 淘宝双十一购物节顾客消费额数据组距分组1.确定组数:根据 Sturges 提出的经验公式得组数K 为:2.确定各组的组距:组距(895-702)10=19.3 203.确定各组组限.lg.1 3 321 3 32 27 64810kn 组距分组(上、下组限重叠)消费额(元)顾客数(名)频率百分比/(%)700720 30.03 3720740 70.07 7740760 80.08 8760780 90.09 9780800150.1515800820260.2626820840170.1717840860
5、 60.06 6860880 50.05 5880900 40.04 4合计1001.00100表 淘宝双十一购物节顾客消费额的频数分布表组距分组(上、下组限间断)消费额(元)顾客数(名)频率百分比/(%)700719 30.03 3720739 70.07 7740759 80.08 8760769 90.09 9780799150.1515800819260.2626820839170.1717840859 60.06 6860879 50.05 5880899 40.04 4合计1001.00100表 淘宝双十一购物节顾客消费额的频数分布表组距分组(开口组)消费额(元)顾客数(名)频率百
6、分比/(%)700以下 30.03 3720740 70.07 7740760 80.08 8760780 90.09 9780800150.1515800820260.2626820840170.1717840860 60.06 6860880 50.05 5880以上 40.04 4合计1001.00100表 淘宝双十一购物节顾客消费额的频数分布表组距分组解 FREQUENCY函数的功能是计算数据在某个数值区间内的出现频数,然后返回一个数组。这里,FREQUENCY必须以数组公式的形式输入。语法结构为:FREQUENCY(data_array,bins_array)其中:data_arra
7、y指定的是待整理的数据所在区域;bins_array指定的是各分组的上限(此处是上、下组限间断表达方法的各分组上限)。组距分组解 “数据”“数据分析”“直方图”图 “直方图”对话框等距分组与不等距分组(1)等距分组时,各组频数的分布不受组距大小的影响,可直接根据绝对频数来观察频数分布的特征;(2)不等距分组时,各组频数的分布受组距大小不同的影响,各组绝对频数的多少不能反映频数分布的实际状况,需要用频数密度反映频数分布的实际状况。频数密度=频数组距数值数据的图示直方图图 淘宝双十一购物节顾客消费额的直方图数值数据的图示折线图图 淘宝双十一购物节顾客消费额的折线图数值数据的图示茎叶图图 淘宝双十一购物节顾客消费额的茎叶图小 结1.数值数据的整理数值数据的整理 FREQUENCY函数、数据透视表函数、数据透视表2.数值数据的图示数值数据的图示 直方图、折线图、茎叶图直方图、折线图、茎叶图思考练习 分析下淘宝双十一购物节顾客消费额的问题?