1、第3章 统计数据的图表展示3.1 品质数据的整理与显示3.2 数值数据的整理与显示3.3 统计表3.1 品质数据的整理与显示3.1.1、分类数据的整理与显示3.1.2、顺序数据整理与展示3.1.1分类数据的整理与显示3.1.1、分类数据的整理与显示1、柱形图60名学生的球类爱好序号 性别 项目 序号 性别 1 男 足球 21 男 2 男 足球 22 男 3 男 篮球 23 男 4 男 篮球 24 男 5 男 足球 25 男.分类汇总方法一:在EXCEL中,首先对数据按照项目排序后,运用“数据”“分类汇总”得到结果。方法二:在EXCEL中运用分类计数函数,COUNTIF()表3-2 运用COUN
2、TIF函数分类汇总结果项 目人数百分比足 球17 28.3%篮 球23.3%排 球1016.7%网 球1118.3%羽毛球1626.7%乒乓球23.3%其 他23.3%合 计60100.0%图3-3 60名大学生最喜爱的运动项目分布024681012141618足球篮球排球网球羽毛球乒乓球其他人数人数2、饼图29%3%17%18%27%3%3%足球篮球排球网球羽毛球乒乓球其他图3-4 60名大学生最喜爱的运动项目分布3、对比条形图 资金配置A投资者B投资者C投资者股票25.5 3575基金5.01542债券505030定期存款355225总计115.5152172表3-3 A、B、C三名投资者
3、的投资组合数据 (单位:万元)图3-5 A、B、C三名投资者投资组合01020304050607080股票基金债券定期存款C投资者B投资者A投资者4、帕累托图 例3.2 在某塑料器具生产过程中,器具经常会夹杂气泡,影响塑料器具的使用效果。经过记录分析一个月中生产线上的1632件次品,形成气泡的原因主要有(数据3-3):R1.原料含水分、溶剂或易挥发物 R2.料温高,加热时间长,塑料降聚分解 R3.注射压力小 R4.螺杆退回过早 R5.模具排气不良 R6.模温低 R7.注射速度太快 R8.模具型腔内有水分、油脂,或脱模剂不当表3-4 次品原因分类统计次品原因次品数占比(%)R357735.36%
4、R132720.04%R621713.30%R718511.34%R21217.41%R5986.00%R4865.27%R8211.29%合计1632100.00%图3-9 次品原因分布图0100200300400500600700R3R1R6R7R2R5R4R83.1.2顺序数据整理与展示 例3.3针对黄金周期间对不同城市旅游景点满意程度进行调查,选取A、B两个城市的500名游客调查数据,分析游客对于景区价格的看法,汇总数据(数据3-4)如下:对门票价格的评价人数向上累积频数向下累积频数百分比%向上累积百分比%向下累积百分比%很高959550019.019.0100较高1142094052
5、2.841.881.0适中11632529123.265.058.2较低9942417519.884.835.0很低765007615.210015.2合计500-100-表3-5 A城市游客对于门票价格的评价表3-6 B城市游客对于门票价格的评价对门票价格的评价人数向上累积频数向下累积频数百分比%向上累积百分比%向下累积百分比%很高16016050032.032.0100较高12028034024.056.068.0适中9737722019.475.444.0较低7345012314.690.024.6很低505005010.010010.0合计500-100-向下累计 向上累计 A城市游客
6、对于门票价格的评价如何比较两个城市游客对于门票价格评价的差异?19%23%23%20%15%32%24%19%15%10%很高较高适中较低很低3.2数值数据的整理与显示数值型变量组距分组等距分组异距分组单变量分组3.2.1单变量分组 例3-4:某车间共有工人18名,在某天加工零件中,观察每个工人生产次品数记录(数据3-5):1,1,0,0,0,0,0,3,1,1,1,0,0,2,0,2,1,1。如何对数据进行分组展示。表3-7 某车间18名工人某天生产的次品数分布次品数工人数百分比0844.44%1738.89%2211.11%315.56%合计18100.00%3.2.2组距分组 例3-5为
7、研究中学生的身体素质状况,在某市随机抽取150名中学生进行测量。150名学生的身高数据(数据3-6)。用EXCEL直方图工具进行分组 第一步,计算变量的全距,即R=最大-最小值=182-152=30。第二步,确定变量的组数,一般情形下取515组,也可根据经验公式 第三步,确定组距d=R/K 第四步,确定组限,从最小值开始,将最小值放入最低组2lglg1nK2lglg1nK第一步:选择直方图工具第二步:输入数据区域和接受区域第三步:输出表和图第四步:对表和图进行编辑组距分组中的几个概念下限:上限组中值=(上限+下限)/2频数频率异距分组的一个例子:某小区人口年龄结构分布年 龄人数比例06(儿童)
8、7054.43%717(少年)12057.58%1840(青年)709344.60%4165(中年)470229.56%66岁以上(老年)220013.83%合 计15905100.00%3.2.3箱线图试验数据和观察数据的正确运用 两种数据在分析得到结论时的差别是显而易见的。在试验中,试验环境是受到严格控制的,数据的产生一定是某一约束条件下的结果,往往通过控制条件变量观察结果变量的变化,一般来说,结果变量的变化除随机因素外可以主要解释为条件变量变化引起的,在自然科学研究中试验的方法应用非常普遍。而在社会经济研究中,结果变量的变化受多种不可控变量甚至是未知因素的影响,解释结果变量变化的原因是要相当慎重,避免错误的归结因果关系。