1、2023年2月3日星期五商务与经济统计商务与经济统计02本章主要内容n定性数据的概括n定量数据的概括n探索性数据分析n交叉分组列表和散点图定性数据的概括n频数分布n相对频数分布 n百分比频数分布n条形图n饼图频数分布n频数分布是用数据概括表的形式来列示若干个互不重叠的分组中每组数据值出现的次数(频数)。n建立频数分布表的目的是为了对原始数据进行更深入的了解。海珠保险公司海珠保险公司对保险代理人的服务质量进行评估,随机抽取20名顾客对其代理人进行评价。评价分为5个等级:极好,较好,一般,较差,极差较差一般 较好较好较好 较好较好较差 较差 一般 极差极差较好 极好较好 一般 较好一般较好 一般
2、n频数分布评价 频数极差 2较差 3一般 5较好 9极好 1Total 20海珠保险公司相对频数分布n某个数据组的相对频数是指该数据组中的数据个数占所有数据个数的比例。n相对频数分布是用表格的形式表示每组数据的相对频数。百分比频数分布n某个数据组的百分比频数是指该数据组中的数据个数占所有数据个数的百分比。n百分比频数分布是用表格的形式表示每组数据的百分比频数。海珠保险公司n相对频数分布和百分比频数分布 评价相对频数百分比频数极差 .1010较差 .1515一般 .2525较好 .4545极好 .05 5Total 1.00 100条形图n条形图是表示定性数据的一种图形方式n在横坐标上表示数据的
3、分组n在纵坐标上表示各组数据的频数,或相对频数,或百分比频数n在横坐标上,每组数据具有固定的相等宽度,用每组条形的纵坐标高度表示各组的频数,或相对频数,或百分比频数n表示各组数据的条形之间留下一定的空隙,表示每组数据是一个独立的分类nMicrosoft Excel 可以帮助画条形图海珠保险公司n条形图123456789极差较差 一般较好 极好Frequency评价评价饼 图n饼图是另一种常用的表示定性数据的图形方式nMicrosoft Excel 可以帮助画饼图。海珠保险公司n饼图 一般 25%较差 15%极差 10%较好 45%极好 5%服务质量评估定量数据的概括n频数分布n相对频数分布和百
4、分比频数分布n直方图(Histogram)n累积频数分布nOgive频数分布n对数据进行分组的指导原则最少分5组,最多分20组n确定组距的指导原则每组的组距相等近似组距=举例:海珠保险公司海珠保险公司的总经理希望了解上个月每份保单的金额分布情况。他随机抽查了50份保单,每份保单的金额如下(单位:百元):海珠保险公司n频数分布如果选择将数据分为六组:近似组距=(109-52)/6=9.5 10金额(百元)频数 50-59 2 60-69 13 70-79 16 80-89 7 90-99 7100-109 5 Total 50n相对频数分布和百分比频数分布 相对 百分比 金额(百元)频数 频数
5、50-59.04 4 60-69 .2626 70-79.3232 80-89 .1414 90-99.1414 100-109 .1010 Total 1.00 100海珠保险公司直方图n直方图是表述定量数据最常用的图形方法之一n横坐标上标示感兴趣的变量n每一组数据用一个长方形来表示,长方形在纵坐标上的高度表示该组数据的频数、相对频数或百分比频数,长方形的宽度表示组距n直方图与条形图不同的是,直方图的相邻两个长方形之间没有间隔。nMicrosoft Excel 可以帮助画直方图。海珠保险公司n直方图 金额金额(百元)(百元)24681012141618Frequency50 60 70 80
6、 90 100 110累积分布n累积频数分布 显示小于或者等于每组上限的数据的累积个数n累积相对频数分布-显示小于或者等于每组上限的数据的累积个数所占的比例n累积百分比频数分布-显示小于或者等于每组上限的数据的累积个数所占的百分比举例:海珠保险公司n累积频数 累积 累积 金额 累积 相对 百分比(百元)频数 频数 频数 59 2 .04 4 69 15 .30 30 79 31 .62 62 89 38 .76 76 99 45 .90 90 109 50 1.00 100 OgivenOgive 是一种表示累积分布的图形方法n横坐标表示变量的数据值n纵坐标可以表示:累积频数累积相对频数累积百
7、分比频数n每一组数据的累积频数/累积相对频数/累积百分比频数用一个点表示n然后用直线将这些点连接起来举例:海珠保险公司n累积百分比频数的Ogive图20406080100探索性数据分析n探索性数据分析是一种简单快捷地概括数据的方法n茎叶图(stem-and-leaf display)是一种常用的探索性数据分析方法。举例:海珠保险公司n茎叶图 5 2 7 6 2 2 2 2 5 6 7 8 8 8 9 9 9 7 1 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9 8 0 0 2 3 5 8 9 9 1 3 7 7 7 8 9 10 1 4 5 5 9举例:海珠保险公司n扩展的茎叶图
8、 5 2 5 7 6 2 2 2 2 6 5 6 7 8 8 8 9 9 9 7 1 1 2 2 3 4 4 7 5 5 5 6 7 8 9 9 9 8 0 0 2 3 8 5 8 9 9 1 3 9 7 7 7 8 9 10 1 4 10 5 5 9茎叶图n叶的单位在前面的例子中,茎叶图中叶的单位是1叶的单位也可以是 100,10,0.1等等如果没有特别说明叶的单位,就默认叶的单位为1举例:叶的单位=0.1如果有以下数据:8.611.79.49.110.211.08.8可以用茎叶图按如下方式表述这些数据:Leaf Unit=0.1 8 6 8 9 1 4 10 2 11 0 7举例:叶的单位
9、=10如果有以下数据:1806171719741791168219101838可以用茎叶图按如下方式表述这些数据:Leaf Unit=10 16 8 17 1 9 18 0 3 19 1 7交叉分组列表和散点图n到目前为止,我们只讨论了如何概括一个变量的数值的表格和图形方法n而通常,管理人员会对有助于理解两个变量之间的关系的图形和表格方法感兴趣n交叉分组列表(Crosstabulation)和散点图(scatter diagram)就是这样的描述两个变量之间关系的方法交叉分组列表n交叉分组列表是一种同时概括两个变量数据的表格方法n交叉分组列表适用于:一个变量是定性变量,另一个变量是定量变量两个
10、变量都是定性变量两个变量都是定量变量n在列表的左边第一列和上方第一行分别填入要考察的两个变量,如下面的例子所示:举例:海珠保险公司n交叉分组列表海珠保险公司的总经理想了解保险险种与保险价格两个变量之间的大致关系。如下表所示:价格 保险险种 范围 养老 医疗 意外 儿童保险 Total$1,000 12 14 16 3 45 Total 30 20 35 15 100 n从上表中可以看出:客户购买最多的是价格小于等于1000元的意外险(19人)客户购买最少的是价格高于1000元的儿童保险(3人)交叉分组列表:行和列百分比n可以将交叉分组列表中的数据转换成行百分比或列百分比,对数据进行更进一步的研
11、究n行百分比 价格 保险险种 范围 养老 医疗 意外 儿童保险 Total$1,000 26.67 31.11 35.56 6.67 100 n列百分比 价格 保险险种 范围 养老 医疗 意外 儿童保险$1,000 40.00 70.00 45.71 20.00 Total 100 100 100 100散点图n散点图是表示两个定量变量之间关系的图形方法n横坐标表示一个变量的值,纵坐标表示另一个变量的值n散点图的形状可以大致表示出两个变量之间的关系n正相关关系n负相关关系n没有明显的关系举例:海珠保险公司n散点图海珠保险公司市场部经理想了解针对某一险种所做的广告次数与所卖出的该险种的保险分数之
12、间的关系 x=广告次数 y=卖出的保险份数 1 14 3 24 2 18 1 17 3 27n散点图n前面的散点图显示在广告次数与卖出的保险份数之间存在着某种正相关关系n针对某险种的广告次数多,相应地卖出的保险份数也多n但是这种正相关关系并不是完全的正相关,因为图中的点并不在一条直线上总 结End of Chapter 2课堂练习1.用于同时概括两个变量数据的表格方法称为:a.ogive b.直方图c.交叉分组列表 d.以上都不是n正确答案:c.交叉分组列表2.所有数据组的频数总和等于 a.1 b.数据集中的所有数据个数 c.数据组的个数 d.0和1之间的某个值 e.以上都不是n正确答案:b.数据集中的所有数据个数3.条形图适合用于概括 a.定量数据 b.定性数据n正确答案:b.定性数据 4 直方图适合用于概括:a.定量数据 b.定性数据 n正确答案:a.定量数据5.从左向右看,ogive曲线总是上升不会下降 a.正确 b.错误 n正确答案:a.正确6.应用交叉分组列表时,涉及的两个变量必须都是定量变量 a.正确 b.错误 n正确答案:b.错误7.应用散点图时,两个变量都应该是定量变量。a.正确 b.错误n正确答案a.正确8.如果散点图显示两个变量之间具有负相关关系,则一般说来:a.x 增加,则y增加 b.y 增加,则x增加 c.x 增加,则y 减少 d.以上都不是