1、北京理工大学管理与经济学院m1. 定量数据的图表描述m数据整理m单变量描述m双变量描述m2. 定性数据的图表描述m数据整理m单变量描述m双变量描述第第1页页/共共33页页北京理工大学管理与经济学院单定量数据的图表描述未 分 组茎叶图箱线图分 组频数分布表累积频数分布表直方图折线图累积频数分布图数据图数据图形描述形描述数据整理数据整理第第2页页/共共33页页北京理工大学管理与经济学院m统计分组m根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组。m例,收集到某班所有同学的英语考试成绩,为了研究需要划分高、中、低三个成绩段,每个成绩段的范围分别是
2、85-100,70-85,0-70,将每个成绩归入到相应的组中。 第第3页页/共共33页页北京理工大学管理与经济学院m频数分布表 m对定量数据进行分组时,需要建立频数分布表,以便更有效地显示数据的特征和分布。m构成:m频数,各组的单位的次数m频率,各组次数与总次数之比m频数分布,由分组标志序列和各组相对应的分布次数这两个要素构成。 m频率分布,由分组标志序列和各组相应的频率构成频率分布。 第第4页页/共共33页页北京理工大学管理与经济学院原始数据: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38组别组别频数频数 15 且且 253 25 且且 355 35 且且
3、452第第5页页/共共33页页北京理工大学管理与经济学院m1. 选择组数m可参考Sturges的经验公式m3. 计算各组的宽度m宽度m4. 确定组界(上下限)m5. 计算组中值m某组的组中值m6. 根据分组整理成频数分布表m计算每个组的频数、相对频数(即频率) K21lglgn 区间数最小值最大值)(2)(该组上限值该组下限值第第6页页/共共33页页北京理工大学管理与经济学院原始数据: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38组界(上界+下界)/ 2组距组别组别组中值组中值频数频数 15 且 25203 25 且 35305 35 且 45402频率频率30
4、.050.020.0(可参考书上实例)第第7页页/共共33页页北京理工大学管理与经济学院m为了统计分析的需要,有时要观察某一数值以上或某一数值以下频数或频率之和,这就需要在频数分布表基本分组的基础上绘出累积频数或累计频率。m“向下累积”m由表的上方向表的下方的频数或频率相加m“向上累积”m由表的上方向表的下方的频数或频率相加第第8页页/共共33页页北京理工大学管理与经济学院小于组别下限的小于组别下限的百分数百分数 原始数据: 24, 26, 24, 21, 27, 27, 30, 41, 32, 38组别下界 30% + 50%80% + 20%组别组别累计累计百分比百分比15 25 0.02
5、5 35 30.035 45 80.045 55100.0(可参考书上实例)第第9页页/共共33页页北京理工大学管理与经济学院m数据分组整理后的图形描述m直方图 m用矩形的高度和宽度来表示频数分布 m折线图m作用与直方图相似 m累积频数分布图m描述累积频数或频率信息 第第10页页/共共33页页北京理工大学管理与经济学院012345频数频数 或或频率频率01525354555下界下界柱条接触计数计数类别类别频数频数15 25325 35535 452(可参考书上实例)第第11页页/共共33页页北京理工大学管理与经济学院012345中点中点虚拟的外推组0102030405060组别组别频数频数15
6、 25325 35535 45 100% 累计累计 %(可参考书上实例)第第13页页/共共33页页北京理工大学管理与经济学院m数据未分组整理后的图形描述m茎叶图 m用于直接描述未分组原始数据的探索性分析m描述数据分布形状,如数据是否集中,是否有极端值等 m由茎、叶、每个茎对应叶的个数、茎的宽度这四元素组成m箱线图m用于直接描述未分组原始数据的探索性分析m描述数据的分布形状,如数据是否集中,是否有极端值等m可以比较多组数据分布特征m图中包含五个点组成:样本数据的最小值、下四分位数、中位数、上四分位数、最大值 第第14页页/共共33页页北京理工大学管理与经济学院m把每一项观察分解为茎值和叶值m茎值
7、确定组别m叶值确定频数 (计数)Xi第第15页页/共共33页页北京理工大学管理与经济学院29N =OVER 65201816141210864KoreaMexicoTurkey奇异值最大值最小值中位数大于1.5倍四分位数间距四分位数间距范围第第16页页/共共33页页北京理工大学管理与经济学院(可参考书上实例)m中间的黑粗线为中位数m方框为四分位间距的范围m离方框上/下界的距离超过四分位数间距1.5倍的为离群值,以 “O” 表示;超过3倍的则为极值,用“*”表示。第第17页页/共共33页页北京理工大学管理与经济学院散 点 图组 箱 线 图雷 达 图多定量数据的图表描述线 图第第18页页/共共33
8、页页北京理工大学管理与经济学院m1. 散点图m同时研究两个数字变量的取值m在图上标出所有数对 (Xi, Yi)m2. 时间序列图m 表示一列定量数据如何随时间变化m3. 组箱线图m比较多个总体的分布特征m4. 雷达图m用于要同时分析的变量个数较多的情况第第19页页/共共33页页北京理工大学管理与经济学院m标出所有数对 (Xi, Yi)02040600204060XY(可参考书上实例)第第20页页/共共33页页北京理工大学管理与经济学院年份销售02468199119921993199419951996(可参考书上实例)第第21页页/共共33页页北京理工大学管理与经济学院202020N =下旬产量
9、中旬产量上旬产量12011010090807060李晨第第22页页/共共33页页北京理工大学管理与经济学院单定性数据的图表描述频数分布表累积频数分布表条形图饼图累积频数分布图数据图数据图形描述形描述数据整理数据整理帕雷托图第第23页页/共共33页页北京理工大学管理与经济学院m频数分布表(又叫总结表) m类似于整理定量数据的频数分布表m包含:m分类的频数或频率,即指落在某一特定类中的观察值数m分类的相对频数,指某个特定类的频数除以观察值总数所得的商m累积频数分布表m类似于整理定量数据的累积频数分布表第第24页页/共共33页页北京理工大学管理与经济学院这一列为类别记录:| | |专业专业计数计数会
10、计130经济 20管理 50总计200(可参考书上实例)第第25页页/共共33页页北京理工大学管理与经济学院m条形图m类似直方图,条形图的横轴表示的是各个分类,直方图的横轴表示所分的组 m饼图m通常用来描述落在各个分类中的观察值数分别在总数中所占的比率 m累积频数分布图m类似于描述定量数据中的累积频率分布图m帕雷托图m变量的分类数目较多时,用帕雷托图要比条形图和饼图更能直观地显示信息。 m广泛应用于过程分析和质量分析中 第第26页页/共共33页页北京理工大学管理与经济学院050100150会计会计经济经济管理管理水平条表示类型变量条长表示频数或者 %条宽的1/2 到 1 倍相同的条宽零点频数频
11、数专业专业也可使用百分比(可参考书上实例)第第27页页/共共33页页北京理工大学管理与经济学院经济经济10%管理管理25%会计会计65%m1. 表示出总量的分类m2. 是表示相对差异的有效办法m3. 角度大小m360(百分数) 专业专业 36010% = 3636(可参考书上实例)第第28页页/共共33页页北京理工大学管理与经济学院0%33%67%100%会计会计管理管理经济经济百分数百分数专业专业递减顺序累积频数分布图累积频数分布图相同的条宽竖直条形竖直条形条的中点(可参考书上实例)第第29页页/共共33页页北京理工大学管理与经济学院环 形 图交 叉 图多 重 条 形 图多定性数据的图表描述
12、第第30页页/共共33页页北京理工大学管理与经济学院m1. 环形图m显示具有相同分类且问题可比的多个样本或总体中各类别所占的相应比例,对各总体进行比较研究m在类别值为定序数据时这种比较才有意义m2. 交叉表m可检测两个定性变量的关系m同样可用来描述两个变量都是数字变量,或者一个变量是定类或定序变量,另一个是数字变量之间的关系 m3. 多重条形图m描述两个定类或定序变量间关系 第第31页页/共共33页页北京理工大学管理与经济学院m住处: CCOOCCOOC O 性别:MFFMMMFMMFm(C=校内, O=校外; M=男, F=女)4 12 3性别性别住处住处男男女女合计合计校内5校外5合计6410第第32页页/共共33页页北京理工大学管理与经济学院频数频数住处 0 1 2 3 4 5 6 校内校内 男男 女女 校外校外 男男 女女第第33页页/共共33页页