1、第第0202讲讲 常用的统计表与图常用的统计表与图数据的表达与描述的方法数据的表达与描述的方法 描述统计(descriptive Statistics)主要研究如何整理实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。描述数据的常用方法:表格法图示法数值指标法一、一般的统计表一、一般的统计表统计表的结构统计表的结构统计表的结构:表号名称(标题)项目(纵标目、横标目)数字数据来源线条表注家长职业高考录取人数所占比例(%)农民128 43.7教师干部 63 21.5工人 22 7.5其他 80 27.3总计293100表1 某县高考被录取学生家长职业比较表*表内数据来自县招生办表号
2、标题顶线表线底线标目标目数字表注一、一般的统计表一、一般的统计表统计表的结构统计表的结构.纵纵 标标 目目总总 标标 目(单位)目(单位).合合 计计 .横横 标标 目目纵纵 标标 目目纵纵 标标 目目纵纵 标标 目目总总 标标 目目横标目的横标目的总总 标标 目目表号表号 标题(包括何时、何地、何事)标题(包括何时、何地、何事)备注:备注:一、一般的统计表一、一般的统计表统计表的种类统计表的种类统计表的种类统计表的种类简单表简单表(simple table)(simple table):只按一:只按一个特征或标志分组。如表个特征或标志分组。如表2 2。复合表复合表(combinative t
3、able)(combinative table):按两个或两个以上特征或标志结按两个或两个以上特征或标志结合起来分组。如表合起来分组。如表3 3。班次平均成绩一69二72三75总平均 73.5表2 某校初一各班数学成绩比较表最后学历毕业时间人数百分比大学66年以前 21 1683年以后 11 8大专66年以前 74 5483年以后 29 22合计135100表3 某校教师学历统计表一、一般的统计表一、一般的统计表编制要求编制要求编制统计表的要求内容要简要,最好一个表说明一个中心内容,标题的措词要简明扼要,正确说明内容,使人一望便知。表号与标题之间留下一个汉字的空格。根本目标:将数据表格化,使人
4、能一目了然地看出被说明的事物特点、关系、发展趋势等,同时也便有于进行分析运算。分项要准确,以能说明问题为主,是决定统计表质量的关键,切忌分项太细。如果分类的标志只有一个,写在表的上行或左列都可以。如果分类的标志有两个,且二者没有隶属关系,则左列与上行各一个。如果两个分类标志有隶属关系,则要放在一个方向分两行分述。数据是统计表的语言,又称统计指标。借以说明内容,要求准确,书写整齐,一律用阿拉伯数字,单位要统一,位数要对齐,有效数位要一致,表格内不能有空白,暂缺或未调查的可记“”,无数字用“”代替。表中的数字一般不带单位(如等),单位放一般归在标目中。线条不要太多,表的上下端有顶线与底线,左右两边
5、不要用线条封死,纵标目应用细线隔开,横标目一律不划线条,合计项须用较粗线条或双线与其他项目分开。一、一般的统计表一、一般的统计表常见错误常见错误分组标志与观测指标位置颠倒、线条过多或过少、数字的小数点位数不一致或单位单位数字之后。表中数据的含义未表达清楚,令人费解。二、次数分布表二、次数分布表w次数分布(frequency distribution)显示初步整理后一组数据的分布情况。如:同一个观测值出现的次数,或者是每一个分数区间内的散布情况。w依据它所显示的次数如何产生,次数分布可以区分为简单次数分布、分组简单次数分布、相对次数分布、累积次数分布等。次数分布表和次数分布图就是各种次数分布的列
6、表形式和图示形式。二、次数分布表二、次数分布表简单次数分布表简单次数分布表w简单次数分布表(simple frequency table)就是依据每一个分数值在一列数据中出现的次数编制成的统计表。w例:某公司人力资源部为了评估本公司某一部门主管人员的绩效,使用调查问卷对该部门员工实施民意调查。其中有一道选择题是:“你认为本部门现任主管尽职尽责的程度如何?非常不尽职;不尽职;不置可否;尽职;非常尽职。”要求参加调查的80名员工从选项中作出选择。员工对主管尽职情况的评定人数 非常不尽职9 不尽职30 不置可否10 尽职25 非常尽职6 总计80表2-1 80名员工对部门主管尽职程度的调查结果二、次
7、数分布表二、次数分布表分组简单次数分布表分组简单次数分布表w当数据量很大时或连续数据的数据点很多时,应该把所有数据先划分为若干分组区间,然后将数据按其数值大小划归到相应的级别内,分别统计各个级别中包括的数据个数,再用列表的形式呈现出来,就构成了分组次数分布表(grouped frequency table)。编制编制分组简单次数分布表分组简单次数分布表的步骤:的步骤:(1)求极差极差(range):即最大值与最小值之差,又称为全距。(2)决定组数组数、组段组段和组距组距:根据研究目的和样本含量n确定。组距=极差/组数,通常分10-15个组,为方便计,组距参考极差的十分之一,再略加调整。(3)列
8、出组段:第一组段的下限略小于最小值下限略小于最小值,最后一个组段上限必须包上限必须包含最大值含最大值,其它组段上限值忽略。(4)划记计数划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。(5)编制成表251.87(1)KN二、次数分布表二、次数分布表相对次数与累积次数分布表相对次数与累积次数分布表w将次数分布表中各组的实际次数转化为相对次数,即用次数比率(f/N)或百分比(f/N100)来表示次数,就可制成相对次数分布表。w累积次数(cumulative frequency)是把各组的次数由上而下,或由下而上累加在一起。最后一组的累积次数应等于数据的总次数。w用累积次数表示的次数分布
9、称为累积次数分布(cumulative frequency distribution)。w累积次数也可转化为相对次数,称为相对累积次数。或者说是将相对次数进行累加,得到的次数称为相对累积次数。(殊途同归)三、常用的统计图三、常用的统计图统计图统计图(statistical chart 或或statistical graph)是用点、线、面等几何图形,直观是用点、线、面等几何图形,直观形象地表达、描述数据或结果。形象地表达、描述数据或结果。根本目标根本目标形象化的方式把事物的特性、规律显示出来。形象化的方式把事物的特性、规律显示出来。使人能获得全面与深刻的直观形象。使人能获得全面与深刻的直观形象
10、。便于说明问题与比较。便于说明问题与比较。三、常用的统计图三、常用的统计图统计图的结构统计图的结构统计图的结构图号与图题图号与图题图目图目图尺图尺图例图例图注图注表表2-17 2000年三大城市四苗接种率年三大城市四苗接种率()地区接种率(%)卡介苗 脊灰炎苗 百白破苗 麻疹疫苗甲99.7299.2099.2499.12乙93.5098.2098.7098.20丙99.5093.9098.7098.20图图2-17 20002-17 2000年三大城市四苗接种率年三大城市四苗接种率()疫苗种类疫苗种类X轴名称基线图目轮廓线图题图号图尺尺度单位Y轴名称刻度标记填充图案图例三、常用的统计图三、常用
11、的统计图统计图的种类统计图的种类统计图的种类统计图的种类条形图条形图(Bar chart)圆形图圆形图(Pie chart)百分条图百分条图(percentage chart)线图(线图(line chart,次次数多边图、累积次数分数多边图、累积次数分布图)布图)直方图(直方图(histogram)散点图散点图(scatter diagram)统计地图统计地图(statistical map)箱图箱图(boxplot)茎叶图茎叶图(stem-and-leaf display)雷达图雷达图(radar graph)气泡图气泡图三、常用的统计图三、常用的统计图 绘制统计图的要求与常见错误绘制统计
12、图的要求与常见错误绘制统计图的要求:根据数据和目的选择合适的图形图形所表示的面积或距离要比例适当表示不同的事物要用不同的顔色与线条图形法中常见的错误:坐标轴上的刻度值标得不符合数学原则。资料与所选用的统计图类型不匹配。图类型资料性质分析目的1.条图(0)横轴为间断独立的分组直条长短表达统计指标大小2.构成条图构成比长条各段长度(面积)表达构 成3.圆图构成比圆的扇形面积表达构成4.线图横轴年龄,时间等动 态变量统计指标随某一变量(时间)的变化趋势5.半对数线图横轴同上,纵轴取对数统计指标随某一变量(时间)的发展速度6.直方图(0)横轴为分组,纵轴为频数直条矩形面积表达各组段的频数(率)7.多边
13、图直方图的变形同上8.散点图两个变量用点的密集程度和趋势反映两变量关系9.统计地图地域性资料点的疏密、颜色的深浅等说明疾病地域分布表上端中央表上端中央图下方正中图下方正中标目标目横横纵纵线条线条顶、低线,或标目线或合计线顶、低线,或标目线或合计线数字数字阿拉伯数字(不用文字)阿拉伯数字(不用文字)小数位数一致、位次对齐小数位数一致、位次对齐不能有空不能有空备注备注必要时必要时图例图例放在图右上角或标题的上方放在图右上角或标题的上方标题标题如有度量单位,应标注如有度量单位,应标注一般为叙述事物的分组或动态变量一般为叙述事物的分组或动态变量一般为叙述事物的统计指标一般为叙述事物的统计指标简明扼要给
14、出图表的基本内容简明扼要给出图表的基本内容下次上课再见!下次上课再见!一般统计表的常见错误举例一般统计表的常见错误举例1返回返回一般统计表的常见错误举例一般统计表的常见错误举例2返回返回中距离投篮远距离投篮合 计投 中未投中投 中163652未投中5676132合 计72112184表表X 用新训练方法用新训练方法184人中、远距离投篮情况分析(原表)人中、远距离投篮情况分析(原表)中距离远距离合 计达 标未达标达 标163652未达标5676132合 计72112184表表X 用新训练方法用新训练方法184人中、远距离投篮情况分析(修改表)人中、远距离投篮情况分析(修改表)*10投6中以上为
15、达标,低于6中为未达标分组简单次数分布表例题分组简单次数分布表例题76.0 76.0 77.5 77.5 82.0 82.0 80.5 80.5 81.0 81.0 85.5 85.5 71.0 71.0 80.5 80.5 92.5 92.5 77.0 77.0 88.0 88.0 81.0 81.0 76.5 76.5 67.0 67.0 83.0 83.0 84.0 84.0 84.0 84.0 62.0 62.0 79.0 79.0 72.0 72.0 89.0 89.0 78.0 78.0 78.0 78.0 80.0 80.0 78.5 78.5 76.5 76.5 75.0 75
16、.0 79.5 79.5 86.0 86.0 81.5 81.5 75.0 75.0 84.0 84.0 90.0 90.0 80.0 80.0 86.0 86.0 84.5 84.5 68.5 68.5 71.0 71.0 86.0 86.0 81.5 81.5 79.5 79.5 80.5 80.5 73.0 73.0 93.0 93.0 83.0 83.0 72.0 72.0 68.0 68.0 71.0 71.0 87.0 87.0 78.0 78.0 66.0 66.0 83.0 83.0 87.0 87.0 82.5 82.5 79.5 79.5 80.0 80.0 82.0 82
17、.0 81.0 81.0 86.5 86.5 83.5 83.5 71.5 71.5 83.0 83.0 91.0 91.0 96.0 96.0 75.5 75.5 89.0 89.0 87.5 87.5 69.0 69.0 74.0 74.0 70.0 70.0 77.5 77.5 75.0 75.0 79.0 79.0 79.0 79.0 80.5 80.5 74.5 74.5 77.0 77.0 82.5 82.5 72.5 72.5 73.5 73.5 73.5 73.5 76.0 76.0 88.5 88.5 85.0 85.0 89.5 89.5 78.5 78.5 76.0 76
18、.0 74.0 74.0 98.0 98.0 73.0 73.0 94.0 94.0 79.0 79.0 80.0 80.0 75.5 75.5 83.5 83.5 82.0 82.0 65.0 65.0 74.5 74.5 80.0 80.0 70.0 70.0 下面是下面是100名学生在某项测验中的成绩分数,试将它们制成一名学生在某项测验中的成绩分数,试将它们制成一个次数分布表。个次数分布表。分组简单次数分布表例题分组简单次数分布表例题分组区间分组区间划记次数划记次数组中值组中值次数(次数(f)96-98|97293-95|94390-92|91487-89|88884-86|851181
19、-83|851778-80|791975-77|761472-74|731069-71|70766-68|67363-65|64160-62|611合计合计100步骤:步骤:(1)求极差极差(range)R98-6236(2)决定组数组数、组段组段和组距组距(3)列出组段(4)划记计数划记计数(5)编制成表251.87(1)=11.75KN返回返回相对次数分布表例题相对次数分布表例题分组区间分组区间组中值组中值次数(次数(f)相对次数相对次数百分次数()百分次数()96-989720.02293-959430.03390-929140.04487-898880.08884-8685110.11
20、1181-8385170.171778-8079190.191975-7776140.141472-7473100.101069-717070.07766-686730.03363-656410.01160-626110.011合计合计1001.00100返回返回累积次数分布表例题累积次数分布表例题分组区间分组区间组中值组中值次数次数(f)向上累积次数向上累积次数向下累积次数向下累积次数实际累积次数实际累积次数相对累积次数相对累积次数实际累积次数实际累积次数相对累积次数相对累积次数96-989721001.0020.0293-95943980.9550.0590-92914950.9590.0
21、987-89888910.91170.1784-868511830.83280.2881-838517720.72450.4578-807919550.55640.6475-777614360.36780.7872-747310220.22880.8869-71707120.12950.9566-6867350.05980.9863-6564120.02990.9960-6261110.011001.00合计合计100返回返回条形图(条形图(bar chart)条图:用条图:用直条直条的长度表示的长度表示相互独立相互独立的的统计指标的大小统计指标的大小,可分为:可分为:单式单式(simple)
22、(simple)条图:具有一个统计条图:具有一个统计指标,一个分组标志。如图指标,一个分组标志。如图2-82-8。复式复式(clustered)(clustered)条图:具有一个条图:具有一个统计指标,两个分组因素。如图统计指标,两个分组因素。如图2-92-9。分段分段(stacked)(stacked)条图条图绘制条形图注意事项绘制条形图注意事项 纵轴的刻度纵轴的刻度必须从必须从“0”“0”开始开始,否则会改变各对比组间的比例关系,否则会改变各对比组间的比例关系。(2)(2)横轴各直条一般按统计指标横轴各直条一般按统计指标由由大到小排列大到小排列,也可按事物本身的,也可按事物本身的自然自然
23、顺序排列顺序排列。(3)(3)各直条的宽度要一致,各直条各直条的宽度要一致,各直条应有相等的间隔,其宽度一般与直条应有相等的间隔,其宽度一般与直条的宽度的宽度相等相等或为直条宽度的或为直条宽度的一半一半。返回返回圆形图(圆形图(pie chart)圆图圆图:用于表达事物内部的百分:用于表达事物内部的百分构成比大小。构成比大小。各个扇形面积(各个扇形面积(3.6)的)的大小反映了大小反映了各组成部分百分各组成部分百分比比(1)的)的大小。大小。从从1212点钟点钟处开始绘制,处开始绘制,顺顺时针时针方向排列。方向排列。民民 族族人数人数构成比()构成比()汉汉 族族69696969满满 族族12
24、121212蒙古族蒙古族12121212白白 族族7 77 7总总 计计100100100 100 返回返回白族蒙古族满族汉族百分条图(百分条图(percentage chart)百分条图百分条图的作用与圆图相同。但更适用于多组百的作用与圆图相同。但更适用于多组百分比的比较。分比的比较。25.70%25.70%16.07%16.07%15.04%15.04%11.56%11.56%11.41%11.41%20.22%20.22%020406080100呼吸系呼吸系统病统病脑血脑血管病管病恶性恶性肿瘤肿瘤损伤与损伤与中毒中毒心脏心脏疾病疾病其其它它图图2-18 我国部分县我国部分县1988年的死
25、因构成比年的死因构成比不同性别某癌三种类型的构成不同性别某癌三种类型的构成分化型癌分化型癌低分化型癌低分化型癌未分化型未分化型合计合计男男52.352.327.827.819.919.9100100女女30.230.218.118.151.751.7100100返回返回线图(线图(line chart)线图线图(line chart):用线段的升降表示某事物动态变化,或某现象随另一:用线段的升降表示某事物动态变化,或某现象随另一现象变迁的情况现象变迁的情况(绝对差绝对差)。适用于适用于连续性资料连续性资料。(下图?)。(下图?)纵轴:纵轴:算术尺度算术尺度;横轴:连续性变量(时间、年龄等);横
26、轴:连续性变量(时间、年龄等)NATION白族蒙古族满族汉族平均分848280787674返回返回直方图(直方图(histogram)直方图直方图(histogram):用矩形面积表示连续变量的用矩形面积表示连续变量的频数频数(频率频率)分布。分布。1.横轴:连续变量的组段(分组区间);横轴:连续变量的组段(分组区间);纵轴:频数或频率,尺度从纵轴:频数或频率,尺度从0开始。开始。2.各矩形条之间不留空隙。各矩形条之间不留空隙。3.矩形的高度为频数或频率,宽度为组距。矩形的高度为频数或频率,宽度为组距。返回返回散点图散点图(scatter diagram)散点图散点图(scatter diag
27、ram):用点的密集程度和趋势:用点的密集程度和趋势表示两种现象间的相关关系。表示两种现象间的相关关系。横轴:自变量横轴:自变量X 纵轴:应变量纵轴:应变量Y纵轴与横轴的起点可根据资料的情况而定。纵轴与横轴的起点可根据资料的情况而定。返回返回统计地图统计地图(statistical map)统计地图统计地图(statistical map):用:用于表示某现于表示某现象的象的数量数量在在地域地域上的分上的分布。布。返回返回箱图箱图(boxplot)箱图箱图(boxplot)也称箱须图也称箱须图 (box-whisker plot),用于反),用于反映一组或多组连映一组或多组连续型定量数据分续型
28、定量数据分布的中心位置和布的中心位置和散布范围。散布范围。0123456安慰剂D10mgD20mg治疗组最大呼气量(FEV)返回返回茎叶图茎叶图(stem-and-leaf display)茎叶图茎叶图(stem-and-leaf display)与直方图类似,)与直方图类似,可描述连续性资料的分布,且直接用数据表示。可描述连续性资料的分布,且直接用数据表示。5 2 7 6 2 2 2 2 5 6 7 8 8 8 9 9 9 7 1 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9 8 0 0 2 3 5 8 9 9 1 3 7 7 7 8 9 10 1 4 5 5 9表2-2(P1
29、2)数据的茎叶图返回返回见茎叶图补充资料雷达图雷达图(radar graph)雷达图(radar graph)可比较多个单位不同指标的数据特征,如最大值、最小值等。返回返回气泡图气泡图气泡图可以反映三个变量之间的数量关系返回返回图形法常见的错误例1图形法常见的错误例1返回返回图形法常见的错误例2返回返回见教材见教材46页页树立质量法制观念、提高全员质量意识。22.10.1922.10.19Wednesday,October 19,2022人生得意须尽欢,莫使金樽空对月。17:56:0717:56:0717:5610/19/2022 5:56:07 PM安全象只弓,不拉它就松,要想保安全,常把弓
30、弦绷。22.10.1917:56:0717:56Oct-2219-Oct-22加强交通建设管理,确保工程建设质量。17:56:0717:56:0717:56Wednesday,October 19,2022安全在于心细,事故出在麻痹。22.10.1922.10.1917:56:0717:56:07October 19,2022踏实肯干,努力奋斗。2022年10月19日下午5时56分22.10.1922.10.19追求至善凭技术开拓市场,凭管理增创效益,凭服务树立形象。2022年10月19日星期三下午5时56分7秒17:56:0722.10.19严格把控质量关,让生产更加有保障。2022年10月
31、下午5时56分22.10.1917:56October 19,2022作业标准记得牢,驾轻就熟除烦恼。2022年10月19日星期三17时56分7秒17:56:0719 October 2022好的事情马上就会到来,一切都是最好的安排。下午5时56分7秒下午5时56分17:56:0722.10.19一马当先,全员举绩,梅开二度,业绩保底。22.10.1922.10.1917:5617:56:0717:56:07Oct-22牢记安全之责,善谋安全之策,力务安全之实。2022年10月19日星期三17时56分7秒Wednesday,October 19,2022相信相信得力量。22.10.192022
32、年10月19日星期三17时56分7秒22.10.19谢谢大家!谢谢大家!树立质量法制观念、提高全员质量意识。22.10.1922.10.19Wednesday,October 19,2022人生得意须尽欢,莫使金樽空对月。17:56:0817:56:0817:5610/19/2022 5:56:08 PM安全象只弓,不拉它就松,要想保安全,常把弓弦绷。22.10.1917:56:0817:56Oct-2219-Oct-22加强交通建设管理,确保工程建设质量。17:56:0817:56:0817:56Wednesday,October 19,2022安全在于心细,事故出在麻痹。22.10.192
33、2.10.1917:56:0817:56:08October 19,2022踏实肯干,努力奋斗。2022年10月19日下午5时56分22.10.1922.10.19追求至善凭技术开拓市场,凭管理增创效益,凭服务树立形象。2022年10月19日星期三下午5时56分8秒17:56:0822.10.19按章操作莫乱改,合理建议提出来。2022年10月下午5时56分22.10.1917:56October 19,2022作业标准记得牢,驾轻就熟除烦恼。2022年10月19日星期三17时56分8秒17:56:0819 October 2022好的事情马上就会到来,一切都是最好的安排。下午5时56分8秒下午5时56分17:56:0822.10.19一马当先,全员举绩,梅开二度,业绩保底。22.10.1922.10.1917:5617:56:0817:56:08Oct-22牢记安全之责,善谋安全之策,力务安全之实。2022年10月19日星期三17时56分8秒Wednesday,October 19,2022创新突破稳定品质,落实管理提高效率。22.10.192022年10月19日星期三17时56分8秒22.10.19谢谢大家!谢谢大家!