1、l就像房屋是由石头堆砌的一样,就像房屋是由石头堆砌的一样,科学是由事实构成的。但如同一科学是由事实构成的。但如同一堆石头并不是一栋房子,仅仅是堆石头并不是一栋房子,仅仅是事实的收集,也并不成为一门科事实的收集,也并不成为一门科学。学。第1页,共55页。高露洁公司 117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114
2、120 128 124 115 128 124 121 139第2页,共55页。生产经理:36394245JMMJSN营销经理:0 204060JMMJSNl我没办法有效率我没办法有效率的分配人手的分配人手销销售浮动太大了售浮动太大了!生产经理l销售业绩平平销售业绩平平!营销经理第3页,共55页。l广东某公司是专营新鲜水果、蔬菜等农产品出口的企业,主要出口货物是销往美广东某公司是专营新鲜水果、蔬菜等农产品出口的企业,主要出口货物是销往美国、西欧、日本等地的香蕉。公司打算向西欧展开一次香蕉出口攻势。鉴于公司国、西欧、日本等地的香蕉。公司打算向西欧展开一次香蕉出口攻势。鉴于公司资源限制,只能把力量
3、集中放在一个盈利潜力最佳的目标市场上。从历史情况分资源限制,只能把力量集中放在一个盈利潜力最佳的目标市场上。从历史情况分析,芬兰、瑞典、英国、瑞士、西班牙和葡萄牙等国都是进口香蕉的国家,公司析,芬兰、瑞典、英国、瑞士、西班牙和葡萄牙等国都是进口香蕉的国家,公司管理部门要求调研人员从中挑选一个国家作为目标市场。公司调研人员从经济与管理部门要求调研人员从中挑选一个国家作为目标市场。公司调研人员从经济与发展组织(发展组织(OECD)所发表的贸易统计资料着手,开始了二手资料调查,他们找)所发表的贸易统计资料着手,开始了二手资料调查,他们找到近年来上述六个国家的香蕉进口数字如下表:到近年来上述六个国家的
4、香蕉进口数字如下表:国别国别第一年第一年(万美元万美元)第二年第二年(万美元万美元)第三年第三年(万美元万美元)第三年第三年(万吨万吨)芬兰芬兰 4000 5000 7500 33葡萄牙葡萄牙 1500 1600 1000 5西班牙西班牙 900 1200 1500 5.5瑞典瑞典100001200012500 45瑞士瑞士125001550015000 45第4页,共55页。l1.1.明确统计整理程序明确统计整理程序l2.2.理解统计分组理解统计分组l3.3.熟悉数列的编制熟悉数列的编制(含用(含用ExcelExcel编制)编制)l4.4.掌握适用于数据的统计图表设计掌握适用于数据的统计图表
5、设计l5.5.能用能用ExcelExcel、WordWord作常用统计图表作常用统计图表第5页,共55页。步骤步骤统计表统计表统计图统计图解释解释数据数据整理整理数据数据显示显示Excel在数据整理和显示中的应用在数据整理和显示中的应用根据研究目的,对统计调查根据研究目的,对统计调查所得的原始资料进行科学的所得的原始资料进行科学的分类、汇总,或对已加工的分类、汇总,或对已加工的资料进行再加工,使之成为资料进行再加工,使之成为系统化、条理化的符合分析系统化、条理化的符合分析需要的综合资料的工作过程。需要的综合资料的工作过程。(p41)第6页,共55页。设计整理设计整理方方 案案审核数据审核数据分
6、分 类类汇汇 总总审核汇总审核汇总资资 料料编编 制统制统计图表计图表是否完整是否完整是否填写错误是否填写错误是否填写不规范是否填写不规范 第二手数据应着重审核第二手数据应着重审核数据的适用性和时效性数据的适用性和时效性 不完整是指漏答某不完整是指漏答某些必须回答的问题些必须回答的问题或有些被调查者资或有些被调查者资料尚未收到料尚未收到 错误是指出现不错误是指出现不合逻辑或根本不合逻辑或根本不可能的结果可能的结果是指出现计量单是指出现计量单位不统一等问题位不统一等问题 第7页,共55页。男男女女192021年龄(周岁)年龄(周岁)19 20 2119 20 216060707080809090
7、复复合合分分组组简简单单分分组组第8页,共55页。形式形式p45-46 种类种类P44解释解释p43 简单分组简单分组复合分组复合分组根据研究的目的和对象的特点,按照一定根据研究的目的和对象的特点,按照一定的标志将总体分为若干组成部分。的标志将总体分为若干组成部分。对总体按一个标志分组对总体按一个标志分组 对总体选择两个或两个以上标志对总体选择两个或两个以上标志重叠重叠起来进行分组起来进行分组 原则原则P44P44 穷尽;互斥穷尽;互斥作用作用P43P43 按标志的不同分按标志的不同分按变量值的取值不同分按变量值的取值不同分第9页,共55页。家庭人数(人)家庭人数(人)1 2 3 家庭人数(人
8、)家庭人数(人)12 34 56 6及及6以上以上年龄(周岁)年龄(周岁)015 1530 3045 4560 年龄(周岁)年龄(周岁)7以下以下 713 1422 60以上以上第10页,共55页。l单项分组单项分组l组距分组组距分组等距等距异距异距l组限组限 下限下限 上限上限l组距组距l组中值组中值l组限的形式组限的形式即每个变量值作为一个组。即每个变量值作为一个组。即两个变量值区间作为一个组。即两个变量值区间作为一个组。必须遵循必须遵循“不重不漏不重不漏”的原则。的原则。取决于变量类型、变量值的变动取决于变量类型、变量值的变动幅度。组数过多或过少都不宜。幅度。组数过多或过少都不宜。一般地
9、单变量值分组一般地单变量值分组适合于离散变适合于离散变量及变量值较少的情况;组距分组适量及变量值较少的情况;组距分组适合于连续变量及变量值较多的情况。合于连续变量及变量值较多的情况。第11页,共55页。l汇总的组织形式汇总的组织形式P47l汇总的方法汇总的方法P47l汇总的方式汇总的方式P48简单分组数据简单分组数据复合分组数据复合分组数据频数分布频数分布计数计数汇总汇总交叉列表交叉列表第12页,共55页。l在对数据进行计数汇总时,不同类型的数据所采在对数据进行计数汇总时,不同类型的数据所采取的处理方式和所适用的处理方法是不同的。取的处理方式和所适用的处理方法是不同的。定类数据定类数据的汇总的
10、汇总定类数据本身就是对事物的一种分类,因此在汇总定类数据本身就是对事物的一种分类,因此在汇总时就是列出所分类别后计算出每类别的频数、频率,时就是列出所分类别后计算出每类别的频数、频率,同时可选择适当的图形进行显示,以便对数据及其同时可选择适当的图形进行显示,以便对数据及其特征有一个初步了解。特征有一个初步了解。定序数据定序数据的汇总的汇总定类数据汇总与显示方法都适用于定序数据,此定类数据汇总与显示方法都适用于定序数据,此外,对于定序数据,还可以计算累积频数和累积外,对于定序数据,还可以计算累积频数和累积频率。需要注意的是频率。需要注意的是变量值应按顺序排列变量值应按顺序排列。第13页,共55页
11、。第14页,共55页。某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布 广告类型广告类型人数人数(人人)比例比例频率频率(%)商品广告商品广告 服务广告服务广告 金融广告金融广告 房地产广告房地产广告 招生招聘广告招生招聘广告 其他广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计合计2001100第15页,共55页。第16页,共55页。第17页,共55页。甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数(户户)百分比百分比(%)向上累
12、计向上累计 向下累计向下累计 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合计合计300100.0第18页,共55页。第19页,共55页。频数分布频数分布:将总体按某一:将总体按某一变量变量进行进行分组分组并按一定顺序排列同时列出每个组的总并按一定顺序排列同时列出每个组的总体单位数(即体单位数(即次数或频数次数或频数)而成的数列。)而成的数列
13、。组成要素组成要素种类种类:单项数列单项数列 组距数列组距数列方法与品质型数据特方法与品质型数据特别是定序数据的整理别是定序数据的整理方法相同。方法相同。第20页,共55页。117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 128 124 121 139第21页,共55页。2111
14、22112128129130131133134135137139121443223119120121122123124125126127121211133107108110112113114115117118频数频数(人人)零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)零件数零件数(个个)某车间某车间50名工人日加工零件数变量数列名工人日加工零件数变量数列第22页,共55页。手工程序手工程序排排 序序确定组数与组距确定组数与组距确定组限确定组限计算次数计算次数 制制 表表 利用利用Excel程序程序P70输入原始数据输入原始数据选定一空列选定一空列输入各组上限值输入各
15、组上限值展开展开工具工具菜单菜单选取选取数据分析数据分析从对话框中选取从对话框中选取直方图直方图输入区域输入区域中键入中键入引用单元格引用单元格(变量值所在)(变量值所在)接收区域接收区域中键入中键入引用单元格引用单元格(组限所在)(组限所在)输出区域输出区域中键入中键入一单元格一单元格(其右、下方空)(其右、下方空)单击确定单击确定(可选定(可选定图表输出等)图表输出等)利用利用Excel中有关函数等中有关函数等P47第23页,共55页。首先:确定等距还是异距首先:确定等距还是异距异距分组,主要取决于现象的特点和研究目的,或变异距分组,主要取决于现象的特点和研究目的,或变量值变动很不均匀波动
16、幅度很大时。量值变动很不均匀波动幅度很大时。各组频数的分布受组距大小不同的影响各组频数的分布受组距大小不同的影响各组绝对频数的多少不能反映频数分布的实际状况,需要用各组绝对频数的多少不能反映频数分布的实际状况,需要用频数密度(频数密度频数频数密度(频数密度频数/组距)反映频数分布的实际状组距)反映频数分布的实际状况况等距分组,一般分等距分组,一般分510组。常用等距分组,因为便于组。常用等距分组,因为便于直接比较便于制图直接比较便于制图。各组频数的分布不受组距大小的影响各组频数的分布不受组距大小的影响可直接根据绝对频数来观察频数分布的特征和规律可直接根据绝对频数来观察频数分布的特征和规律第24
17、页,共55页。然后,确定组数或组距然后,确定组数或组距(对于等距数列)对于等距数列)应以能够显示数据的分布特征和规律为目的应以能够显示数据的分布特征和规律为目的*先确定组数先确定组数*先确定组距先确定组距通常可采用(斯特奇斯)经验公式:(偏度系数不大时)通常可采用(斯特奇斯)经验公式:(偏度系数不大时)组距组距=全距全距R/(1+3.322lg总次数总次数N)则:则:组数组数=全距全距/组距组距当偏度系数较大,分布明显偏态时,当偏度系数较大,分布明显偏态时,以平均数为中以平均数为中心,可以心,可以K K倍标准差为组距倍标准差为组距经验公式:经验公式:组数组数=1+lg总次数总次数N/lg2 或
18、或 1+3.322lg总次数总次数N则:则:组距组距=全距全距/组数组数第25页,共55页。l对于等距数列:对于等距数列:方法一:确定最小组下限方法一:确定最小组下限实际中一般取值实际中一般取值为略小于最小值为略小于最小值方法二:确定最大组上限方法二:确定最大组上限实际中一般取值实际中一般取值为略大于最大值为略大于最大值l对于异距数列:对于异距数列:依据研究目的而定依据研究目的而定第26页,共55页。10050合合 计计610162820128358141064105110110115115120120125125130130135135140频率(频率(%)频数(人)频数(人)按零件数分组按
19、零件数分组第27页,共55页。10050合合 计计610162820128358141064105109110114115119120124125129130134135139频率(频率(%)频数(人)频数(人)按零件数分组按零件数分组第28页,共55页。10050合合 计计610162820128358141064110以下以下110114115119120124125129130134135以上以上频率(频率(%)频数(人)频数(人)按零件数分组按零件数分组第29页,共55页。第30页,共55页。钟型分布钟型分布左偏左偏右偏右偏第31页,共55页。U型分布型分布(正正)J型型分布分布(反反
20、)J型型分布分布第32页,共55页。l下面的直方图给出了某班期终成绩的分布下面的直方图给出了某班期终成绩的分布:l(1)有人成绩低于)有人成绩低于20分吗?分吗?l(2)哪个块形表示得分在)哪个块形表示得分在60与与80分之间的人?分之间的人?l(3)百分之十的人得分在)百分之十的人得分在20与与40分之间。大约多少百分数分之间。大约多少百分数的人得分在的人得分在40与与60分之间?分之间?(4)大约多少百分数的人得分在)大约多少百分数的人得分在60分以上?分以上?ABCD12340 2040 60 80 100分数百分比%第33页,共55页。l下面是下面是3 3个不同班级的考试得分直方图的草
21、图。个不同班级的考试得分直方图的草图。得分是从得分是从0 0到到100100分;及格分数是是分;及格分数是是5050。l(1)对于每一个班级,及格的百分数大约是对于每一个班级,及格的百分数大约是50%呢,还是大大地超过呢,还是大大地超过50%,还是大大地低于还是大大地低于50%?l(2)有一个班级中有两个非常不同的学生组,一组在考试中考得相当有一个班级中有两个非常不同的学生组,一组在考试中考得相当差,而另一组则非常出色。这是哪一个班级?差,而另一组则非常出色。这是哪一个班级?l(3)图中(图中(b)班,有较多的人得分在)班,有较多的人得分在40-50范围内呢,还是在范围内呢,还是在90-100
22、范围范围内?内?(a)(b)(c)025 50 75 100 025 50 75 100 025 50 75 100第34页,共55页。各组频率各组频率 累计频率累计频率集中趋势值集中趋势值众数众数中位数中位数 算术平均数算术平均数品质数列品质数列(定类定类)()品质数列品质数列(定序定序)()变量数列变量数列(单项式单项式)(精确值精确值)(精确值精确值)(精确值精确值)变量数列变量数列(组距式组距式)(近似值近似值)(近似值近似值)(近似值近似值)第35页,共55页。l某公司某公司50名员工的性别与年龄情况如下名员工的性别与年龄情况如下:编号 性别 年龄 编号 性别 年龄 编号 性别 年龄
23、 编号 性别 年龄1男4814男3227女3740男502女5015男3128女2641女403女4716女2729男2142男454男4517男3630男1943男275男4218男5631女1844男346男5619女3432女2045女327男2520女2733男4546男338男4021女4034男5547男299男2022女5135女2248男2210男3623女2736女3049男4811女3024女2637女3150男4712男3025女4338女4013男2826女4939女35第36页,共55页。职工性别构成职工性别构成性别性别人数人数(人人)比率比率(%)(%)男男2727
24、54.054.0女女232346.046.0合计合计5050100.0100.0职工年龄构成职工年龄构成年龄年龄人数人数(人人)比率比率(%)(%)2525以下以下 7 714.014.025-3525-35191938.038.035-4535-45101020.020.045-5545-55111122.022.05555以上以上 3 3 6.0 6.0合计合计5050100.0100.0想知道不同性别的职工在年龄分布上是否有差别想知道不同性别的职工在年龄分布上是否有差别第37页,共55页。职工性别与年龄交叉分布列表职工性别与年龄交叉分布列表 年龄年龄性别性别2525以下以下 25-352
25、5-3535-4535-4545-5545-555555以上以上 总计总计男男4 49 94 47 73 32727女女3 310106 64 4 -2323总计总计7 71919101011113 35050第38页,共55页。表表A 某市某市300家饭店的质量等级和餐价交叉分组列表家饭店的质量等级和餐价交叉分组列表质量等级质量等级餐价(元)餐价(元)总计总计1019202930394049好好非常好非常好极好极好总计总计4234 278 40 64 14118 2462876 0 62228 84150 66300表表B 每一质量等级类别不同餐价所占百分比每一质量等级类别不同餐价所占百分比
26、质量等级质量等级餐价(元)餐价(元)总计总计1019202930394049好好非常好非常好极好极好50.022.7 3.0 47.6 42.7 21.2 2.430.642.4 0.0 4.033.4 100 100 100第39页,共55页。l利用数据透视表(可以计数也可以求和)利用数据透视表(可以计数也可以求和)注意:数据源区域要包含字段名且字段名不能有空格注意:数据源区域要包含字段名且字段名不能有空格l利用数组函数利用数组函数sum(可以计数也可以求和)(可以计数也可以求和)注意注意1:公式输入完毕后不能直接按:公式输入完毕后不能直接按enter,要同时按要同时按ctrl+shift+
27、enter注意注意2:条件如果包含等号等符号要用括号括起来,:条件如果包含等号等符号要用括号括起来,条件与条件之间用条件与条件之间用“*”号连接,条件排序不分先后号连接,条件排序不分先后l利用分类汇总命令(可以计数也可以求和)利用分类汇总命令(可以计数也可以求和)l利用函数利用函数sumif(求和)(求和)注意:根据指定条件对若干单元格求和注意:根据指定条件对若干单元格求和第40页,共55页。l对农村中学与城镇中学各年级学生均随机抽取500人进行调查,下面是“中学生参加课外体育活动情况统计表”,请用文字表述表中反映的两种主要情况:第41页,共55页。某院在校学生人数表某院在校学生人数表20年下
28、学期女男总计100.00 158014203000合 计 3.00 60 30 90专科生 87.00 135012602610本科生 10.00 170 130 300硕士生各层次人数占全院人数的百分比(%)人 数(人)层次横行标题纵栏标题主词宾词指标数值总标题第42页,共55页。第43页,共55页。l柱形图(条形图)柱形图(条形图):最常用,通常用来表现同类最常用,通常用来表现同类指标在不同时间或空间的对比、计划执行进度、指标在不同时间或空间的对比、计划执行进度、总体内部的结构以及次数分配状况总体内部的结构以及次数分配状况。简单条形图简单条形图:条形图中最简便的一种。它是用若干:条形图中最
29、简便的一种。它是用若干平行而平行而等宽等宽的长条来表明所图示指标的对比关系。的长条来表明所图示指标的对比关系。示例第44页,共55页。l两个或两个以上的统计指标所表示的条形合并在一起,按两个或两个以上的统计指标所表示的条形合并在一起,按排列的方式不同,又分为并列式与迭并式两种。主要用来排列的方式不同,又分为并列式与迭并式两种。主要用来表现所研究现象的对比关系表现所研究现象的对比关系。第45页,共55页。l又叫分段条形图或条形结构图。用来表现所研又叫分段条形图或条形结构图。用来表现所研究总体内部的结构关系究总体内部的结构关系。第46页,共55页。l线形图线形图:动态曲线、对数曲线(动态曲线的特动
30、态曲线、对数曲线(动态曲线的特殊形式)、依存关系曲线、雷达图殊形式)、依存关系曲线、雷达图(显示多个变显示多个变量常用量常用)等。等。l圆形图(饼状图)圆形图(饼状图):分为单圆形图和多圆形图分为单圆形图和多圆形图。与此类似,还有正方形图、长方形图等,统称平与此类似,还有正方形图、长方形图等,统称平面图。常用来反映总体内部结构(尤其是圆形面图。常用来反映总体内部结构(尤其是圆形图)。图)。l箱线图箱线图P58l茎叶图茎叶图P59l象形图象形图l统计地图统计地图第47页,共55页。0200400600工商管理工商管理公共事业公共事业人力资源人力资源水平条表示类型变量条长表示频数或者%条宽的1/2
31、 到 1 倍相同的条宽零点人数(人)人数(人)专业专业也可使用百分比800第48页,共55页。1.表示出总量的分类(结构)2.角度大小360(百分数百分数)工商管理58%公共事业20%人力资源22%第49页,共55页。不好的表示不好的表示好的表示好的表示1980:$1.001990:$1.602000:$3.102010:$3.80最低工资最低工资0241980199020002010¥“垃圾数”表第50页,共55页。好的表示好的表示按年级统计的成绩为“优”的人数按年级统计的成绩为“优”的人数不好的表示不好的表示0100200300一年级一年级二年级二年级三年级三年级四年级四年级人数人数0%1
32、0%20%30%百分比百分比一年级一年级二年级二年级三年级三年级四年级四年级第51页,共55页。好的表示好的表示季度销售季度销售不好的表示不好的表示025501季度季度 2季度季度 3季度季度 4季度季度¥0100200¥1季度季度 2季度季度 3季度季度 4季度季度第52页,共55页。好的表示好的表示月销售量月销售量不好的表示不好的表示0204060一一 三三 五五 七七 九九 十一十一$36394245一一三三五五七七九九十一十一$第53页,共55页。l减少图或表中无用的内容减少图或表中无用的内容l不堆积图表不堆积图表l不留让读者不理解的内容不留让读者不理解的内容l一个图表应该只传递一个观点一个图表应该只传递一个观点l保持图表平衡保持图表平衡l保持图表的比例保持图表的比例l简单最好简单最好l限制所使用的文字数限制所使用的文字数l能够传递要表达的内容能够传递要表达的内容第54页,共55页。用用Word、Excel制表、制图制表、制图第55页,共55页。