1、l就像房屋是由石头堆砌的一就像房屋是由石头堆砌的一样,科学是由事实构成的。样,科学是由事实构成的。但如同一堆石头并不是一栋但如同一堆石头并不是一栋房子,仅仅是事实的收集,房子,仅仅是事实的收集,也并不成为一门科学。也并不成为一门科学。高露洁公司 117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 1
2、24 115 128 124 121 139生产经理:36394245JMMJSN营销经理:0 204060JMMJSNl我没办法有效率我没办法有效率的分配人手的分配人手销销售浮动太大了售浮动太大了!生产经理l销售业绩平平销售业绩平平!营销经理l广东某公司是专营新鲜水果、蔬菜等农产品出口的企业,主要出口货广东某公司是专营新鲜水果、蔬菜等农产品出口的企业,主要出口货物是销往美国、西欧、日本等地的香蕉。公司打算向西欧展开一次香物是销往美国、西欧、日本等地的香蕉。公司打算向西欧展开一次香蕉出口攻势。鉴于公司资源限制,只能把力量集中放在一个盈利潜力蕉出口攻势。鉴于公司资源限制,只能把力量集中放在一个盈
3、利潜力最佳的目标市场上。从历史情况分析,芬兰、瑞典、英国、瑞士、西最佳的目标市场上。从历史情况分析,芬兰、瑞典、英国、瑞士、西班牙和葡萄牙等国都是进口香蕉的国家,公司管理部门要求调研人员班牙和葡萄牙等国都是进口香蕉的国家,公司管理部门要求调研人员从中挑选一个国家作为目标市场。公司调研人员从经济与发展组织从中挑选一个国家作为目标市场。公司调研人员从经济与发展组织(OECD)所发表的贸易统计资料着手,开始了二手资料调查,他们)所发表的贸易统计资料着手,开始了二手资料调查,他们找到近年来上述六个国家的香蕉进口数字如下表:找到近年来上述六个国家的香蕉进口数字如下表:国别国别第一年第一年(万美元万美元)
4、第二年第二年(万美元万美元)第三年第三年(万美元万美元)第三年第三年(万吨万吨)芬兰芬兰 4000 5000 7500 33葡萄牙葡萄牙 1500 1600 1000 5西班牙西班牙 900 1200 1500 5.5瑞典瑞典100001200012500 45瑞士瑞士125001550015000 45l1.1.明确统计整理程序明确统计整理程序l2.2.理解统计分组理解统计分组l3.3.熟悉数列的编制熟悉数列的编制(含用(含用ExcelExcel编制)编制)l4.4.掌握适用于数据的统计图表设计掌握适用于数据的统计图表设计l5.5.能用能用ExcelExcel、WordWord作常用统计图表
5、作常用统计图表步骤步骤统计表统计表统计图统计图解释解释数据数据整理整理数据数据显示显示Excel在数据整理和显示中的应用在数据整理和显示中的应用根据研究目的,对统计调根据研究目的,对统计调查所得的原始资料进行科查所得的原始资料进行科学的分类、汇总,或对已学的分类、汇总,或对已加工的资料进行再加工,加工的资料进行再加工,使之成为系统化、条理化使之成为系统化、条理化的符合分析需要的综合资的符合分析需要的综合资料的工作过程。料的工作过程。(p41)设计整理设计整理方方 案案审核数据审核数据分分 类类汇汇 总总审核汇总审核汇总资资 料料编编 制统制统计图表计图表是否完整是否完整是否填写错误是否填写错误
6、是否填写不规范是否填写不规范 第二手数据应着重审核第二手数据应着重审核数据的适用性和时效性数据的适用性和时效性 不完整是指漏答某不完整是指漏答某些必须回答的问题些必须回答的问题或有些被调查者资或有些被调查者资料尚未收到料尚未收到 错误是指出现不错误是指出现不合逻辑或根本不合逻辑或根本不可能的结果可能的结果是指出现计量单是指出现计量单位不统一等问题位不统一等问题 男男女女192021年龄(周岁)年龄(周岁)19 20 2119 20 216060707080809090复复合合分分组组简简单单分分组组形式形式p45-46 种类种类P44解释解释p43 简单分组简单分组复合分组复合分组根据研究的目
7、的和对象的特点,按照一根据研究的目的和对象的特点,按照一定的标志将总体分为若干组成部分。定的标志将总体分为若干组成部分。对总体按一个标志分组对总体按一个标志分组 对总体选择两个或两个以上对总体选择两个或两个以上标志标志重叠重叠起来进行分组起来进行分组 原则原则P44P44 穷尽;互斥穷尽;互斥作用作用P43P43 按标志的不同分按标志的不同分按变量值的取值不同分按变量值的取值不同分家庭人数(人)家庭人数(人)1 2 3 家庭人数(人)家庭人数(人)12 34 56 6及及6以上以上年龄(周岁)年龄(周岁)015 1530 3045 4560 年龄(周岁)年龄(周岁)7以下以下 713 1422
8、 60以上以上l单项分组单项分组l组距分组组距分组等距等距异距异距l组限组限 下限下限 上限上限l组距组距l组中值组中值l组限的形式组限的形式即每个变量值作为一个组。即每个变量值作为一个组。即两个变量值区间作为一个即两个变量值区间作为一个组。组。必须遵循必须遵循“不重不漏不重不漏”的原则。的原则。取决于变量类型、变量值的变动取决于变量类型、变量值的变动幅度。组数过多或过少都不宜。幅度。组数过多或过少都不宜。一般地单变量值分组一般地单变量值分组适合于离散适合于离散变量及变量值较少的情况;组距变量及变量值较少的情况;组距分组适合于连续变量及变量值较分组适合于连续变量及变量值较多的情况。多的情况。l
9、汇总的组织形式汇总的组织形式P47l汇总的方法汇总的方法P47l汇总的方式汇总的方式P48简单分组数据简单分组数据复合分组数据复合分组数据频数分布频数分布计数计数汇总汇总交叉列表交叉列表l在对数据进行计数汇总时,不同类型的数据所采在对数据进行计数汇总时,不同类型的数据所采取的处理方式和所适用的处理方法是不同的。取的处理方式和所适用的处理方法是不同的。定类数据定类数据的汇总的汇总定类数据本身就是对事物的一种分类,因此在汇定类数据本身就是对事物的一种分类,因此在汇总时就是列出所分类别后计算出每类别的频数、总时就是列出所分类别后计算出每类别的频数、频率,同时可选择适当的图形进行显示,以便对频率,同时
10、可选择适当的图形进行显示,以便对数据及其特征有一个初步了解。数据及其特征有一个初步了解。定序数据定序数据的汇总的汇总定类数据汇总与显示方法都适用于定序数据,此定类数据汇总与显示方法都适用于定序数据,此外,对于定序数据,还可以计算累积频数和累积外,对于定序数据,还可以计算累积频数和累积频率。需要注意的是频率。需要注意的是变量值应按顺序排列变量值应按顺序排列。某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布 广告类型广告类型人数人数(人人)比例比例频率频率(%)商品广告商品广告 服务广告服务广告 金融广告金融广告 房地产广告房地产广告 招生招聘广告招生招聘广告 其他广告其他广告11
11、2519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计合计2001100甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数(户户)百分比百分比(%)向上累计向上累计 向下累计向下累计 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562
12、510合计合计300100.0频数分布频数分布:将总体按某一:将总体按某一变量变量进行进行分组分组并按一定顺序排列同时列出每个组的总并按一定顺序排列同时列出每个组的总体单位数(即体单位数(即次数或频数次数或频数)而成的数列。)而成的数列。组成要素组成要素种类种类:单项数列单项数列 组距数列组距数列方法与品质型数据方法与品质型数据特别是定序数据的特别是定序数据的整理方法相同。整理方法相同。117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 1
13、27 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 128 124 121 139211122112128129130131133134135137139121443223119120121122123124125126127121211133107108110112113114115117118频数频数(人人)零件数零件数(个个)频数频数(人人)零件数零件数(个个)频数频数(人人)零件数零件数(个个)某车间某车间50名工人日加工零件数变量数列名工人日加工零件数变量数列手工程序手工程序排排
14、 序序确定组数与组距确定组数与组距确定组限确定组限计算次数计算次数 制制 表表 利用利用Excel程序程序P70输入原始数据输入原始数据选定一空列选定一空列输入各组上限值输入各组上限值展开展开工具工具菜单菜单选取选取数据分析数据分析从对话框中选取从对话框中选取直方图直方图输入区域输入区域中键入中键入引用单元格引用单元格(变量值所在)(变量值所在)接收区域接收区域中键入中键入引用单元格引用单元格(组限所在)(组限所在)输出区域输出区域中键入中键入一单元格一单元格(其右、下方空)(其右、下方空)单击确定单击确定(可选定(可选定图表输出等)图表输出等)利用利用Excel中有关函数等中有关函数等P47
15、首先:确定等距还是异距首先:确定等距还是异距异距分组,主要取决于现象的特点和研究目的,异距分组,主要取决于现象的特点和研究目的,或变量值变动很不均匀波动幅度很大时。或变量值变动很不均匀波动幅度很大时。各组频数的分布受组距大小不同的影响各组频数的分布受组距大小不同的影响各组绝对频数的多少不能反映频数分布的实际状况,各组绝对频数的多少不能反映频数分布的实际状况,需要用频数密度(频数密度频数需要用频数密度(频数密度频数/组距)反映频组距)反映频数分布的实际状况数分布的实际状况等距分组,一般分等距分组,一般分510组。常用等距分组,因为组。常用等距分组,因为便于直接比较便于制图便于直接比较便于制图。各
16、组频数的分布不受组距大小的影响各组频数的分布不受组距大小的影响可直接根据绝对频数来观察频数分布的特征和规律可直接根据绝对频数来观察频数分布的特征和规律然后,确定组数或组距然后,确定组数或组距(对于等距数列)对于等距数列)应以能够显示数据的分布特征和规律为目的应以能够显示数据的分布特征和规律为目的*先确定组数先确定组数*先确定组距先确定组距通常可采用(斯特奇斯)经验公式:(偏度系数不大时)通常可采用(斯特奇斯)经验公式:(偏度系数不大时)组距组距=全距全距R/(1+3.322lg总次数总次数N)则:则:组数组数=全距全距/组距组距当偏度系数较大,分布明显偏态时,当偏度系数较大,分布明显偏态时,以
17、平均数为以平均数为中心,可以中心,可以K K倍标准差为组距倍标准差为组距经验公式:经验公式:组数组数=1+lg总次数总次数N/lg2 或或 1+3.322lg总次数总次数N则:则:组距组距=全距全距/组数组数l对于等距数列:对于等距数列:方法一:确定最小组下限方法一:确定最小组下限实际中一般取实际中一般取值为略小于最小值值为略小于最小值方法二:确定最大组上限方法二:确定最大组上限实际中一般取实际中一般取值为略大于最大值值为略大于最大值l对于异距数列:对于异距数列:依据研究目的而定依据研究目的而定10050合合 计计6101628201283581410641051101101151151201
18、20125125130130135135140频率(频率(%)频数(人)频数(人)按零件数分组按零件数分组10050合合 计计610162820128358141064105109110114115119120124125129130134135139频率(频率(%)频数(人)频数(人)按零件数分组按零件数分组10050合合 计计610162820128358141064110以下以下110114115119120124125129130134135以上以上频率(频率(%)频数(人)频数(人)按零件数分组按零件数分组钟型分布钟型分布左偏左偏右偏右偏U型分布型分布(正正)J型型分布分布(反反)J
19、型型分布分布l下面的直方图给出了某班期终成绩的分布下面的直方图给出了某班期终成绩的分布:l(1)有人成绩低于)有人成绩低于20分吗?分吗?l(2)哪个块形表示得分在)哪个块形表示得分在60与与80分之间的人?分之间的人?l(3)百分之十的人得分在)百分之十的人得分在20与与40分之间。大约多少百分之间。大约多少百分数的人得分在分数的人得分在40与与60分之间?分之间?(4)大约多少百分数的人得分在)大约多少百分数的人得分在60分以上?分以上?ABCD12340 2040 60 80 100分数百分比%l下面是下面是3 3个不同班级的考试得分直方图的草图。个不同班级的考试得分直方图的草图。得分是
20、从得分是从0 0到到100100分;及格分数是是分;及格分数是是5050。l(1)对于每一个班级,及格的百分数大约是对于每一个班级,及格的百分数大约是50%呢,还是大大地超呢,还是大大地超过过50%,还是大大地低于,还是大大地低于50%?l(2)有一个班级中有两个非常不同的学生组,一组在考试中考得有一个班级中有两个非常不同的学生组,一组在考试中考得相当差,而另一组则非常出色。这是哪一个班级?相当差,而另一组则非常出色。这是哪一个班级?l(3)图中(图中(b)班,有较多的人得分在)班,有较多的人得分在40-50范围内呢,还是在范围内呢,还是在90-100范围内?范围内?(a)(b)(c)025
21、50 75 100 025 50 75 100 025 50 75 100各组频率各组频率 累计频率累计频率集中趋势值集中趋势值众数众数中位数中位数 算术平均数算术平均数品质数列品质数列(定类定类)()品质数列品质数列(定序定序)()变量数列变量数列(单项式单项式)(精确值精确值)(精确值精确值)(精确值精确值)变量数列变量数列(组距式组距式)(近似值近似值)(近似值近似值)(近似值近似值)l某公司某公司50名员工的性别与年龄情况如下名员工的性别与年龄情况如下:编号 性别 年龄 编号 性别 年龄 编号 性别 年龄 编号 性别 年龄1男4814男3227女3740男502女5015男3128女2
22、641女403女4716女2729男2142男454男4517男3630男1943男275男4218男5631女1844男346男5619女3432女2045女327男2520女2733男4546男338男4021女4034男5547男299男2022女5135女2248男2210男3623女2736女3049男4811女3024女2637女3150男4712男3025女4338女4013男2826女4939女35职工性别构成职工性别构成性别性别人数人数(人人)比率比率(%)(%)男男272754.054.0女女232346.046.0合计合计5050100.0100.0职工年龄构成职工年龄构
23、成年龄年龄人数人数(人人)比率比率(%)(%)2525以下以下 7 714.014.025-3525-35191938.038.035-4535-45101020.020.045-5545-55111122.022.05555以上以上 3 3 6.0 6.0合计合计5050100.0100.0想知道不同性别的职工在年龄分布上是否有差别想知道不同性别的职工在年龄分布上是否有差别职工性别与年龄交叉分布列表职工性别与年龄交叉分布列表 年龄年龄性别性别2525以下以下 25-3525-3535-4535-4545-5545-555555以上以上 总计总计男男4 49 94 47 73 32727女女3
24、 310106 64 4 -2323总计总计7 71919101011113 35050表表A 某市某市300家饭店的质量等级和餐价交叉分组列表家饭店的质量等级和餐价交叉分组列表质量等级质量等级餐价(元)餐价(元)总计总计1019202930394049好好非常好非常好极好极好总计总计4234 278 40 64 14118 2462876 0 62228 84150 66300表表B 每一质量等级类别不同餐价所占百分比每一质量等级类别不同餐价所占百分比质量等级质量等级餐价(元)餐价(元)总计总计1019202930394049好好非常好非常好极好极好50.022.7 3.0 47.6 42.
25、7 21.2 2.430.642.4 0.0 4.033.4 100 100 100l利用数据透视表(可以计数也可以求和)利用数据透视表(可以计数也可以求和)l注意:数据源区域要包含字段名且字段名不能有注意:数据源区域要包含字段名且字段名不能有空格空格l利用数组函数利用数组函数sum(可以计数也可以求和)(可以计数也可以求和)l注意注意1:公式输入完毕后不能直接按:公式输入完毕后不能直接按enter,要同时要同时按按ctrl+shift+enterl注意注意2:条件如果包含等号等符号要用括号括起来,:条件如果包含等号等符号要用括号括起来,条件与条件之间用条件与条件之间用“*”号连接,条件排序不
26、分先号连接,条件排序不分先后后l利用分类汇总命令(可以计数也可以求和)利用分类汇总命令(可以计数也可以求和)l利用函数利用函数sumif(求和)(求和)l注意:根据指定条件对若干单元格求和注意:根据指定条件对若干单元格求和l对农村中学与城镇中学各年级学生均随机抽取500人进行调查,下面是“中学生参加课外体育活动情况统计表”,请用文字表述表中反映的两种主要情况:某院在校学生人数表某院在校学生人数表20年下学期女男总计100.00 158014203000合 计 3.00 60 30 90专科生 87.00 135012602610本科生 10.00 170 130 300硕士生各层次人数占全院人
27、数的百分比(%)人 数(人)层次横行标题纵栏标题主词宾词指标数值总标题l柱形图(条形图)柱形图(条形图):最常用,通常用来表现同类最常用,通常用来表现同类指标在不同时间或空间的对比、计划执行进度、指标在不同时间或空间的对比、计划执行进度、总体内部的结构以及次数分配状况总体内部的结构以及次数分配状况。简单条形图简单条形图:条形图中最简便的一种。它是:条形图中最简便的一种。它是用若干平行而用若干平行而等宽等宽的长条来表明所图示指标的的长条来表明所图示指标的对比关系。对比关系。示例l两个或两个以上的统计指标所表示的条形合并在一起,两个或两个以上的统计指标所表示的条形合并在一起,按排列的方式不同,又分
28、为并列式与迭并式两种。主按排列的方式不同,又分为并列式与迭并式两种。主要用来表现所研究现象的对比关系要用来表现所研究现象的对比关系。l又叫分段条形图或条形结构图。用来表现所研又叫分段条形图或条形结构图。用来表现所研究总体内部的结构关系究总体内部的结构关系。l线形图线形图:动态曲线、对数曲线(动态曲线的特动态曲线、对数曲线(动态曲线的特殊形式)、依存关系曲线、雷达图殊形式)、依存关系曲线、雷达图(显示多个变显示多个变量常用量常用)等。等。l圆形图(饼状图)圆形图(饼状图):分为单圆形图和多圆形分为单圆形图和多圆形图图。与此类似,还有正方形图、长方形图等,与此类似,还有正方形图、长方形图等,统称平
29、面图。常用来反映总体内部结构(尤其是统称平面图。常用来反映总体内部结构(尤其是圆形图)。圆形图)。l箱线图箱线图P58l茎叶图茎叶图P59l象形图象形图l统计地图统计地图0200400600工商管理工商管理公共事业公共事业人力资源人力资源水平条表示类型变量条长表示频数或者%条宽的1/2 到 1 倍相同的条宽零点人数(人)人数(人)专业专业也可使用百分比800 1.表示出总量的分类(结构)2.角度大小360(百分数百分数)工商管理58%公共事业20%人力资源22%不好的表示不好的表示好的表示好的表示1980:$1.001990:$1.602000:$3.102010:$3.80最低工资最低工资0
30、241980199020002010¥“垃圾数”表好的表示好的表示按年级统计的成绩为“优”的人数按年级统计的成绩为“优”的人数不好的表示不好的表示0100200300一年级一年级二年级二年级三年级三年级四年级四年级人数人数0%10%20%30%百分比百分比一年级一年级二年级二年级三年级三年级四年级四年级好的表示好的表示季度销售季度销售不好的表示不好的表示025501季度季度 2季度季度 3季度季度 4季度季度¥0100200¥1季度季度 2季度季度 3季度季度 4季度季度好的表示好的表示月销售量月销售量不好的表示不好的表示0204060一一 三三 五五 七七 九九 十一十一$36394245一一 三三 五五 七七 九九 十一十一$l减少图或表中无用的内容减少图或表中无用的内容l不堆积图表不堆积图表l不留让读者不理解的内容不留让读者不理解的内容l一个图表应该只传递一个观点一个图表应该只传递一个观点l保持图表平衡保持图表平衡l保持图表的比例保持图表的比例l简单最好简单最好l限制所使用的文字数限制所使用的文字数l能够传递要表达的内容能够传递要表达的内容用用Word、Excel制表、制图制表、制图