1、1 本章教学目标:本章教学目标:l了解统计学的基本知识;l统计数据的收集、调查;l掌握利用统计图表整理和表示统计数据的基本方法;l掌握利用 Office 软件绘制各种统计图表、计算各种统计综合指标。第一章第一章 统计数据的收集与整理统计数据的收集与整理2本章主要内容 1.1 统计学概述 1.2 统计数据的收集集 1.3 问卷设计 1.4 统计表和统计图 3一、统计与统计学一、统计与统计学 “统计”一词可以有三种理解:统计工作、统计资料、统计学。l 统计工作统计工作 是指应用科学的方法对调查研究的对象进行数据搜集、整理和分析的全部工作,其成果是形成统计数据资料。l 统计资料统计资料 是统计工作所
2、取得的成果,包括两大类型:原始资料和再生信息。l 统计学统计学 统计学是关于如何搜集、整理和分析客观现象数量规律的一门方法论方法论的科学。1.1 统计学概述统计学概述4二、统计研究对象的特点 1.数量性数量性 统计学研究的对象是客观现象的数量特征和规律性。2.总体性总体性 统计学研究的是客观现象总体的数量特征与规律性,而不是个体的量。3.具体性具体性 统计的对象是一定时间、地点、条件下事物的量,而不是抽象对象的量,这是统计学和数学的一个重要区别。4.差异性差异性 组成统计研究对象总体的个体是有差异的,否则就不需要进行统计分析。统计研究中需要对总体中大量的个体进行观察并进行综合分析,由此才能获得
3、总体的数量分布特征。5三、统计学的分类 统计学大致有以下两种主要的分类方法。1.描述统计学和推断统计学描述统计学和推断统计学 这一分类方法既反映了统计学发展的两个主要阶段,同时也反映了各自不同的侧重。l 描述统计学描述统计学 是研究如何对客观现象进行数量的计量、加工、概括和表示的方法。在二十世纪之前统计学基本上处于描述阶段。描述统计学是统计学的基础。l 推断统计学推断统计学 是研究如何根据样本数据去推断总体的情况,概率论是其理论基础。推断统计学是近代统计学的核心,也是统计学中的主要内容。62.理论统计学和应用统计学l 理论统计学理论统计学 是研究统计学的数学原理,它基于概率论的原理,还包括不属
4、于传统概率论的一些内容,如随机化原则的理论、各种估计的原理、假设检验的原理以及一般决策的原理。在统计实践中经常会遇到一些原有的统计方法不能适应的新问题,需要创造新的统计模型和统计分析方法,这就需要统计理论的研究与指导。l 应用统计学应用统计学 将统计学的基本原理应用于各个领域就形成各种应用统计学的分支。它包括适用于各个领域的一般性的统计方法,如参数估计、假设检验、方差分析、回归分析等,还包括在某一领域中特定的分析方法,如经济统计中的时间数列分析和指数分析等。应用统计学侧重于阐明统计学的基本原理,并将理论统计学的成果作为工具应用于各个领域。7 数据是统计分析的基础,社会经济统计中所需要的数据与资
5、料主要来源于统计调查。一一.数据采集的基本要求数据采集的基本要求 1.准确性准确性 2.及时性及时性 3.完整性完整性 4.系统性系统性 指统计调查的数据资料应配套,要能从不同侧面反映所研究总体的特征,才能为科学的判断和决策提供依据。1.2 统计数据的统计数据的收集收集8二.普遍调查 普遍调查简称普查,是专门组织的一次性的全面调查。如全国的人口普查、能源普查、工业普查等。组织方式有两种:1.建立专门的普查机构 2.利用调查单位的原始记录和核算资料,发放调查表,由登记单位填报。普查时注意的原则:(1)规定统一的标准时点(2)规定统一的普查期限(3)规定普查的项目和指标。9普遍调查实例【例1.1】
6、2002年在国务院统一部署下,开展全国“基本单位普查”。关于这次普查的部分重要要求与规定如下:调查目的:统计分析全国和各省市地区的单位总数、性质、隶属关系、分布情况等。标准时间:2001年12月31日。调查对象:各类法人单位,各类法人单位所属的产业活动单位。调查项目:单位总数;性质分类(企业法人、事业法人、社团法人、机关法人、其他法人);基本情况 性质划分、隶属关系(中央、省市、区县、街道等);主要构成(产业结构、行业分布、地区分布、经济成分、规模结构);分布情况。10三.重点调查 在总体中选择部分重点单位进行调查,以了解总体基本情况总体基本情况的一种非全面调查。重点调查的特点:重点调查的特点
7、:(1)重点调查适用于调查对象的标志值比较集中于某些单位的场合,这些单位的管理比较健全,统计力量比较充实,能够及时取得准确资料。(2)重点调查的目的在于了解总体现象某些方面的基本情况,而不要求全面准确地推算总体数字。(3)重点调查比实际调查的单位数目少,在满足调查目的所要求的前提下,可以比全面调查节省人力、物力和时间。11四.典型调查 也是专门组织的一种非全面调查,在总体中选择有代表性的典型单位进行深入深入细致细致的调查。典型调查的作用和目的典型调查的作用和目的(1)研究新事物或某种倾向性的社会问题研究新事物或某种倾向性的社会问题 通过对典型单位深入细致的调查,可以发现新情况、新问题,探测事物
8、发展变化的趋势,形成科学的预见。(2)分析事物的不同类型分析事物的不同类型 通过研究造成它们间差别的原因,总结经验教训,研究对策,促进事物的转化和发展。12五.典型调查(续)(3)典型调查可用来研究事务的变化规律。)典型调查可用来研究事务的变化规律。(4)典型调查的资料可用来补充和验证全)典型调查的资料可用来补充和验证全面统计的数字,推论和测算有关现象的总面统计的数字,推论和测算有关现象的总体。体。13六.抽样调查 是指按随机原则从总体中抽取部分单位组成样本。目的是利用样本数据推断(估计)总体的数量分布特征。抽样调查是现代推断统计的核心,也是最重要的统计调查方法。将在第3章中详细介绍。14七.
9、网上调查 互联网的发展把我们带入了网络经济时代,传统的调查理论与国际互联网技术结合的要求,使得网上调查应运而生。1999年10月16日,北京零点专业市场调查公司与爱特信搜狐网络公司正式携手,创立了搜狐 零点网上调查公司,共同拓展网上调查业务,这标志着中国调查业步入“网络时代”。1997年初,我国网民是20万人,1999年7月就增加到了400万人,到目前已达到了2000万人,网络用户正以每年几百万的速度增长。151.网上调查的主要方式1)E-mail法法 E-mail法即电子邮件法,以较为完整的E-mail地址清单作为样本框,使用随机的方法发送问卷进行调查。2)Web站点法站点法 Web站点法又
10、称主动浏览访问法,即将调查问卷放置在访问率较高的Web站点的页面上,由对该问题感兴趣的访问者完成并提交。3)Net-meeting法法 Net-meeting法即网络会议法,视频会议法,焦点团体座谈法。通过直接在上网人士中征集与会者,并在约定时间举行网上座谈会,在主持人的引导下,对某一问题进行深入的或探索性的讨论、研究的一种网上调查方法。4)Internet Phone法 Internet Phone法即网络电话法,是以IP地址为抽样框,采用IP自动拨叫技术,邀请用户参与调查。比如:可将IP地址排序,每隔100个进行一次抽样,被抽中的用户会自动弹出一个小窗口,询问其是否愿意接受调查,回答“是”
11、,则弹出调查问卷;回答“否”,则呼叫下一个IP地址。这种调查方法类似传统调查方式中的电话调查。4)162.网上调查优势1)及时性和共享性 2)便捷性和低成本 3)可靠性和客观性 4)更好的接触性 5)穿越时空性 17 问卷是一种特殊形式的调查表。其特点是表中用一系列按照严密逻辑结构组成的问题,向被调查者调查具体事实和个人对某问题的反映、看法,它不要求被调查者填写姓名。问卷设计一般要遵循以下原则。1.合理性 合理性指的是问卷必须紧密与调查主题相关。2.一般性一般性 即问题的设置是否具有普遍意义。3.逻辑性逻辑性 问卷的设计要有整体感,这种整体感即是问题与问题之间要具有逻辑性,独立的问题本身也不能
12、出现逻辑上的谬误。4.明确性 所谓明确性,事实上是问题设置的规范性。5.非诱导性 非诱导性指的是问题要设置在中性位置、不参与提示或主观臆断,完全将被访问者的独立性与客观性摆在问卷操作的限制条件的位置上。1.3 问卷设计问卷设计18 在获得原始数据资料之后,需要使用一定的方法对数据进行整理和综合,目的是从大量的原始数据资料中提炼所需要的信息,使之可以提供概要信息并能反映对象总体的基本数量特征,便于人们的理解和使用。表格和图形是整理和反映统计资料的主要工具。1.4统计表和统计图 19一、频数分布表例:例:2002年1月比特啤酒公司 60个销售点的啤酒销售量(单位:桶)487152533641695
13、847605329417281374358684273625944515347665952344973294716395843294652384680585167545758634940546158664750 20比特公司啤酒销售量的分组统计销售量(桶)销售点数量(频数)频率(%)101911.7202935.0303958.340491626.750592033.36069915.0707946.7808923.3合计60100 分组统计整理后,将杂乱无章的 60 个原始数据压缩到8组,清晰地反映了更多的有用信息。21 比特公司啤酒销售量的分布特征051015202509101 9202
14、9303 9404 9505 9606 9707 9808 990以上频频数数图1.1 比特公司啤酒销售量的频数分布 22二.统计分组的类型 1.按品质标志分组按品质标志分组 目的在于揭示总体内部的性质和结构特点。2.按数量标志分组按数量标志分组 按某一数量标志的不同取值范围将总体划分为若干组。目的在于揭示总体内部的数量差异及其数量分布特征。23 统计各组中的单位数(频数),并按一定顺序排列。频数分布表可以反映总体的分布特征,是最有用的整理统计资料的方法。2.频数分布表的构成要素频数分布表的构成要素(1)分组形成的组别;(2)各组中的总体单位数(频数);(3)各组频数与总频数之比(频率)。24
15、3.频数分布表的种类 (1)品质数列品质数列 按品质标志分组的频数分布表。例:例:某企业职工人数统计表性别(分组)人数(频数)比率(%)(频率)男52656.08女41243.92合计938100 25(2)变量数列 按数量标志分组的频数分布表。单项数列单项数列 以每一变量值为一组。适用于取值不多的离散型变量。例例:某企业职工家庭人口分组统计表家庭人口(分组)职工户数(频数)比率(频率%)1 7 2.7 2 38 14.9 3 105 41.2 4 54 21.2 5 31 12.2 5 人以上 20 7.8 合 计 255 100 26 组距数列 每组包含某一区间内的变量值。适用于连续型变量
16、和取值很多的离散型变量。组距数列是最重要的频数分布表。例:某企业职工工资的分组统计例:某企业职工工资的分组统计月 工资(分 组)人 数(频数)比 率(频率%)1000 以 下15014.51000 150018517.91500 200025624.72000 300026225.33000 350012011.63500 4000545.24000 以 上80.8合 计1035100 274.组距数列的编制在编制组距数列时,需要解决如何分组、分组数量、组距、组限等问题。组距数列中的几个基本概念组距数列中的几个基本概念重叠和组限不重叠组限重叠和组限不重叠组限重叠组限重叠组限相邻组的上下限重合。
17、适用于连续型变量。但各组上、下限中有一个不包含再内。通常按“上限不在内”处理,即组区间是 a,b)的形式。注意:注意:Excel在制作频数分布表时采用的是“上限在内”的规则。不重叠组限不重叠组限相邻组的上下限不重合。适用于离散型变量。28例:离散型变量的分组(不重叠组限)销售量(桶)销售点数量(频数)相对频数(%)101911.7202935.0303958.340491626.750592033.36069915.0707946.7808923.3合计60100比特公司啤酒销售量的分组统计 29例:连续型变量的分组(上限不在内)月工资(分组)人数(频数)比率(频率%)1000 以下15014
18、.51000150018517.91500200025624.72000300026225.33000350012011.635004000545.24000 及以上80.8合 计1035100某企业职工工资的分组统计某企业职工工资的分组统计 30等距分组和异距分组 等距分组等距分组 适用于数据基本呈单峰对称分布,或数据分布比较均匀的情况。异距分组异距分组 适用于数据的分布状态极度偏斜的情况。实际应用中采用哪种分组方法应根据数据的分布特点和统计分析的需要决定。31例:按雇工人数分组的私营企业规模统计雇雇工工人人数数企企业业数数百百分分比比1194537.5%20993125.8%1001992
19、319.2%2004991512.5%500 及以上65.0%合计120100%32 有些现象中各类型的数值差异很大,其标志值呈几何级数变化,则组距就应按几何级数确定。例例:某市零售商店年营业额分组统计某市零售商店年营业额分组统计年营业额(万元)商店数百分比(%)10 以下205674.041010051518.5510010001465.26100010000481.7310000 以上120.43合计2777100%33(2)分组数量和组距的确定 分组的数量和组距应根据对象的特点和分析的需要决定。如对学生成绩就应分为 5 组,第 1 组为 60 分以下,以 10 分为组距进行分组。分组的数
20、量通常应在 515 之间。分组过多则难以反映总体的数量分布特征;分组过少则会丢失许多重要的统计信息。34(3)使用 Excel 制作频数分布表 利用 Excel 的 FREQUENCY 函数 语法规则:格式:格式:FREQUENCY(,)接收区间各组上限值组成的一列区域 功能:功能:返回各组的频数。使用【工具】“数据分析”“直方图”功能 35 统计图可以形象、直观、生动、简洁地显示数据的特征。常用的统计图有以下几种:1.折线图折线图 通常用来描述时间序列数据,用以表示某些指标的变化趋势。制作折线图时应正确选择坐标轴轴的刻度。对同样的统计资料,延伸或压缩某一坐标轴可能传达不同的甚至是误导的印象。
21、二、二、统计图统计图36010002000300040001989199019911992199319941995失失业业人人数数:千千人人图1.2 失业人数统计图过分压缩了过分压缩了Y轴轴3710002000300040001989199019911992199319941995失失业业人人数数:千千人人图1.3 失业人数统计图过分压缩了过分压缩了X轴轴382.柱形图、条形图和直方图 柱形图、条形图和直方图是使用的最为广泛的统计图表。通常将横向绘制的柱形图称为条形图,而将各柱形之间没有间隔的称为直方图,但在Office中将直方图和柱形图统称为柱形图。(1)柱形图柱形图 主要用于表示时间序列数
22、据。390 02002004004006006008008001000100012001200140014001600160018001800199019901991199119921992199319931994199419951995食品食品燃料燃料工业原料工业原料最终产品最终产品图1.4 各类进口商品的变化情况柱形图示例柱形图示例40(2)直方图用以表示数据的频数分布规律。051015202509101 9202 9303 9404 9505 9606 9707 9808 990以上频频数数图1.5 比特公司啤酒销售量的频数分布413.圆饼图 用来表示总体各部分在总体中所占的结构比率。女
23、性女性18%16%66%男性男性55%11%34%已婚孤寡或离婚单身已婚孤寡或离婚单身图1.6 某企业员工的婚姻状况424.曲线图 用于描述连续型变量的分布特征。Office 中曲线图的绘制中曲线图的绘制 方法一:使用“平滑线散点图”绘制 方法二:将折线图转换为曲线图 右击折线后选择“数据系列格式”,在“图案”标签下选“平滑线”复选框,就将折线图转换为曲线图。43经济管理中几种常见的频数分布曲线 正态分布曲线正态分布曲线 这是客观事物数量特征上表现得最为普遍的一类频数分布曲线。如人的身高、体重、智商,钢的含碳量、抗拉强度,某种农作物的产量等等。图1.7 正态分布曲线44偏态曲线图1.8 偏态曲
24、线右偏(正偏)左偏(负偏)例如收入和财富的频数分配曲线就是右偏的,大量财富都集中在极少数富豪手中,而多数人则是低收入者。此外,在产品质量管理中也普遍存在这种现象,如多数次品都集中出在少数工人手中;次品也大都出在少数几道工序上。这就要求在管理和控制上需要突出重点、抓住关键因素。按其长尾拖向哪一方又可分为右偏(正偏)和左偏(负偏)两类。45 J 形曲线 其典型的应用分别是经济学中的供给曲线和需求曲线。供给曲线(正 J 形)表现为随着价格的增加,供给量以更快的速度增加;需求曲线(倒 J 形)表现为随着价格的增加,需求量以更快的速度减少。供给和需求曲线的交点即供求平衡点。正 J 形倒 J 形图1.9
25、J 形曲线46 U形曲线 人和动物的的死亡率、设备的故障率等通常都服从于 U 形曲线分布。图1.10 U形曲线 又称生命曲线或浴盆曲线475.对数图 人们经常对时间序列变量的相对变化率而不是绝对数值的变化感兴趣,如各种经济变量的环比发展速度。此时若要用统计图直观反映增长率等现象的变动趋势,就需要使用对数图。对数图是以时间为横轴,以10为底的对数比率刻度为纵轴的折线图。可以通过对数图中各线段的斜率比较各时期增长率的大小。考虑以下统计数据:时期绝对数值对数值120.3240.6380.94161.248对数图可以直观反映时间序列的环比变化趋势一般折线图一般折线图0 02 24 46 68 8101
26、01212141416161 12 23 34 4时期对数图对数图1101001234时期 可以在Office图表类型中选择自定义类型中的“对数图”,也可通过将一般折线图纵轴“坐标轴格式”中的“刻度”设为“对数刻度”来绘制对数图。图1.1449例:某公司总成本和劳动成本的增长 该公司总成本和劳动成本每年增加相同的数量,因而用绝对数据作图时两条线是平行的,不小心可能会得出劳动成本占总成本固定比例的误解。实际上第1年占40%,第6年占60%。使用对数图就可以清晰反映劳动成本有更高的增长率。年 份总 成 本(百 万 元)劳 动 成 本(百 万 元)11004021105031206041307051
27、408061509050一般折线图一般折线图020406080100120140160123456对数图对数图101001000123456图1.15 对数图反映了劳动成本增长率大于总成本增长率51 本章主要介绍以下 3类综合统计指标:l度量中心(集中)趋势的平均指标l度量离散程度的指标l度量偏斜程度的指标 第第2章章 统计综合指标统计综合指标52 平均指标是说明社会经济现象一般水平的统计指标,反映标志值分布的集中趋势。平均指标按计算方式可分为数值平均数和位置平均数两大类。2.1 度量集中趋势的平均指标度量集中趋势的平均指标53 是根据总体各单位所有标志值计算出的平均数。包括算术平均数、几何平
28、均数。(一一)算术平均数算术平均数 1.算术平均数的基本公式算术平均数的基本公式总体单位总数总体单位标志总量算术平均数 一.数值平均数 54 (1)简单算术平均数简单算术平均数niixnx112.2.算术平均数的计算算术平均数的计算 n 总体单位总数;xi 第 i 个单位的标志值。(2)(2)加权算术平均数加权算术平均数 xi 第 i 组的代表值(组中值或该组变量值);f i 第 i 组的频数。iiiffxx55使用 Excel 函数求加权算术平均数 利用 Excel“数学和三角函数”中的SUMPRODUCT 函数可以方便地计算出分组数据的加权算术平均数。语法规则:语法规则:格式:SUMPRO
29、DUCT(,)功能:返回两个或多个区域中对应元素乘积之和。例例:利用比特啤酒公司各销售点分组频数分布数据,求各销售点的平均销售量。56(二)几何平均数 当统计资料是各时期的发展速度等前后期的两两比环数据,要求每时期的平均发展速度时,就需要使用几何平均数。几何平均数是 n 个数连乘积的 n 次方根。1.简单几何平均数简单几何平均数nnGxxxx 21 2.加权几何平均数加权几何平均数 ffnffGnxxxx 2121f i 各比率出现的频数 57例:某公司原料成本随时间增长的情况如下表求原料成本的平均年增长率。解一解一:1992199319941995成本200228239.4244.2年增长率
30、(%)1452302.105.114.1Gx解二解二:3200/2.244Gx 年平均增长率=1.0688-1=6.88%0688.10688.1583.使用 Excel 求几何平均数 可以使用 Excel 统计函数中的 GEOMEAN 函数返回几何平均数。语法规则:格式:GEOMEAN(,)功能:返回所有参数中数据的几何平均数。59 位置平均数是根据总体标志值所处的特殊位置确定的一类平均指标。包括中位数和众数两种。(一一)中位数中位数 将总体各单位标志值按由小到大的顺序排列后处于中间位置的标志值称为中位数,记为Me。中位数是一种位置平均数,不受极端数据的影响。当统计资料中含有异常的或极端的数
31、据时,中位数比算术平均数更具有代表性。比如有 5 笔付款:9元,10元,10元,11元,60元 付款的均值为 20 元,显然这并不是一个很好的代表值,而中位数 Me=10 元则更能代表平均每笔的付款数。二.位置平均数601.使用 Excel 的统计函数返回未分组数据的中位数 可以使用 Excel 统计函数中的 MEDIAN 函数返回未分组数据的中位数。格式:MEDIAN(,)功能:返回所有参数中数据的中位数。612.分组数据中位数的确定 对于分组数据的统计资料,中位数要用插值法来估算。(1)计算各组的累计频数;(2)确定中位数所在的组 是累计频数首次包含中位数位次f/2的组。dfSfLMmme
32、121其中:L 中位数所在组的下限;Sm-1 中位数所在组前一组的累计频数;fm 中位数所在组的频数;d 中位数所在组的组距。62例:计算下表数据的中位数解解:f/2=27.5,中位数在“15-25”的组中,分组 各组频数 累计频数 0-5 2 2 5-15 6 8 15-25 20 28 25-35 15 43 35-45 8 51 45 4 55 dfSfLMmme121102085.271575.24 63(二)众数 是总体中出现次数最多的标志值,记为M 0。众数明确反映了数据分布的集中趋势,也是一种位置平均数,不受极端数据的影响。但并非所有数据集合都有众数,也可能存在多个众数。在某些情
33、况下,众数是一个较好的代表值。例如在服装行业中,生产商、批发商和零售商在进行生产和存货决策时,更感兴趣的是最普遍的尺寸而不是平均尺寸。又如,当要了解大多数家庭的收入状况时,也要用到众数。641.未分组数据众数的确定 在数据量很大的时候,可以使用 Excel 统计函数中的 MODE 函数返回众数。格式:MODE(,)功能:返回所有参数中数据的众数。652.分组数据众数的确定 对于分组数据的统计资料,众数也要用插值法来估算。(1)确定众数所在的组 对于等距分组,众数组是频数最高的组;(2)使用以下插值公式计算dLM2110其中:L 众数组的下限1 众数组与前一组的频数之差2 众数组与后一组的频数之
34、差 d 众数组的组距12众数Ld66例:计算下表数据的众数解:解:众数组是“15-25”的组,则分组 各组频数 0-5 2 5-15 6 15-25 20 25-35 15 35-45 8 45 4 dLM211010)1520()620(6201537.22 67三.算术平均数和位置平均数间的关系 1.频数分布呈完全对称的单峰分布,算术平均数、中位数和众数三者相同。0 xf(Me,M0)X0 xfMeXM00 xfMeXM02.频数分布为右偏态时,众数小于中位数,算术平均数大于中位数。3.频数分布为左偏态时,众数大于中位数,算术平均数小于中位数。68补充习题补充题3:某地区私营企业注册资金分
35、组资料如下,求该地区私营企业注册资金的平均数、中位数和众数。注册资金(万元)50以下 50100 100150 150200 200250 250以上企业数2035422615569 补充题3答案注册资金(万元)企业数 累计企业数组中值50以下2020255010035557510015042971251502002612317520025015138225250以上5143275(万元)6.123iiiffxx(万元)64.1195042555.711002/1dfSfLMmmef/2=143/2=71.5,中位数所在组为“100150”的组,众数组为“100150”的组,)(22.1155
36、0)2642()3542(35421002110万元dLM70 xx频数 要分析总体的分布规律,仅了解中心趋势指标是不够的,还需要了解数据的离散程度或差异状况。几个总体可以有相同的均值,但取值情况却可以相差很大。变异指标就是用来表示数据离散程度特征的。变异指标主要有:极差、平均差、标准差和变异系数。2.1 度量离散程度的指标度量离散程度的指标71【案例】道格拉斯公司应如何选择供应商 道森公司和克拉克公司是道格拉斯公司的两家供货商。两家供货商都表示大约需要10个工作日交付定货。下表是两家供应商定货交付时间的历史数据。今后道格拉斯公司应选择哪家供应商供货?道森公司:道森公司:克拉克公司:克拉克公司
37、:交货天数次数交货天数次数9271106821129310411312213172一.极差 极差也称全距,是一组数据的最大值和最小值之差,通常记为R。显然,一组数据的差异越大,其极差也越大。极差是最简单的变异指标,它广泛应用于产品质量管理中控制质量的差异,一旦发现超过控制范围,就采取措施加以纠正,以保证产品质量的稳定。但极差有很大的局限性,它仅考虑了两个极端的数据,没有利用其余数据的信息,因而是一种比较粗糙的变异指标。73二.平均差 平均差是各数据与其均值离差绝对值的算术平均数,通常记为A.D。|1XXNDAi.平均差越大,反映数据间的差异越大。但由于使用了绝对值,其数学性质很差,因而很少使用
38、。74三.方差和标准差 方差和标准差是应用得最为广泛的变异指标。标准差是方差的算术平方根,也称均方差或根方差。应注意总体方差、标准差与样本方差、标准差是有区别的。1.总体方差和总体标准差总体方差和总体标准差 总体方差是各总体数据与其均值离差平方的均值,记为 2,总体标准差记为。22)(1XXNi2)(1XXNi 752.样本方差与样本标准差 样本方差记为 S 2,样本标准差记为 S,在推断统计中,它们分别是总体方差和标准差的优良估计。2)(11XXnSi其中:n 为样本容量,Xi 为样本观察值为样本均值。X22)(11XXnSi 76未分组数据方差和标准差的计算 方差和标准差的手工计算非常烦琐
39、,只要求掌握以下两种方法。使用计算器的统计功能使用计算器的统计功能(SD或STAT功能)使使用用 Excel 的统计函数的统计函数 VARP(,)功能:返回所有参数中数据的总体方差。STDEVP(,)功能:返回所有参数中数据的总体标准差。VAR(,)功能:返回所有参数中数据的样本方差。STDEV(,)功能:返回所有参数中数据的样本标准差。773.分组数据的方差与标准差 如果得到的是分组的频数分布数据,则方差与标准差的公式如下:,)(122iiifXXfiiifXXf2)(1,)(1122iiifXXfSiiifXXfS2)(11其中 Xi 是第 i 组的组中值或标志值。784.是非标志的平均数
40、和标准差(增加)在对社会经济现象进行分析时,经常要将总体的所有单位按是否具有某种属性划分为两组,即“是”与“非”的两组。如将学生按性别分组,将产品按合格与否分组。又如在民意调查中,将被调查者按是否支持某位侯选人或是否赞成某项政策分为两组等等。79(1)比例的概念 比例是指具有某种性质或属性的单位数占总体全部单位数的比重,记为 P。N1总体中具有某一属性的单位数;N 总体单位总数。如产品中的次品率;全部人口或某单位职工中男、女的比率;某地区全部家庭中高(如月收入10000元)、中、低(月收入1000元)收入家庭各占的比重等。NNP180(2)比例的平均数 要计算比例的平均数,需要将是非标志的标志
41、表现进行量化处理。记 1代表具有某种属性的标志表现 0代表不具有该属性的标志表现 N1总体中具有该属性的单位数 N0总体中不具有该属性的单位数 N 总体单位总数 则由加权算术平均数的计算公式,成数的平均数为iiipffxxNNN0101NN1P可知,比例的平均数就是其本身比例的平均数就是其本身。81(3)比例的方差和标准差,由分组数据方差的计算公式:2P记比例的方差为iiiPffxx22)(NNPNNP0212)1()1)(1(PPPP)1()1(22PPPP)1(PP成数的标准差:当 P=0.5时,成数的标准差达到最大值,即5.05.05.0PNNPNP0212)0()1()1(PPP 82
42、 总体分布的特征不仅与均值和变异指标有关,而且与分布的偏斜程度有关,如对称分布、右偏分布和左偏分布。这种分布形态上的数量特征,往往具有重要的社会经济意义。偏度系数是度量偏斜程度的指标,主要有以下两种计算方法:一、用标准差为单位计量的偏度系数 该偏度系数记为SK,计算公式为 SK是无量纲的量,取值通常在-3+3之间,其绝对值越大,表明偏斜程度越大。当分布呈右偏态时,SK0,故也称正偏态;当分布为左偏态时,SK0,故也称负偏态。但除非是分组频数分布数据,否则SK公式中的众数M0有很大的随 2.3 度量离散程度的指标度量离散程度的指标0MXSK83二、使用三阶中心矩计量的偏度系数 该偏度系数是用三阶
43、中心矩除以标准差的三次方来度量偏斜程度,记为,计算公式为 称为三阶中心矩。偏度系数 可以适用任何数据。和SK的计算方法不同,因此根据同一资料计算的结果也不相同。可以使用Excel统计函数中的SKEW函数返回数据的偏度系数,语法规则如下:格式:SKEW(,)功能:返回所有参数中数据的偏度系数。33m33)(1 XXNmi84使用 Excel 求各种统计指标 当数据量很大时,手工计算统计指标是非常烦琐的,尤其是标准差、方差数等的计算量很大。使用Excel【工具】“数据分析”“描述统计”功能,可以方便地计算出各种综合统计指标。85 本章教学目标:本章教学目标:n简要介绍概率的基础知识,主要供学员回顾
44、复习概率知识的参考,为统计学内容的学习提供所需的基础知识;n掌握查各种概率分布表时Excel统计函数的使用;n能运用概率知识解决企业经营管理中的实际问题。n运用动态模拟方法验证中心极限定理;n项目投资决策的应用案例分析。第第3章章 概率基础与风险决策概率基础与风险决策86本章主要内容本章主要内容3.1 随机试验与随机事件3.2 概 率3.3 随机变量及其分布函数3.4 离散型随机变量3.5 连续型随机变量3.6 数学期望和方差3.7 中心极限定理项目投资决策案例分析 本章内容的重点:条件概率、事件的独立性、二项分布、正态分布、Excel统计函数的使用。87 在市场经济环境下,企业所面临的是充满
45、不确定因素的市场经济环境,企业的任何决策都存在不同程度的风险。正确的决策可以为企业带来巨大的经济效益和发展机遇,但重大的决策失误也会给企业造成巨大的经济损失,并有可能使企业从此陷入困境甚至破产倒闭。因此,如何提高决策的科学性,并尽可能降低和规避决策的风险,是所有企业的高层经营管理决策者都面临的共性问题。利用概率论的知识,可以帮助决策者进行风险型决策分析,利用所能获得的各种信息,还可以大大降低决策的风险程度,尽可能避免重大的经济损失,并为企业带来可观的经济效益和良好的发展机遇。序言序言88项目投资决策案例项目投资决策案例光大电器公司开发了一种新型洗衣机,生产该洗衣机的经济规模为100万台/年,需
46、要投入的生产线设备、模具、工装等固定投资费用为2000万元,项目的建设期为一年,固定投资费用在建设期初一次投入。产品投产时还需投入生产流动资金1000万元。由于洗衣机产品的技术进步较快,估计该产品的市场寿命期为5年,5年末固定资产残值为固定投资额的20%,流动资金可在寿命期末全部收回。由于洗衣机的市场竞争非常激烈,该新型洗衣机投入生产后的经济效益具有很大的不确定性。为了提高产品投资决策的科学性,该公司在决定是否投资生产该新型洗衣机之前,进行了一些市场调查预测和项目的经济可行性研究。89 市场调查和预测分析估计,产品上市后销售量将达到生产能力的80%以上(畅销)、50%80%(销售一般)、不足5
47、0%(滞销)的可能性分别为40%、30%、30%。另经财务部门所作的财务预测分析,在产品出现”滞销”、”一般”和”畅销”三种销售状况下,该项目投产后的年净现金流量将分别为100万元、600万元和1000万元。考虑到筹资成本和资金的机会成本,贴现率应取6%。90销售部经理的建议销售部经理的建议为使对该新产品项目的投资决策更具科学性,总经理召开了有销售、生产、财务、技术等部门负责人参加的会议。会上销售部经理建议,为减小决策风险,应在决定是否投资生产前先利用原有设备进行少量试生产(100台),并将试生产的洗衣机免费赠送给不同地区的一些用户进行为期3个月的试用,以取得用户的反馈信息。为此,销售部经理还
48、设计了用户试用后的信息反馈表,包括功能、使用效果、方便程度、外观、可靠性五大类共25个指标,每项指标都由用户按15分打分,加权平均后的满分为100分。根据用户试用后反馈结果的总平均分,可将用户对该洗衣机的评价分为”不满意”(低于60分)、”尚可”(6090分)和”满意”(高于90分)三种可能结果。91 销售部经理认为,为减少决策风险,应根据对用户试用反馈情况进行分析后再作是否投资生产该洗衣机的决定。销售部经理还提供了过去许多企业在产品正式投产之前采用类似试用或试销方法的用户反馈结果与产品正式生产上市后销售状况之间的统计数据,见表1.1 表1.销售状况与试用结果间的统计资料销售状况试用结果滞销一
49、般畅销不满意14(0.7)6(0.3)2(0.1)尚可5(0.25)8(0.4)6(0.3)满意1(0.05)6(0.3)12(0.6)合计20(1.0)20(1.0)20(1.0)2 0(92如何进行科学决策?如何进行科学决策?总经理指示财务部经理对销售部经理所提方案的费用进行估算。在下一次的会议上,财务部经理给出了试生产、分发用户试用及收集用户反馈信息等项工作的总费用估算结果,估计需要100万元。会上有人提出是否值得花100万元进行试生产并免费赠送用户试用,并展开了激烈的争论。总经理希望能对各种可行方案的风险及经济效益进行科学的分析与评价。93 以上案例属于“有追加信息的风险型决策”问题,
50、案例的分析需要用到一些概率知识,包括条件概率、全概率公式、贝叶斯公式和数学期望等,以及项目净现值等知识。在本章的最后一节,我们将运用所学的概率知识对该例进行分析,并且还将讨论信息的价值问题。943.1 随机试验与随机事件随机试验与随机事件 一随机试验随机试验 人们在研究经济管理以及其他社会问题中,通常总是通过调查或对社会现象的观察来获取所研究问题的有关数据;在自然科学领域中,人们也是通过科学实验或对自然现象的观察来获取所需要的资料。对社会现象的观察和对自然现象的科学实验在概率论和统计学中都统称为试验。如果试验可在相同的条件下重复进行,而且试验的结果不止一个,每次试验前不能确定将会出现哪一结果,