1、123456789101112131415统计数据数据161718*19*2021统计方法统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验222350个计算机购买者所购买的个计算机购买者所购买的不同品牌的机型数据不同品牌的机型数据Table,Data from a sample of 50 computer purchases(11/15,1994)IBMIBMPackard BellCompaqIBMPackard BellGateway200Packard BellCompaqCompaqGateway200Packard BellIBMAppleCompaqIBM
2、Packard BellAppleAppleCompaqGateway2000CompaqPackard BellCompaqCompaqApplePackard BellPackard BellAppleIBMIBMAppleAppleGateway2000Packard BellAppleAppleIBMAppleIBMPackard BellAppleCompaqAppleCompaqPackard BellGateway200CompaqAppleCompaq24频数频数2526平均平均122.98122.98标准误差标准误差1.141.14中值中值(中位数中位数)123123模式模式
3、(众数众数)122122标准偏差标准偏差8.038.03样本方差样本方差64.4364.43峰值峰值-0.41-0.41偏斜度偏斜度0.000.00区域区域(极差极差)3232最小值最小值107107最大值最大值139139求和求和61496149计数计数5050最大(1)最大(1)139139最小(1)最小(1)107107置信度(9 5.0%)置信度(9 5.0%)2.282.282728统计中的几个基本概念统计中的几个基本概念29303132定序变量定序变量定类变量定类变量数值变量数值变量33自然、明确和无异议的变量的每个值视为个体概念不唯一3435统计中的几个基本概念统计中的几个基本概
4、念36373839*40*41*42*43444546474849Leonhard Euler(欧欧 拉拉)(1707-1783)Thom as Robert M althus(马马 尔尔 萨萨 斯斯)(1766-1834)Pierre Sim on Laplace(拉拉 普普 拉拉 斯斯)(1749-1827)Johann Gregor M endel(孟孟 德德 尔尔)(1822-1884)Friedrich Gauss(高高 斯斯)(1777-1855)统统 计计 学学 家家 是是 科科 学学 家家5051525354555657*585960*61幸存者偏差(survivorship
5、bias)1941年,英国皇家空军的作战指挥官拜访了美国哥伦比亚大学著名统计学 家沃德 教授(Abraham Wald),请求他协助英国皇家空军改善飞机防弹能力!沃德接下这个紧急研究案,他分析德国地面炮火击中联军轰炸机的资料后,以统计专家的身份建议机体装甲应该如何加强,才能降低被炮火击落的机会。但依照当时的航空技术,机体装甲只能局部加强,否则机体过重,会导致起飞困难及操控迟钝。沃德将联军轰炸机的弹着点资料,描绘成两张比较表,发现机翼是最容易被击中的部位,而飞行员的座舱与机尾,则是最少被击中的部位。但在研究成果报告的会议上,负责该项目的作战指挥官说:“沃德 教授的研究清楚地显示,联军轰炸机的机翼
6、,弹孔密密麻麻,最容易中弹。因此,我们应该加强机翼的装甲”。沃德客气但坚定地说:“将军,我尊敬你在飞行上的专业,但我有完全不同的看法,我建议加强飞行员座舱与机尾发动机部位的装甲,因为那儿最少发现弹孔”。在全场错愕怀疑的眼光中,沃德解释说:“我所分析的样本中,只包含顺利返回基地的轰炸机。从统计的观点来看,我认为被多次击中机翼的轰炸机,似乎还是能够安全返航,而飞机很少发现弹着点的部位,并非真的不会中弹,而是一旦中弹,根本就无法返航”。指挥官反驳说:“我很佩服沃德教授没有任何飞行经验,就敢做这么大胆的推论,就我个人而言,过去在执行任务时,也曾多次机翼中弹严重受创,要不是我飞行技术老到,运气也不错,早
7、就机毁人亡了,所以,我依然强烈主张应该加强机翼的装甲”。这两种意见僵持不下,皇家空军部部长陷入苦思。他到底要相信这个作战经验丰富的飞将军,还是要相信一个独排众议的统计学家?由于战况紧急,无法做更进一步的研究,部长决定接受沃德的建议,立刻加强驾驶舱与机尾发动机的防御装甲。不久之后,联军轰炸机被击落的比例,果然显著降低。为了确认这个决策的正确性,一段时间后,英国军方动用了敌后工作人员,搜集了部份坠毁在德国境内的联军飞机残骸,他们中弹的部位,果真如沃德所预料,主要集中在驾驶舱与发动机的位置。看不见的弹痕最致命乍看之下,作战指挥官加强机翼装甲的决定十分合理,但他忽略了一个事实:弹着点的分布,是一种严重
8、偏误的资料。因为最关键的资料,其实是在被击落的飞机身上,但这些飞机却无法被观察到,因此,布满了弹痕的机翼,反而是飞机最强韧的部位。空军作战指挥官差点因为太重视“看得见”的弹痕,反而做出错误的决策。62死掉或被俘的人无法发表意见第一,搜集更多资料,并不会改善决策品质。由于弹痕资料的来源本身就有严重的偏误,努力搜集更多的资料,恐怕只会更加深原有的误解。第二,召集更多作战经验丰富的飞行员来提供专业意见,也不能改善决策品质,因为这些飞行员,正是产生偏误资料过程中的一环。他们都是安全回航的飞行员,虽然可能有机翼中弹的经验,但都不是驾驶舱或发动机中弹的“烈士”。简单的说,当他们愈认真凝视那些“看得到”的弹
9、痕,他们离真相就愈远。信息界有所谓“Garbage In,Garbage Out”,前提(或假设)若是错误,再漂亮的统计算式或方法、再多的资料,也不能让后面的推论变得正确。在管理实务与日常生活中,许多关键的资料,也像上述轰炸机的个案一样,会因为“失败”而观察不到。63幸存者偏差(survivorship bias),另译为“生存者偏差”或“存活者偏差”。当取得信息的渠道仅来自于“幸存者”时,此信息可能会存在与实际情况不同的偏差。常见于投资理财之节目或文章。例如:当投资理财类电视节目仅邀请投资成功者上节目谈论其成功投资之经验,观众会将该成功投资者投资之方式,视为高成功率之投资方式,但观众并不会在电视节目看到以相同或类似投资方式,但最后失败的投资者,因而高估此投资方式之成功机率。如果有一位100岁的老人在电视上说,他就是靠每天抽一包烟、嚼一包槟榔才能长寿,请勿盲从。生活中的幸存者偏差64结结 束束