1、统计学的哲学思考统计学的魅力(一)统计学的魅力(一)n我们来打一个赌:我们来打一个赌:n我赌咱们班全部同学中我赌咱们班全部同学中, ,至少至少有两个人的生日是同月同日!有两个人的生日是同月同日!n甚至有可能是同年同于同日!甚至有可能是同年同于同日!同一天生日概率对照表人数人数101023233030454560606060概率概率0.10.10.50.50.670.670.730.730.950.951 1有趣的实验n从装有相同个数的黑球和白球的口袋中一个从装有相同个数的黑球和白球的口袋中一个 个地取球个地取球,取后放回取后放回,记记0为取得黑球为取得黑球,1为取得为取得白球白球;到内蒙古医院
2、到内蒙古医院,观察并记录相继在观察并记录相继在 该院出生的婴儿的性别该院出生的婴儿的性别.记记M为男婴为男婴,F为女婴为女婴.n我们则得到一个如投掷硬币或随机重复取球我们则得到一个如投掷硬币或随机重复取球所得到的相同的二元符号列所得到的相同的二元符号列.这些随机列,一这些随机列,一个是生物学现象白然产生的,另一个是人为个是生物学现象白然产生的,另一个是人为产生的产生的.n大家猜想一下:两者之间有何关系吗?大家猜想一下:两者之间有何关系吗?频数分布频数分布数数频数频数期望值期望值男婴男婴白球白球0 05 54 46.256.251 12727343431.2531.252 26464656562
3、.5062.503 36565707062.5062.504 43030222231.2531.255 59 95 56.256.25合计合计200200200200200.00200.00卡方卡方检验检验2.222.225.045.04 统计学的魅力(二)统计学的魅力(二)n上帝投掷硬币来决定人的性别上帝投掷硬币来决定人的性别!统计的魅力(三)统计的魅力(三)-悲哀的数字悲哀的数字原因原因少活天数少活天数原因原因少活天数少活天数未结婚(男性)未结婚(男性)35003500 饮酒饮酒130130未结婚(女性)未结婚(女性)16001600 枪炮事故枪炮事故1111惯用左手惯用左手3285328
4、5 自然放射线自然放射线8 830%30%超重超重13001300 医疗医疗X-X-射线射线6 620%20%超重超重900900 咖啡咖啡6 6吸香烟(男性)吸香烟(男性)22502250 口服避孕药口服避孕药5 5吸香烟(女性)吸香烟(女性)800800 减肥饮料减肥饮料2 2抽雪茄抽雪茄330330 PAPPAP检验检验4 4用烟斗抽烟丝用烟斗抽烟丝220220 家里有烟雾警报家里有烟雾警报1010危险工作,事故危险工作,事故300300 带有气垫的轿车带有气垫的轿车5050一般工作,事故一般工作,事故7474 移动冠状动脉监护器移动冠状动脉监护器125125注:数据来源于Cohen &
5、 Lee(1979)的文章什么是统计学什么是统计学n1. 统计工作统计工作n收集数据的活动收集数据的活动n2. 统计数据统计数据对现象计量的结果对现象计量的结果 n3. 统计学统计学n分析数据的方法与技分析数据的方法与技术术漫画统计n它是一种由经验到理性的认识,是一种它是一种由经验到理性的认识,是一种运用偶然发现规律的科学,无序中深藏运用偶然发现规律的科学,无序中深藏有序,偶然中蕴含必然,这是属于统计有序,偶然中蕴含必然,这是属于统计学的哲学;统计是动态的历史,历史是学的哲学;统计是动态的历史,历史是静态的统计。静态的统计。n统计学思想远古即存统计学思想远古即存,但作为一门学科历史却不长但作为
6、一门学科历史却不长.统统计学无处不在计学无处不在,无论在解开自然奥秘的科学调查中无论在解开自然奥秘的科学调查中,或或是要在日常生活中做出最佳决策或者要解决法庭争端是要在日常生活中做出最佳决策或者要解决法庭争端时时,统计学都是一种探求真理的必不可少的工具统计学都是一种探求真理的必不可少的工具.n我们都生活在信息时代我们都生活在信息时代,大多数的信息都是以量化的形大多数的信息都是以量化的形式传播的式传播的.例如例如:今年的犯罪率与前一年相比下降了今年的犯罪率与前一年相比下降了10%;明天有明天有30%的可能要下雨的可能要下雨;股票市场的道股票市场的道琼斯琼斯指数价格增加了指数价格增加了50点点;世
7、界上每世界上每4个新生婴儿中有一个个新生婴儿中有一个是中国人是中国人; 如果你坚持独身如果你坚持独身,你的寿命要减少你的寿命要减少8年年.所有所有这些数字对一般公众来说到底意味着什么呢这些数字对一般公众来说到底意味着什么呢?这些数这些数字里面包含什么样的信息会有助于个人做出正确决策字里面包含什么样的信息会有助于个人做出正确决策去改进提高他们的生活质量呢去改进提高他们的生活质量呢? 漫话统计n统计学不只是一种方法或技术,还含有世界观的统计学不只是一种方法或技术,还含有世界观的成分成分它是看待世界上万事千物的一种方法,它是看待世界上万事千物的一种方法,我们常讲某事从统计观点看如何如何,指的就是我们
8、常讲某事从统计观点看如何如何,指的就是这个意思。但统计思想(或观点)的养成,不但这个意思。但统计思想(或观点)的养成,不但需要学习一些具体的指示,还要能够从发展的眼需要学习一些具体的指示,还要能够从发展的眼光,把这些指示连缀成一个有机的、清晰的图景,光,把这些指示连缀成一个有机的、清晰的图景,获得一种历史的厚重感。获得一种历史的厚重感。n 陈希孺陈希孺数理统计简史数理统计简史湖南教育出版社,湖南教育出版社,2002n统计学没有任何固有的对象,是一门独特的学统计学没有任何固有的对象,是一门独特的学问。统计学由解决其他领域内的问题而存在并问。统计学由解决其他领域内的问题而存在并兴旺发达兴旺发达.按
9、萨维奇按萨维奇(L.J.Savage)的说法的说法: 统计中的哲学惊人的巧合n 在一篇发表于美国统计学会杂志在一篇发表于美国统计学会杂志(Journal of the American statistical Association, Vol. 84 , p. 853-880)的文的文章中,两个哈佛大学的教授,戴肯斯章中,两个哈佛大学的教授,戴肯斯(Diaconis)和莫和莫斯特雷斯特雷(Mosteller)证明犷绝大多数的巧合(如一度作证明犷绝大多数的巧合(如一度作为一惊人事件报道的美国某地某人在为一惊人事件报道的美国某地某人在4个月内赢了个月内赢了两次彩票)是在一定时间内以相当小的概率发生
10、的。两次彩票)是在一定时间内以相当小的概率发生的。n 统计学中存在一种法则,它是这样叙述的统计学中存在一种法则,它是这样叙述的:一次一次实验中以很小的机会发生的事件,当样本足够大时实验中以很小的机会发生的事件,当样本足够大时必然会发生,并可以在任何时候发生而不需要归因必然会发生,并可以在任何时候发生而不需要归因于任何特别的理由。于任何特别的理由。无序中的有序n就像原子和分子的个体游动一样,尽管单个水平就像原子和分子的个体游动一样,尽管单个水平下的游动存在不确定性,但对大量个体活动的平下的游动存在不确定性,但对大量个体活动的平均行动来说,我们可以观察到某种稳定性,即会均行动来说,我们可以观察到某
11、种稳定性,即会出现出现“无序中的有序无序中的有序”.概率论中存在被称为大数概率论中存在被称为大数律的命题,这个命题解释了这种现象律的命题,这个命题解释了这种现象.大数律断言,大数律断言,一个系统中多个个体平均行为所显示的不确定性一个系统中多个个体平均行为所显示的不确定性将会随着个体总数的不断增加而逐渐减少,因而将会随着个体总数的不断增加而逐渐减少,因而可以把这个系统作为一个整体,其表现的几乎是可以把这个系统作为一个整体,其表现的几乎是决定性的现象,决定性的现象,“越多越保险越多越保险”这句名言,确实这句名言,确实有一个很强的理论基础。有一个很强的理论基础。n大数定律最经典应用:人寿保险。大数定
12、律最经典应用:人寿保险。随机中的确定性n波利亚波利亚(Polya)的一段有关一个医生的趣闻例证了一种被的一段有关一个医生的趣闻例证了一种被称为称为“赌徒误解赌徒误解”的说法。这个医生安慰他的病人说的说法。这个医生安慰他的病人说:你患了一种非常严重的病,患这种病的人只有十分之一你患了一种非常严重的病,患这种病的人只有十分之一能活下来。但是你不必担心,你到我这儿来看病是十分能活下来。但是你不必担心,你到我这儿来看病是十分幸运的,因为最近有九个患你这种病的人到我这儿来治幸运的,因为最近有九个患你这种病的人到我这儿来治疗,他们都去世了。疗,他们都去世了。n德国哲学家马比德国哲学家马比(Karl Mar
13、be,1916)就非常坚持这种观点就非常坚持这种观点.基于他调查的巴伐利亚州的基于他调查的巴伐利亚州的4个城镇个城镇200 000个人的出个人的出生记录,他总结到生记录,他总结到:如果过去几天连续出生的女婴相当如果过去几天连续出生的女婴相当多的话,就会增加一对夫妇得到男婴的机会。多的话,就会增加一对夫妇得到男婴的机会。n另一种与马比的统计安定论类似的观点是另另一种与马比的统计安定论类似的观点是另一个哲学家斯特任格尔一个哲学家斯特任格尔(O.Sterzinger,1911)提提出的出的“累计理论累计理论”。这一观点形成。这一观点形成“链法链法则则”,或者说同事件在短时间内容易连续发,或者说同事件
14、在短时间内容易连续发生这趋势的理论基础。生物学家卡默雷尔生这趋势的理论基础。生物学家卡默雷尔(P.Kammerer,1919)把这种观点公式化了。谚把这种观点公式化了。谚语说语说“祸不单行祸不单行”,人们总是真诚地接受这,人们总是真诚地接受这个观点并用于一切场合。个观点并用于一切场合。随机中的确定性不确定性知识不确定性知识+所含不确定性量度的知识所含不确定性量度的知识=可用的知识可用的知识一、平均数中庸法则 平均数, 是代表一个群体特性的集中趋势。人生一切行为, 应以中庸为法则, 既不可过分自我膨胀, 也不宜过分自我矮化。认为: 二、变异数谨慎法则 变异数是指一个群体特性相互差异的程度。人生路上也是高低不平,所谓“世道崎岖,人心险恶”。我们必须有“居安思危”的警觉,处处小心谨慎。认为: 三、随机抽样公平法则随机抽样,即是在有限的人力、财力下,以较少样本之特征值,借以推测大量群体之现象。人生有许多事, 可用随机抽样方法之旨处理, 以收事半功倍之效。认为: 四、常态分配自然法则在统计学中最重要的连续机率分配, 其图形称为常态曲线(钟形) , 在自然界出现许多资料, 皆用此曲线描述。人生应以自然为法则, 自强不息, 并应建立中心信仰, 以为指针。 统计学给予我们人生智慧的启发是: