1、经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 1 - 1 - 1 1 1经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 2数理统计统计学经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 3经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 4经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 5经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 6 统计学起源于收集数据的活动,小至个人的事情,大至治理一个国家,都有必要收集种种有关的数据,如在我国古代典籍中,就有不少关于户口、钱粮、兵役、地震、水灾和旱灾等等的记
2、载。现今各国都设有统计局或相当的机构。当然,单是收集、记录数据这种活动本身并不能等同于统计学这门科学的建立,需要对收集来的数据进行排比、整理,用精炼和醒目的形式表达,在这个基础上对所研究的事物进行定量或定性估计、描述和解释,并预测其在未来可能的发展状况。例如根据人口普查或抽样调查的资料对我国人口状况进行描述,根据适当的抽样调查结果,对受教育年限与收入的关系,对某种生活习惯与嗜好(如吸烟)与健康的关系作定量的评估。根据以往一般时间某项或某些经济指标的变化情况,预测其在未来一般时间的走向等,做这些事情的理论与方法,才能构成一门学问数理统计学的内容。 经济、管理经济、管理基础课程基础课程统计学原理统
3、计学原理1 - 7 这样的统计学始于何时?恐怕难于找到一个明显的、大家公认的起点。一种受到某些著名学者支持的观点认为,英国学者葛朗特在1662年发表的著作关于死亡公报的自然和政治观察,标志着这门学科的诞生。中世纪欧洲流行黑死病,死亡的人不少。自1604年起,伦敦教会每周发表一次“死亡公报”,记录该周内死亡的人的姓名、年龄、性别、死因。以后还包括该周的出生情况依据受洗的人的名单,这基本上可以反映出生的情况。几十年来,积累了很多资料,葛朗特是第一个对这一庞大的资料加以整理和利用的人,他原是一个小店主的儿子,后来子承父业,靠自学成才。他因这一部著作被选入当年成立的英国皇家学会,反映学术界对他这一著作
4、的承认和重视。 图1英国约克大学葛朗特图2 帕齐利 经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 8 这是一本篇幅很小的著作,主要内容为8个表,从今天的观点看,这只是一种例行的数据整理工作,但在当时则是有原创性的科研成果,其中所提出的一些概念,在某种程度上可以说沿用至今,如数据简约(大量的、杂乱无章的数据,须注过整理、约化,才能突出其中所包含的信息)、频率稳定性(一定的事件,如“生男”、“生女”,在较长时期中有一个基本稳定的比率,这是进行统计性推断的基础)、数据纠错、生命表(反映人群中寿命分布的情况,至今仍是保险与精算的基础概念)等。 葛朗特的方法被他同时代的政治经济学家佩蒂
5、引进到社会经济问题的研究中,他提倡在这类问题的研究中不能尚空谈,要让实际数据说话,他的工作总结在他去世后于1690年出版的政治算术一书中。 经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 9图4:高斯 当然,也应当指出,他们的工作还停留在描述性的阶,不是现代意义下的数理统计学,那时,概率论尚处在萌芽的阶段,不足以给数理统计学的发展提供充分的理论支持,但不能由此否定他们工作的重大意义,作为现代数理统计学发展的几个源头之一,他们以及后续学者在人口、社会、经济等领域的工作,特别是比利时天文学家兼统计学家凯特勒19世纪的工作,对促成现代数理统计学的诞生起了很大的作用。 数理统计学的另一
6、个重要源头来自天文和测地学中的误差分析问题。早期,测量工具的精度不高,人们希望通过多次量测获取更多的数据,以便得到对量测对象的精度更图3 拉普拉斯 经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 10 高的估计值。量测误差有随机性,适合于用概率论即统计的方法处理,远至伽利略就做过这方面的工作,他对测量误差的性态作了一般性的描述,法国大数学家拉普拉斯曾对这个问题进行了长时间的研究,现今概率论中著名的“拉普拉斯分布”,即是他在这研究中的一个产物,这方面最著名且影响深远的研究成果有二:一是法国数学家兼天文家勒让德19世纪初(1805)在研究慧星轨道计算时发明的“最小二乘法”,他在估计
7、过巴黎的子午线长这一工作中,曾使用这个方法。现今著作中把这一方法的发明归功于高斯,但高斯使用这一方法最早见诸文字是1809年,比勒让德晚。一种现在逐步取得公认这项发明系由二人独立做出,看来使比较妥当的。另外一个重要成果是德国大学者高斯1809年在研究行星绕日运动时提出用正态分布刻画测量误差的分布。正态分布也常称为高斯分布,其曲线是钟形,极象颐和园中玉带桥那样的形状,故有时又称为“钟形曲线”,它反映了这样一种极普通的情况:天下形经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 11图4:高斯 图5:连续型随机变量 天下形形色色的事物中,“两头小,中间大”的居多,如人的身高,太高太矮
8、的都不多,而居于中间者占多数当然,这只是一个极粗略的描述,要作出准确的描述,须动用高等数学的知识。正是其数学上的特性成为其广泛应用的根据。 正态分布在数理统计学中占有极重要的地位,现今仍在常用的许多统计方法,就是建立在“所研究的量具有或近似地具有正态分布”这个假定的基础上,而经验和理论(概率论中所谓“中心极限定理”)都表明这个假定的现实性,现实世界许多现象看来是杂乱无章的,如不同的人有不同的身高、体重。大批生产的产品,其质量指标各有差异 。看来毫无规则,但它们在总体上服从正态分布。这一点,显示在纷乱中有一种秩序存在,提出正态分布的高斯,一生在多个领域里面有不少重大的贡献,但在德国10马克的有高
9、斯图像的钞票上,单只画出了正态曲线,以此可以看出人们对他这一贡献评价之高。 经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 12 20世纪以前数理统计学发展的一个重要成果,是19世纪后期由英国遗传学家兼统计学家高尔顿发起,并经现代统计学的奠基人之一K皮尔逊和其他一些英国学者所发展的统计相关与回归理论。所谓统计相关,是指一种非决定性的关系如人的身高X与体重Y,存在一种大致的关系,表现在X大(小)时,Y也倾向于大(小),但非决定性的:由X并不能决定Y。现实生活中和各种科技领域中,这种例子很多,如受教育年限与收入的关系,经济发展水平与人口增长速度的关系等,都是属于这种性质,统计相关的
10、理论把这种关系的程度加以量化,而统计回归则是把有统计相关的变量,如上文的身高X和体重Y的关系的形式作近似的估计,称为回归方程,现实世界中的现象往往涉及众多变量,它们之间有错综复杂的关系,且许多属于非决定性质,相关回归理论的发明,提供了一种通过实际观察去对这种关系进行定量研究的工具,有着重大的认识和实用意义。 经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 13 到20世纪初年,由于上述几个方面的发展,数理统计学已积累了很丰富的成果在此因篇幅关系,我们不能详尽无遗地一一列举有关的重要成果,如抽样调查的理论和方法方面的进展,但是直到这时为止,我们还不能说现代意义下的数理统计学已经建
11、立起来,其主要标志之一就是这门学问还缺乏一个统一的理论框架,这个任务在20世纪上半叶得以完成,狭义一点说可界定在19211938年,起主要作用的是几位大师级的人物,特别是英国的费歇尔K皮尔逊,发展统计假设检验理论的奈曼与E皮尔逊和提出统计决策函数理论的瓦尔德等。我国已故著名统计学家许宝(19101970)在这项工作中也卓有建树。 自二战结束迄今,数理统计学有了迅猛的发展,主要有以下三方面的原因:一是数理统计学理论框架的建立以及概率论和数学工具的进展,为统计理论在面上和向纵深的发展打开了门径和提供了手段,许多在早期比较粗略的理论和方法,在理论上得到了完善与深入,并不断提出新的经济、管理经济、管理
12、基础课程基础课程统计学原理统计学原理1 - 14论和方法,在理论上得到了完善与深入,并不断提出新的研究课题;二是实用上的需要,不断提出了复杂的问题与模型,吸引了学者们的研究兴趣;三是电子计算机的发明与普及应用,一方面提供了必要的计算工具统计方法的实施往往涉及大量数据的处理与运算,用人力无法在合理的时间内完成,所以在早年,一些统计方法人们虽然知道,但很少付诸实用,就因为是人力所难及。计算机的出现解决了这个问题。而赋予统计方法以现实的生命力。同时,计算机对促进统计理论研究也有助益,统计模拟是其表现之一,在承认上述成就的同时,不少统计学家也指出这一时期发展中出现的一些问题或偏向,其中主要的一点是,数
13、理统计学理论研究中的“数学化”气味愈来愈重,相当一部分研究工作停留在数学的层面,早期那种理论研究与现实问题密切结合的优良传统有所淡化,一些学者还提出了补救的建议,对未来统计学发展的方向进行探讨。同时,现实问题愈来愈涉及到大量的,结构复杂的数据,按现行的数理统计学规范去处理,显得力所不及,需要一些带有根本性创新的思路,使统计学的发展登上一个新的台阶,以适应应用上的需要,考虑这一背景,有的统计学家乐观地认为数理统计学正面临一个新的突破。 经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 15 在上面讲述数理统计学的发展状况时,我们着重在实际 需要所起的促进作用方面,由于概率论的概念和
14、方法是数 理统计学的理论基础,概率论的进展也必然对数理统计学 的发展起促进作用。 概率,又称几率,或然率,指一种不确定的情况出现可能性的大小,例如,投掷一个硬币,“出现国徽”(国徽一面朝上)是一个不确定的情况。因为投掷前,我们无法确定所指情况(“出现国徽”)发生与否,若硬币是均匀的且投掷有充分的高度,则两面的出现机会均等,我们说“出现国徽”的概率是1/2;同时,投掷一个均匀骰子,“出现4点”的概率是1/6,除了这些以及类似的简单情况外,概率的计算不容易,往往需要一些理论上的假定,在现实生活中则往往用经验的方法确定概率,例如某地区有N人,查得其中患某种疾病者有M人,则称该地区的人患该种疾病的概率
15、为M/N,这事实上是使用统计方法对发病概率的一个估计。 经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 16 概率的概念起源于中世纪以来的欧洲流行的用骰子赌博,这一点不难理解,某种情况出现可能性的大小要能够体察并引起研究的兴趣,必须满足两个条件:一是该情况可以在多次重复中被观察其发生与否(在多次重复下出现较频繁的情况有更大的概率),一是该情况发生与否与当事人的利益有关或为其兴趣关注之所在,用骰子赌博满足这些条件。 当时有一个“分赌本问题”曾引起热烈的讨论,并经历了长达一百多年才得到正确的解决。在这过程中孕育了概率论一些重要的基本概念,举该问题的一个简单情况:甲、乙二人赌博,各出
16、赌注30元,共60元,每局甲、乙胜的机会均等,都是1/2。约定:谁先胜满3局则他赢得全部赌注60元,现已赌完3局,甲2胜1负,而因故中断赌情,问这60元赌注该如何分给2人,才算公平,初看觉得应按2:1分配,即甲得40元,乙得20元,还有人提出了一些另外的解法,结果都不正确,正确的分法应考虑到如在这基础上继续赌下去,甲、乙最终获胜的机会如何,至多再赌2局即可分出胜负,这2局有4种可能结果:甲甲、甲乙、乙甲、乙乙。前3种情况都是甲最后取胜,只有最后一种情况才是乙取胜,二者之比为3:1,故赌注的公平分配应按3:1的比例,即甲得45元,乙15元。经济、管理经济、管理基础课程基础课程统计学原理统计学原理
17、1 - 17 当时的一些学者,如惠更斯、巴斯噶、费尔马等人,对这类赌情问题进行了许多研究,有的出版了著作,如惠更斯的一本著作曾长期在欧洲作为概率论的教科书,这些研究使原始的概率和有关概念得到发展和深化。不过,在这个概率论的草创阶段,最重要的里程碑是伯努利的著作推测术。在他死后的1713年发表,这部著作除了总结前人关于赌情的概率问题的成果并有所提高外,还有一个极重要的内容,即如今以他的名字命名的“大数律”,大数律是关于(算术)平均值的定理,算术平均值,即若干个数X1、X2Xn之和除以n,是最常用的一种统计方法,人们经常使用并深信不疑。但其理论根据何在,并不易讲清楚, 就是伯努利的大数律要回答的问
18、题,在某种程度上可以说,这个大数律是整个概率论最基本的规律之一,也是数理统计学的理论基石。 概率论虽发端于赌博,但很快在现实生活中找到多方面的应用,首先是在人口、保险精算等方面,在其发展过程中出现了若干里程碑的机遇的原理,其第三版发表于1756年,法国大数学家拉普拉斯的分析概率论,发表于1812年,1933年苏联教学家柯尔莫哥洛夫完成了概率论的公理体系,在几条简洁的公理之下,发展出概率论整座的宏伟建筑,有如在欧几里得公理体系之下发展出整部几何。自那以来,概率论成长为现代数学的一个重要分支,使用了许多深刻和抽象的数学理论,在其影响下,数理统计的理论也日益向深化的方向发展。 经济、管理经济、管理基
19、础课程基础课程统计学原理统计学原理1 - 18查地图。明代人口普查的“户帖”和“黄册”。经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 19经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 20的“死亡公报”。经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 2119世纪末成立国际统计学会。统计方法也有很大发展,出现统计学。经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 22笼统地说,数理统计学的理论和方法,与人类活动的各个领域在不同程度上都有关联。因为各个领域内的活动,都得在不同的程度上与数据打交道。都有如何收集和分析数据的问题,因
20、此也就有数理统计学用武之地。我们可以举几个例子来说明这一点,如在工业中生产一种产品,首先有设计的问题,包括配方和工艺条件的选定,这要通过从大量可能的条件组合中,通过分析试验结果来选定,可能的条件组合很多,选择哪一部分去做试验是一个很有讲究的问题,在数理统计学中有一个专门分支叫“试验设计”,就是研究怎样在尽可能少的试验次数之下,达到尽可能高效率的分析结果;其次,在生产过程中,由于原材料,设备调整及工艺参数等条件可能的变化,而造成生产条件不正常并导致出现废品,在统计学中有一门“工序控制”的学问,通过在生产过程中随时收集数据并用统计方法进行处理,可以监测出不正常情况的出现以便随时加以纠正,避免出大的
21、问题;然后,大批量的产品生产出来后,还有一个通过抽样检验以检验其质量是否达到要求,是否可以出厂或为买方所接受的问题,处理这个问题也要使用数理统计方法,在我国现行的国家标准中有一些就与这个问题有关。 图1 股票分析系统 图2 经济统计分析 经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 23大的问题;然后,大批量的产品生产出来后,还有一个通过抽样检验以检验其质量是否达到要求,是否可以出厂或为买方所接受的问题,处理这个问题也要使用数理统计方法,在我国现行的国家标准中有一些就与这个问题有关。经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 24 在农业上,有关选种,耕作
22、条件,肥料选择等一系列的问题的解决,都与统计方法的应用有关,在历史上,现行的一些重要的统计设计与分析方法,就是近代最伟大的数理统计学家费歇尔于上世纪20年代在英国一个农业试验站工作时,因研究田间试验的问题而发明的。 医学与生物学是统计方法应用最多的领域之一,统计学是在有变异的数据中研究和发现统计规律的科学,就医学而言,人体变异是一个重要的因素,不同的人的情况千差万别,其对一种药物和治疗方法的反应也各不相同,因此,对一种药物和治疗方法的评价,是一种统计性规律的问题,不少国家对一种新药的上市和一种治疗方法的批准,都设定了很严格的试验和统计检验的要求,又如:许多生活习惯(如吸烟、饮酒、高盐饮食之类)
23、对健康的影响,环境污染对健康的影响,都要通过收集大量数据进行统计分析来研究。 对社会现象的研究大量地使用统计方法,因为组成社会的单元人、家庭、单位、地区等,都有很大的变异性,如果说,在自然现象中还不乏一些(在误差可以允许的限度内)严格的、确定性的规律,在社会现象中这种规律则绝少,因此只能从统计的角度去考察,我们常说,某某措施,某某政策,对大多数人是有利的,这就是一种统计性规律,因为这种“有利”是指对大多数,而非一切人。在20世纪初,就有统计学家研究过在英国几种救助贫困的方式的效果的评估,这都是借助抽样调查并通过复杂的统计分析得出的结果,如今,抽样调查已经成为研究社会现象的一种最有力的工具,因为
24、全面调查往往不可行,而抽样调查,从其方案的制定到数据的分析,都是以数理统计学的理论和方法为基础。 经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 25三、统计学发展前景展望三、统计学发展前景展望 这个问题在前面第一个问题中曾涉及一点。现在再简单的补充几句,前面曾提到,20世纪下半叶以来,由于人们对当时数理统计学发展中某些偏向进行反思,统计学界就不时地讨论到“统计学未来发展方向”这个问题,自20世纪70年代以来国际上有过一系列以此为主题或涉及此主题的学术会议,临近上世纪末,更有若干知名的统计学者撰文讨论这个问题,当今的情况是:对某些一般的原则性的问题有普遍的共识,但对未来统计学将
25、向那个方向发展或应当向那个方向发展这个问题,则不能说已有了广泛一致的看法和意见,下面只就几个比较有影响的观点来谈谈。 一个大家都同意的原则是,数理统计学的发展,应当继承和发扬早期那种与实际密切结合的优良传统,这不是否定理论研究的作用,而是提倡,理论研究的成果应当对分析实际数据有用,美国老一辈著名统计学家图基早在1960年代就提出,对于那种于分析数据无用的研究成果,其意义仅限于从纯数学的角度去评价。 另一种得到比较广泛认同的观点,是认同 统计学研究应努力与其他实用学科结合而形成交叉或边缘学科,这一点目前已有一定的表现,如生物统计、医药统计、工业统计、金融统计等,都是当前发展很快的热点,有的学者认
26、为 研究数理统计学必须与另一门专门学问结合,才有可能做出有重要意义的成果。这一点已在若干成功的学者身上得到印证,有个别走得更远的学者认为,统一的统计学将会因为与其他学科结合发展而分裂成许多并行的学科,好比一个大国分裂成一些小国,并把这称为统计学的巴尔干化与昔日巴尔干半岛上统一的南斯拉夫如今分裂为一些小国相比。但是,数理统计学与其他学科结合形成交叉学科这经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 26个引人注目的发展,是否将导致“统一的”或“一般的”统计学的消亡或衰落,这一点现在看来并不确定,至少多数学者现在还不这么认为。 图基在1962年在一篇长文中提出“数据分析”的思想,
27、几十年来得到国际上一些有影响的学者的支持,要全面讲清楚这种观点需要较多的篇幅,这里只就其一个核心的观点来讨论一下,这涉及到对现行的数理统计规范的地位问题,前面我们曾谈到,由于统计学处理的是带随机误差的数所,由分析这种数数据,得出的结论就有可能出错或不准确,出错的可能性的大小,不准确的程度如何,需要用概率论的概念和方法作定量的刻画,在研究统计问题时,必须把这作为一个目标,朝这个方向努力,这就是现行数理统计学的规范。数理统计学之所以能被承认为一门有严格理论基础的学科,是与遵守这一规范联系在一起的。但是,如果我们真的严格遵守这一规范,则以现在我们的知识水平而言,许多问题将无法下手。于是,学者们只好转
28、向一些人为的、不太复杂的、用现行数学工具可以处理的模型,这种模型往往有“闭门造车”的缺点而缺乏现实性,图基的“数据分析”思想的一个观点是,主张淡化这个规范。 经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 27 这种说法有一定的事实根据,可以说,在实用统计学的领域中,这个规范并不总是得到严格遵守的,现在我们有一些统计方法,它用起来有较好的效果,但在理论上并没有搞清楚其错误或偏差的可能性或数量有多大;另外,随着科技的发展,不断提出一些更复杂的模型,以我们现有的知识水平,没有可能对之作出完全符合上述规范的处理,而只能退而求其次,寻求一种在实用上可行的解法,当然,应当明确,在研究工作
29、中达不到上述规范,与从根本上取消或淡化这个规范是两回事,一门学科必须有其规范或科学的定位(回答这门学科是什么的问题,判定其成果的可信性与意义等等,而这不能用笼统的说法,必须用确切的科学语言)。如果用数据分析取代现行的数理统计学,就有一个为数据分析定位的问题,而这至今还没有一个满意的解决,以此之故,虽然数据分析的提法获得不少支持且在实际的统计应用中有所反映(例如现在媒体中常提及的“数据挖掘”Data Mining)。虽然,数据挖掘并不单纯是一个统计学课题,它至今尚未能动摇现行数理统计学的主流地位。 除了上述几种富于原则性的思想外,也有一部分学者致力于在现行统计学的框架下寻求新的生长点,在这方面也
30、有不少的讨论或争论,如关于费歇尔的统计学思想和研究成果的再认识,关于数理统计学中的“频率学派”与“贝叶斯学派”之间的争论等,因涉及较多的数学概念,不能在此细谈了。 我个人认为,由于统计学是一门有广泛应用的学科,应用问题的多面性,要求不拘一格的处理方法,应用效果的多目标性以及统计问题的“不完全信息”的性质(指数据并未包含与问题有关的完整信息),也决定了统计方法的发展不致受某一种思想所支配,因此,至少在可以预见的将来,统计学的进展将是一种“多元”的局面,不会出现某种趋势占绝对优势的情况。 经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 28统计设计统计设计收集数据收集数据整理与分析
31、整理与分析资料积累资料积累开发应用开发应用统计学理论与相关实质性学科理论统计调查、实验描述统计推断统计经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 29 对随机现象进行观测、试验, 以取得有代表性的观测值 对已取得的观测值进行整理、 分析,作出推断、决策,从而 找出所研究的对象的规律性数数理理统统计计的的分分类类描述统计学推断统计学数理统计的分类经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 30数参估计 (第二章) 假设检验 (第三章) 回归分析 (第四章) 方差分析 (第五章) 推断 统计学正交分析 (第六章) 经济、管理经济、管理基础课程基础课程统计学原
32、理统计学原理1 - 31总体总体 研究对象全体元素组成的集合 所研究的对象的某个(或某些)数量指标的全体,它是一个随机变量(或多维随机变量).记为X . X 的分布函数和数字特征称为总体的分布函数和数字特征.总体和样本 1.2 数理统计数理统计基本概念基本概念经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 32样本样本 从总体中抽取的部分个体.称 为总体 X 的一个容量为n的样本观测值,或称样本的一个实现.),(21nxxx),(21nXXX用 表示, n 为样本容量.样本空间样本空间 样本所有可能取值的集合. 个体个体 组成总体的每一个元素 即总体的每个数量指标,可看作随机变
33、量 X 的某个取值.用 表示.iX经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 33若总体 X 的样本 满足:),(21nXXX一般,对有限总体,放回抽样所得到的样本为简单随机样本,但使用不方便,常用不放回抽样代替.而代替的条件是nXXX,21(1) 与X 有相同的分布nXXX,21(2) 相互独立),(21nXXX则称 为简单随机样本.简单随机样本简单随机样本N / n 10.总体中个体总数总体中个体总数样本容量样本容量经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 34设总体 X 的分布函数为F (x),则样本niinxFxxxF121)(),(总若总体X
34、 的密 d.f.为 f( x),则样本niinxfxxxf121)(),(总的联合 d.f.为),(21nXXX的联合分布函数为经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 35例如: X1,X2,Xn 为取自总体 N(0,1) 的样本,则其联合密度函数 2211212),(ixninexxxf)exp()2(12212niixn经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 36例如例如 设某批产品共有N 个,其中的次品数为M, 其次品率为 NMp/若 p 是未知的,则可用抽样方法来估计它.所取的产品不是次品所取的产品是次品, 0, 1XX 服从参数为p 的
35、0-1分布,可用如下表示方法:1 , 0,)1 (),(1xpppxfxx从这批产品中任取一个产品,用随机变量X来描述它是否是次品:经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 37设有放回地抽取一个容量为 n 的样本),(21nXXX),(21nXXX的联合分布为niiniixnxniinppxfxxxf11)1 ()(),(121总),(21nxxx其样本值为, 2 , 1, 1 , 0),(21nixxxxin样本空间为经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 38若抽样是无放回的,则前次抽取的结果会影响后面抽取的结果.例如11) 11(12NMX
36、XP1) 01(12NMXXP所以, 当样本容量 n 与总体中个体数目N 相比很小时, 可将无放回抽样近似地看作放回抽样.ppNNN111ppNN11经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 39*2*121,) 1 (nnxxxxxx*1*111, 2 , 10)()2(nkknxxnkxxxnkxxxF 例例1(P147)随机地观测总体X 得8个数据:2.5,3,2.5,3.5,3,2.7,2.5,2,试求X 的一个经验分布函数。解解2 2.5 = 2.5 = 2.5 2.7 3 = 3 3.55 . 35 . 3337 . 27 . 25 . 25.22218/78
37、/58/48/10)(8xxxxxxxF经验分布函数经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 40 例例1 随机地观测总体X 得8个数据:2.5,3,2.5,3.5,3,2.7,2.5,2,试求X 的一个经验分布函数。解解2 2.5 = 2.5 = 2.5 2.7 3 = 3 0时收敛,称为函数,具有性质)(!) 1()2/1 (, 1) 1 (),() 1(Nnnnxxx)(2n的密度函数为自由度为 n 的经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 615101520250.10.20.30.4n=2n = 3n = 5n = 10n = 15经济、
38、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 62nnDnnE2)(,)(122例如例如)(,),(),(22122121222121nnXXXXnXnX则相互独立,若正态分布时,)(32nn分位数有表可查分布的上)(42n分布的性质分布的性质)(2n20.05(10)51015200.020.040.060.080.1n = 1005. 0307.18)10(307.18)10(2205. 0P经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 6322)12(21)(45nunn时,经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 64nXXX,21相
39、互独立,证证 1设niiiniNXXn122, 2 , 1) 1 , 0()(则1)(, 1)(, 0)(2iiiXEXDXEnXEnEnii122)(3d21)(2244xexXExi2)()()(2242iiiXEXEXDnXDnDnii2)(122经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 65由此可见,卡方分布不仅仅可由正太分布导入,可由指数分布导入,例如,若的指数分布为相互独立,均服从参数21,21nXXXniinX12)2(则) 1 , 0 (UX又若)21(ln2EX则于是若的样本,是) 1 , 0 (),(1UXXXnniinX12)2(ln2则).2)(l
40、n2),(,1 , 0)(.),(.21, 1nXFXXXUXFVRxFXVRniin(服从卡方分布的样本,则是总体于是,若服从均匀分布则的分布函数为再如经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 66(3) (3) t t 分布分布 (Student 分布)定义定义则称 T 服从自由度为 n 的T 分布.其密度函数为nYXT tntnnntfn2121221)(),(, ) 1 , 0 (2nYNXX ,Y相互独立,设经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 67t 分布的图形(红色的是标准正态分布)n = 1n=20-3-2-11230.10.20
41、.30.4经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 68t 分布的性质分布的性质1f n(t)是偶函数,2221)()(,tnettfn2T 分布的上 分位数 t 与双测 分位数 t/2 均 有表可查.经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 69-3-2-11230.050.10.150.20.250.30.35n = 101tttTP0.051.81250.05(10) 1.8125P Ttt-t1.81250.05,1.81250.95P TP T8125. 1)10(95. 0t经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 -
42、702/2/2)(tTPtTP-3-2-11230.050.10.150.20.250.30.35t/2-t/22281.2)10(05.02281.2025.02281.2025.0tTPTP/2/2当n45时,有 t(n) = u经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 71(4) F 分布分布则称 F 服从为第一自由度第一自由度为n ,第二自由第二自由度度为 m 的F 分布分布. . 0, 001222), (2122tttmntmnmnmnmntfmnnn其密度函数为定义定义),(),(22mYnXX, Y 相互独立,设mYnXF/令经济、管理经济、管理基础课程基
43、础课程统计学原理统计学原理1 - 721234560.20.40.60.81234560.20.40.60.8m = 10, n = 4m = 10, n = 10m = 10, n = 15m = 4, n =10m = 10, n = 10m = 15, n = 10经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 73F 分布的性质分布的性质1 ( , ),1/ ( , )FF n mFF mn若则1234560.10.20.30.40.50.6例如),(1),(1nmFmnF事实上,19. 51) 5 , 4 (1) 4 , 5 (05. 095. 0FF故),(:),(
44、),(2mnFFPmnFmnF有表可查分位数的上求F(n,m)19. 5)5 , 4(05. 0F?)4 , 5(95. 0F经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 74),(1mnFFP),(111mnFFP故),(1nmFF由于),(1111mnFFP1),(),(11nmFmnF因而),(111mnFFP例例1 1 证明),(1),(1nmFmnF证证经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 75证证2XY221(|( )|)( )P XtnP Xt n有例例2 2), 1()(212nFnt 证明:)()(212222ntYPntXP),
45、1 ()(212nFnt即设令nnnnG)(1) 1 ()(2222), 1 (nF2( ) ( ) ,(0,1)nXT nXGGNn经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 76 抽抽样分布的某些结论样分布的某些结论()() 一个正态总体一个正态总体) 1() 1(22122nXXSnnii22) 1(Sn 与X相互独立设总体1,nXX,样本为( ),),(2nNX) 1 , 0( NnX) 1(nTnSXSnX(1)(2)2( ,)XN 经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 77( II ) 两个正态总体两个正态总体相互独立的简单随机样本.n
46、iiniiXXnSXnX12211)(111令mjjmjjYYmSYmY12221)(111设nXXX,21与mYYY,21分别是来),(211NX自正态总体),(222NY与的经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 78则) 1() 1() 1() 1(2222222121mSmnSn) 1, 1(22222121 mnFSS若21则) 1, 1(2221 mnFSS(3)经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 79则),(1),(1221211mNYmYnNXnXmjjnii)1 , 0()()(2221NmnYX),(2221mnNYX相互
47、独立的简单随机样本.设nXXX,21与mYYY,21分别是来21( ,)XN 自正态总体22(,)YN 与的经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 80) 1() 1() 1() 1(22222221mSmnSn222221) 1() 1(SmSn) 2(2mnYX 与222221) 1() 1(SmSn相互独立经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 812) 1() 1()()(2222212221mnSmSnmnYX2) 1() 1(11)()(222121mnSmSnmnYX) 2(mnt(4)经济、管理经济、管理基础课程基础课程统计学原理
48、统计学原理1 - 82的概率不小于90%,则样本容量至少取多少?例例3 3设(72 ,100)XN ,为使样本均值大于70解解 设样本容量为 n , 则)100,72(nNX故)70(1)70(XPXPn1072701n2 . 0令9 . 02 . 0n得29. 12 . 0n即6025.41n所以取42n经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 83例例4 4 从正态总体),(2NX中,抽取了 n = 20的样本1220(,)X XX(1) 求22012276. 120137. 0iiXXP(2) 求22012276. 120137. 0iiXP解解 (1)19(119
49、22012222iiXXS即) 1() 1(222nSn经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 8422012276. 120137. 0iiXXP故2 .3514 . 720122iiXXP2 .3514 . 712012220122iiiiXXPXXP98. 001. 099. 0查表(P.386)经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 85(2) (2) )20(22012iiX22012276. 120137. 0iiXP故2 .354 . 72012iiXP2 .354 . 720122012iiiiXPXP97. 0025. 0995
50、. 0经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 86例例5 5 设r.v. X 与Y 相互独立,X N(0,16), Y N(0,9) , X1, X2 , X9 与Y1, Y2 , Y16 分别是取自 X 与 Y 的简单随机样本, 求统计量1292221216XXXZYYY所服从的分布.解解)169, 0(921NXXX)1, 0()(431921NXXX经济、管理经济、管理基础课程基础课程统计学原理统计学原理1 - 8716, 2 , 1,)1 , 0(31iNYi)16(3122161iiY16314311612921iiYXXX)16( t2162221921YY