1、2023-2-3统计学第1章绪论1-1统计学统计学叶鸿烈叶鸿烈2023-2-3统计学第1章绪论1-2希望大家协作的事 关掉所有带响的东西关掉所有带响的东西 既来之则安之既来之则安之 积极思考大胆发言积极思考大胆发言 既来之则动之既来之则动之2023-2-3统计学第1章绪论1-32023-2-3统计学第1章绪论1-4F失误一:信号故障未排除前,调度不该放行两辆车。失误一:信号故障未排除前,调度不该放行两辆车。F失误二:调度使用了不当的控制模式失误二:调度使用了不当的控制模式F在发生在发生“失误一失误一”后,其实还有补救的方法:命令后车的后,其实还有补救的方法:命令后车的D301停下或以时速停下或
2、以时速20公里的低速靠公里的低速靠“目视目视”行车,直到行车,直到前车前车D3115进站为止。但调度只是简单地提醒进站为止。但调度只是简单地提醒D301:前:前面有车。面有车。F失误三:调度未能让两车保持足够的距离失误三:调度未能让两车保持足够的距离F即便是即便是“失误一失误一”和和“失误二失误二”同时发生后,调度仍然可同时发生后,调度仍然可以避免追尾事故发生:控制台可以采取果断措施对后车以避免追尾事故发生:控制台可以采取果断措施对后车D301采取停车或减速,哪怕采用最原始的方法:通过对采取停车或减速,哪怕采用最原始的方法:通过对话机掌握两车的具体位置,使之保持足够的距离。话机掌握两车的具体位
3、置,使之保持足够的距离。F失误五:失误五:D3115司机停车时应发出警告或通知司机停车时应发出警告或通知D301和调和调度自己的位置度自己的位置F失误六:电工擅自对线路行了封连失误六:电工擅自对线路行了封连F失误七:中国高铁采用了假冒的失误七:中国高铁采用了假冒的ATP装置装置F失误八:调度让两车采用不同的行车模式失误八:调度让两车采用不同的行车模式F2023-2-3统计学第1章绪论1-5F根据统计,在我们国家:根据统计,在我们国家:F意外事故造成死亡的概率是万分之意外事故造成死亡的概率是万分之3F意外事故造成残废的概率是万分之意外事故造成残废的概率是万分之5F因意外事故需要住院医疗的概率是万
4、分因意外事故需要住院医疗的概率是万分之之11F因意外事故需要医疗的概率万分之因意外事故需要医疗的概率万分之172023-2-3统计学第1章绪论1-6第第1章章绪论绪论F1.1什么是统计学什么是统计学F1.2统计学的历史统计学的历史F1.3统计学的分类统计学的分类F1.4统计学基本概念统计学基本概念F1.5常用分布常用分布F1.6正态总体的抽样分布正态总体的抽样分布2023-2-3统计学第1章绪论1-71.1statistics的定义的定义F统计学是关于收集和统计学是关于收集和分析数据的分析数据的F科学和艺术。科学和艺术。2023-2-3统计学第1章绪论1-8统计学的目标统计学的目标F从所有类型
5、的数据中从所有类型的数据中提取科学的和有意义的提取科学的和有意义的信息。信息。2023-2-3统计学第1章绪论1-9收集和分析数据收集和分析数据F不是对一般的数据进行分析,不是对一般的数据进行分析,实质上是只讨论那种具有随实质上是只讨论那种具有随机性的数据,即对偶然现象机性的数据,即对偶然现象里面的统计规律进行分析。里面的统计规律进行分析。2023-2-3统计学第1章绪论1-10偶然现象偶然现象F第一个问题,任选南宁第一个问题,任选南宁9月份的某月份的某一天,它的最低气温大于一天,它的最低气温大于28度,度,这有可能发生也可能不发生;这有可能发生也可能不发生;F第二个问题,掷一枚硬币会出现第二
6、个问题,掷一枚硬币会出现国徽;国徽;F第三个问题,任查街上的一个人,第三个问题,任查街上的一个人,他的心脏在右边。他的心脏在右边。2023-2-3统计学第1章绪论1-11硬币实验硬币实验试验者试验者n nn nA Af fn n(A)(A)德德-摩根摩根De MorganDe Morgan20482048次次10611061次次0.51810.5181蒲丰蒲丰BuffonBuffon40404040次次20482048次次0.50690.5069K-K-皮尔逊皮尔逊PearsonPearson1200012000次次60196019次次0.50160.5016K-K-皮尔逊皮尔逊Pearson
7、Pearson2400024000次次1201212012次次0.50050.5005维尼维尼3000030000次次1499414994次次0.49980.49982023-2-3统计学第1章绪论1-12计算生男孩的比例计算生男孩的比例F拉普拉斯拉普拉斯(17491827),数学家、天文学数学家、天文学家,是天体力学家,是天体力学的主要奠基人、的主要奠基人、概率论的创始人,概率论的创始人,应用数学的先驱。应用数学的先驱。拿破仑的老师拿破仑的老师2023-2-3统计学第1章绪论1-13波兰波兰普查年份普查年份总人口总人口男男女女性别比性别比(以(以女性女性为为100100)1953195359
8、4355943530799307992863628636107.56107.5619641964694586945835652356523380633806105.46105.461982198210081810081851944519444887448874106.3106.31990199011336811336858495584955487354873106.6106.62000200012658312658365355653556122861228106.74106.742023-2-3统计学第1章绪论1-14计算概率的条件计算概率的条件2023-2-3统计学第1章绪论1-15F傻根带
9、着傻根带着5万元钱坐火车回家过年,他担心万元钱坐火车回家过年,他担心遭遇扒手,因为据说扒手出现的概率为遭遇扒手,因为据说扒手出现的概率为5%。F傻根的左位坐着黎叔,右位坐着张涵予。傻根的左位坐着黎叔,右位坐着张涵予。黎叔认为傻根遭扒的概率为黎叔认为傻根遭扒的概率为100%,F张涵予认为该概率为张涵予认为该概率为0%。2023-2-3统计学第1章绪论1-16统计规律统计规律(一些例子一些例子)统统计计学学家家献献计计炸炸德德军军2023-2-3统计学第1章绪论1-17【例【例1.1】F据中国国家统计局网公布的消据中国国家统计局网公布的消息,息,2010年年2月份,居民消费月份,居民消费价格同比上
10、涨价格同比上涨2.7%,涨幅比上,涨幅比上月扩大月扩大1.2个百分点。个百分点。2023-2-3统计学第1章绪论1-18问题问题F“居民消费价格同比上涨居民消费价格同比上涨2.7%”确切的含义是什么?确切的含义是什么?2023-2-3统计学第1章绪论1-19【例【例1.2】中国网中国网()F2009年年10月月28日消息,国家统计局上海调日消息,国家统计局上海调查总队近期对查总队近期对1000户城市居民家庭开展了户城市居民家庭开展了一项有关消费意向和消费观念的专题调查。一项有关消费意向和消费观念的专题调查。调查结果显示,以下领域存在较大消费潜调查结果显示,以下领域存在较大消费潜力:首先是住房消
11、费。调查中,在问及购力:首先是住房消费。调查中,在问及购房意向时,有房意向时,有2.9%的家庭表示年内打算购的家庭表示年内打算购房,另有房,另有9.6%表示在三年内有购房意向。表示在三年内有购房意向。2023-2-3统计学第1章绪论1-20问题问题F“有有2.9%的家庭表示年内打算的家庭表示年内打算购房,另有购房,另有9.6%表示在三年内表示在三年内有购房意向有购房意向”这两个数字的可这两个数字的可靠性怎样?靠性怎样?2023-2-3统计学第1章绪论1-21【例【例1.3】北京日报北京日报F2009年年1月月12日报道,日报道,2008年中国民生问题调查:食品年中国民生问题调查:食品安全状况最
12、令人担忧安全状况最令人担忧,调查中对城乡居民询问了人身、,调查中对城乡居民询问了人身、个人和家庭财产、个人信息隐私、交通、劳动、医疗、食个人和家庭财产、个人信息隐私、交通、劳动、医疗、食品等品等7个方面的安全感,结果发现在上述个方面的安全感,结果发现在上述7个方面平均有个方面平均有74.6%的人表示的人表示“很安全很安全”或或“比较安全比较安全”。其中人身方。其中人身方面的安全感最高面的安全感最高(很安全和比较安全合计很安全和比较安全合计83.2%),而食品,而食品和交通方面的安全感最低,分别只有和交通方面的安全感最低,分别只有65.3%和和65.7%,认,认为不安全的人达为不安全的人达30%
13、以上。特别值得提及的是,在以上。特别值得提及的是,在2006年和年和2008年的两次调查中,食品安全状况都在各类安全年的两次调查中,食品安全状况都在各类安全感中排在倒数第一,这说明公众对食品卫生和安全有着长感中排在倒数第一,这说明公众对食品卫生和安全有着长期的担忧。调查的时间:期的担忧。调查的时间:2008年年5月至月至9月,月,调查样本:调查样本:此项全国抽样调查覆盖全国此项全国抽样调查覆盖全国28个省市区的个省市区的134个县个县(市、市、区区)、251个乡个乡(镇、街道镇、街道)和和523个村个村(居委会居委会),共成功入户,共成功入户访问了访问了7139位年龄在位年龄在18至至69岁的
14、居民,调查误差小于岁的居民,调查误差小于2%,符合统计推论的科学要求。符合统计推论的科学要求。2023-2-3统计学第1章绪论1-22问题问题F“共成功入户访问了共成功入户访问了7139位年龄在位年龄在18至至69岁的居民,调查误差小于岁的居民,调查误差小于2%,符合统计推,符合统计推论的科学要求。论的科学要求。”这里这里“调查误差小于调查误差小于2%”是什么意思?是什么意思?2023-2-3统计学第1章绪论1-23【例【例1.4】F2008年美国发表的两项大型临床试验结果显示,年美国发表的两项大型临床试验结果显示,维生素及其它抗氧化剂丝毫无助于预防前列腺癌。维生素及其它抗氧化剂丝毫无助于预防
15、前列腺癌。美国医学会杂志美国医学会杂志在网络版上公布了这一结果:在网络版上公布了这一结果:第一项研究是迄今进行过的规模最大的癌症预防第一项研究是迄今进行过的规模最大的癌症预防对照试验之一,有对照试验之一,有3.55万名中年男性参加,服用万名中年男性参加,服用维生素维生素E、硒或安慰剂的时间超过、硒或安慰剂的时间超过5年。第二项试年。第二项试验历时验历时8年,观察了维生素年,观察了维生素C和和E对近对近1.5万名男性万名男性的影响。两项研究均显示,无论是对前列腺癌,的影响。两项研究均显示,无论是对前列腺癌,还是所有种类的癌症,这些补充剂都没有预防效还是所有种类的癌症,这些补充剂都没有预防效果。果
16、。2023-2-3统计学第1章绪论1-24问题问题F“维生素及其它抗氧化剂丝毫无助于预防前维生素及其它抗氧化剂丝毫无助于预防前列腺癌。列腺癌。”这个结论是如何得到的?这个这个结论是如何得到的?这个结论可靠吗?结论可靠吗?2023-2-3统计学第1章绪论1-25回顾问题回顾问题F例例1.1中中“居民消费价格同比上涨居民消费价格同比上涨2.7%”确切的含确切的含义是什么?义是什么?第第9章章F例例1.2中中“有有2.9%的家庭表示年内打算购房,另的家庭表示年内打算购房,另有有9.6%表示在三年内有购房意向表示在三年内有购房意向”这两个数字的这两个数字的可靠性怎样?可靠性怎样?第第3章章F例例1.3
17、中中“调查误差小于调查误差小于2%”是如何估算出来的?是如何估算出来的?第第8章章F例例1.4“维生素及其它抗氧化剂丝毫无助于预防前维生素及其它抗氧化剂丝毫无助于预防前列腺癌。列腺癌。”这个结论是如何得到的?这个结论是如何得到的?第第4章章2023-2-3统计学第1章绪论1-261.2统计学的历史统计学的历史F统计活动的历史非常悠久统计活动的历史非常悠久F统计学的历史却不算很长统计学的历史却不算很长F统计学两个主要来源:统计学两个主要来源:17世纪德国的国势世纪德国的国势学和学和17世纪英国的政治算术。世纪英国的政治算术。2023-2-3统计学第1章绪论1-27统计学派及代表人物学派学派特点特
18、点代表人物代表人物成就成就国势学派国势学派(记述学(记述学派)派)17.17.德德以文字记述比较国以文字记述比较国情情 德德H.ConringH.Conring康令康令 德德AchenwallAchenwall阿亨阿亨瓦尔瓦尔*第一个使用第一个使用“统计学统计学”名称名称政治算术政治算术学派学派17.17.英英用数字、重量、尺用数字、重量、尺度来表达思想度来表达思想 英英William.PattyWilliam.Patty配第配第 英英John GrauntJohn Graunt格格朗特朗特政治算术政治算术,Marks,Marks称称PattyPatty是统计学的发明者是统计学的发明者数理学派
19、数理学派19.19.比利时比利时用数理统计方法进用数理统计方法进行社会、自然研究行社会、自然研究 比比R-QueteletR-Quetelet凯特勒凯特勒第一次把概率论和数理统第一次把概率论和数理统计方法应用于社会经济统计方法应用于社会经济统计计社会学派社会学派19.19.后半叶后半叶德德用大量观察法研究用大量观察法研究社会经济现象的数社会经济现象的数量表现和变化量表现和变化 德德KinisKinis克尼斯克尼斯 法法Geoge.P.MayerGeoge.P.Mayer梅尔梅尔 英英EngelEngel恩格尔恩格尔*EngelEngel法则法则2023-2-3统计学第1章绪论1-28国势学国势
20、学F以国家政治社会情况作为研究对象,运用以国家政治社会情况作为研究对象,运用对比的方法来研究各国实力的强弱。对比的方法来研究各国实力的强弱。F国势学派的主要代表人物:国势学派的主要代表人物:康令康令(H.Conring)和和阿亨瓦尔阿亨瓦尔(G.Achenwall)FSTATISTICS(统计学统计学)FSTATUS(状态状态)FSTATE(国家国家)2023-2-3统计学第1章绪论1-29政治算术政治算术F创始人:英国的配第(创始人:英国的配第(W.Petty)F他在他在1690年出版的年出版的政治算术政治算术一书中以数字资一书中以数字资料为基础,采用数量分析方法研究政治问题,第料为基础,采
21、用数量分析方法研究政治问题,第一次提出统计方法并利用统计方法分析数字资料。一次提出统计方法并利用统计方法分析数字资料。F约翰约翰格朗特格朗特1662年发表了年发表了关于死亡表的自然与关于死亡表的自然与政治观察政治观察一文,一文,分析了死亡的真正原因。比如,分析了死亡的真正原因。比如,为了回答当时人们生命受到谋杀威胁的程度到底为了回答当时人们生命受到谋杀威胁的程度到底有多大?格朗特在死亡公告中寻找答案,结果发有多大?格朗特在死亡公告中寻找答案,结果发现在现在229250个死亡总数中,只有个死亡总数中,只有86人死于谋杀,人死于谋杀,其死亡率仅为万分之其死亡率仅为万分之3.75。F另外格朗特还研究
22、了人口的出生率,发现男孩的另外格朗特还研究了人口的出生率,发现男孩的出生率高于女孩的出生率,但又由于男性更容易出生率高于女孩的出生率,但又由于男性更容易死于战争、公海上或处以死刑等,所以成年男人死于战争、公海上或处以死刑等,所以成年男人和女人的数量大体相等。和女人的数量大体相等。2023-2-3统计学第1章绪论1-30统计学发展迅速统计学发展迅速F20世纪:统计学渗透到社会世纪:统计学渗透到社会学、生物学、经济学等领域。学、生物学、经济学等领域。F哥塞特(哥塞特(W.S.Gosset)1908年以年以Student为笔名在为笔名在生物计量学生物计量学杂志上发表杂志上发表论文论文均值的或然误差均
23、值的或然误差,提出了著名的提出了著名的t统计量,开创统计量,开创了小样本理论先河;了小样本理论先河;(R.A.Fisher)对)对t分分布、分布和布、分布和F分布加以综合研分布加以综合研究,提出了方差分析方法和究,提出了方差分析方法和最大似然估计方法,大大促最大似然估计方法,大大促进了推断统计学的发展;进了推断统计学的发展;2023-2-3统计学第1章绪论1-31统计学发展迅速统计学发展迅速F奈曼(奈曼(J.Neyman)和)和皮尔逊(皮尔逊(E.S.Pearson)提出了系统的统计假设提出了系统的统计假设检验理论,并对区间估检验理论,并对区间估计做出了系统发展,瓦计做出了系统发展,瓦尔德(尔
24、德(A.Wald)提出)提出序贯分析法和统计决策序贯分析法和统计决策函数理论,进一步丰富函数理论,进一步丰富了现代统计学的理论,了现代统计学的理论,形成了现代统计学,即形成了现代统计学,即推断统计学的框架。推断统计学的框架。2023-2-3统计学第1章绪论1-321.3统计学的分类统计学的分类F从统计学的研究内容和方法上分类从统计学的研究内容和方法上分类F描述统计(描述统计(descriptivestatistics):用):用数字和图表等方法对数据进行总结和展示,数字和图表等方法对数据进行总结和展示,揭示数据的基本特征,为进一步的统计推揭示数据的基本特征,为进一步的统计推断作准备。断作准备。
25、F推断统计(推断统计(inferentialstatistics):根据):根据样本数据对总体进行估计、预测和推断,样本数据对总体进行估计、预测和推断,这是现代统计学的核心内容。这是现代统计学的核心内容。2023-2-3统计学第1章绪论1-331.4统计学基本概念统计学基本概念F随机变量、总体、样本随机变量、总体、样本和统计量。和统计量。2023-2-3统计学第1章绪论1-341.4.1随机变量及其分布随机变量及其分布F随机变量(随机变量(randomvariable)是定义在样本空)是定义在样本空间上的实值函数间上的实值函数X=X(),它随样本点,它随样本点的变化而的变化而变化,它用来描述随
26、机试验的结果。变化,它用来描述随机试验的结果。F如果一个随机变量只能取有限个或可列个值,则如果一个随机变量只能取有限个或可列个值,则称它为离散型随机变量(称它为离散型随机变量(discreterandomvariable););F如果一个随机变量的可能取值充满数轴上的一个如果一个随机变量的可能取值充满数轴上的一个区间,则称它为连续型随机变量(区间,则称它为连续型随机变量(continuousrandomvariable)。)。2023-2-3统计学第1章绪论1-35几个例子几个例子F【例【例1.9】抛一颗六面均匀的骰子,观察出现的点】抛一颗六面均匀的骰子,观察出现的点数,则出现的点数数,则出现
27、的点数X是一个随机变量。是一个随机变量。F【例【例1.10】调查】调查100个顾客,考察顾客对某个品个顾客,考察顾客对某个品牌笔记本电脑的偏好,记录喜欢这个品牌笔记本牌笔记本电脑的偏好,记录喜欢这个品牌笔记本电脑的人数电脑的人数X,则,则X是一个随机变量。是一个随机变量。F【例【例1.11】为了检验某电子产品的质量,检测它】为了检验某电子产品的质量,检测它的使用寿命(以分钟记),则产品的使用寿命的使用寿命(以分钟记),则产品的使用寿命X是一个随机变量。是一个随机变量。F【例【例1.12】从一大批产品中随机抽取若干个产品,】从一大批产品中随机抽取若干个产品,考察次品率考察次品率X,则,则X是一个
28、随机变量。是一个随机变量。2023-2-3统计学第1章绪论1-36分布函数分布函数F描述随机变量分布的重要工具,可以用来描述随机变量分布的重要工具,可以用来描述离散型和连续型随机变量。描述离散型和连续型随机变量。F定义定义1.1设设X是一个随机变量,对任意实数是一个随机变量,对任意实数x,称称FF(x)=P(Xx)(1.1)F为随机变量为随机变量X的分布函数(的分布函数(distributionfunction),称),称X服从服从F(x),简记为,简记为XF(x)。2023-2-3统计学第1章绪论1-37概率密度函数概率密度函数F定义定义1.2设随机变量设随机变量X的分布函数是的分布函数是F
29、(x),如果存在一个非负函数如果存在一个非负函数f(x),使得对任意实,使得对任意实数数x,有,有F(1.2)F则称则称f(x)是连续型随机变量是连续型随机变量X的概率密度函的概率密度函数(数(probabilitydensityfunction),简),简称为密度函数。称为密度函数。()()xF xf t dt2023-2-3统计学第1章绪论1-381.4.2总体和总体分布总体和总体分布F什么是总体?什么是总体?F研究对象的全体就称为总体研究对象的全体就称为总体(population)或或母体,总体中的元素称为个体。母体,总体中的元素称为个体。F如果总体包含的个体的数目是有限的,则如果总体包
30、含的个体的数目是有限的,则称之为有限总体;称之为有限总体;F如果总体包含的个体的数目是无限的,就如果总体包含的个体的数目是无限的,就称之为无限总体。称之为无限总体。2023-2-3统计学第1章绪论1-39总体是随机变量总体是随机变量F【例【例1.13】一批电子元件共一批电子元件共10万个,研究万个,研究这批电子元件的平均使用寿命,则该批电这批电子元件的平均使用寿命,则该批电子元件的全部使用寿命就构成一个总体,子元件的全部使用寿命就构成一个总体,而每个电子元件的使用寿命就是个体。而每个电子元件的使用寿命就是个体。F【例【例1.14】考察某大学一年级新生的身高考察某大学一年级新生的身高情况,则全体
31、新生的身高就构成一个总体,情况,则全体新生的身高就构成一个总体,而其中每个学生的身高就是个体。而其中每个学生的身高就是个体。2023-2-3统计学第1章绪论1-401.4.3样本和样本分布样本和样本分布F样本样本:从总体中取出的部分个体构成的集合从总体中取出的部分个体构成的集合.F样本容量:样本中的个体数目。样本容量:样本中的个体数目。F抽样抽样(sampling):取得样本的过程。:取得样本的过程。F常用抽样方法:简单随机抽样、分层抽样常用抽样方法:简单随机抽样、分层抽样、整群抽样、等距抽样等整群抽样、等距抽样等第第8章。章。2023-2-3统计学第1章绪论1-41简单随机样本简单随机样本F
32、我们讨论的样本都是指简单随机抽样得到我们讨论的样本都是指简单随机抽样得到的简单随机样本的简单随机样本(simplerandomsample),简称为样本简称为样本(sample)。F记记(x1,xn)为样本容量为为样本容量为n的样本,其中的样本,其中x1,xn是相互独立的与总体是相互独立的与总体X同分布的同分布的n个随机变量;个随机变量;(x1,xn)的观测值称为样本的观测值称为样本值,仍记作值,仍记作(x1,xn)。2023-2-3统计学第1章绪论1-42样本联合分布函数样本联合分布函数F对于简单随机样本,若总体对于简单随机样本,若总体X的分布函数为的分布函数为F(x),则样本,则样本(x1
33、,xn)的联合分布函数为的联合分布函数为11(,)()nniiF xxF x2023-2-3统计学第1章绪论1-43样本联合概率密度函数样本联合概率密度函数F若总体若总体X的概率密度函数为的概率密度函数为f(x),则样本,则样本(x1,xn)的联合概率密度函数为的联合概率密度函数为11(,)()nniif xxf x2023-2-3统计学第1章绪论1-44样本联合概率函数样本联合概率函数F若总体若总体X是离散型随机变量,其概率函数为是离散型随机变量,其概率函数为p(x)=P(X=x),则样本,则样本(x1,xn)的联合概率的联合概率函数为函数为11(,)()nniip xxp x2023-2-
34、3统计学第1章绪论1-451.4.4统计量统计量F抽样获得样本后,根据样本信息推断总体抽样获得样本后,根据样本信息推断总体时,通常需要对样本信息进行加工整理,时,通常需要对样本信息进行加工整理,针对不同的问题构造适当的样本函数,这针对不同的问题构造适当的样本函数,这种用来推断总体的样本函数称为统计量种用来推断总体的样本函数称为统计量(statistic)。)。F统计量是用作统计推断的量,所以统计量统计量是用作统计推断的量,所以统计量不能含有未知参数。不能含有未知参数。2023-2-3统计学第1章绪论1-461.样本均值样本均值F称为样本均值称为样本均值(samplemean);它是总体;它是总
35、体期望期望的无偏估计。的无偏估计。11 1.3niixxn()2023-2-3统计学第1章绪论1-472.样本方差样本方差F称为样本方差称为样本方差(samplevariance),其算术,其算术平方根称为样本标准差平方根称为样本标准差(samplestandarddevication)。2211()1.4nniisxxn()2023-2-3统计学第1章绪论1-48修正样本方差修正样本方差F称为修正样本方差。称为修正样本方差。F因为修正样本方差是总体方差的无偏估计,因为修正样本方差是总体方差的无偏估计,在实际中,修正样本方差比样本方差更常在实际中,修正样本方差比样本方差更常用,今后提到样本方差
36、通常是指修正样本用,今后提到样本方差通常是指修正样本方差。方差。2211()1.51niisxxn()2023-2-3统计学第1章绪论1-493.样本矩样本矩F称为样本称为样本k阶原点矩和样本阶原点矩和样本k阶中心矩;阶中心矩;F样本矩可以用来估计总体矩,从而获得相样本矩可以用来估计总体矩,从而获得相应的矩估计。应的矩估计。111.6nkkiiAxn()11()1.7nkkiiBxxn()2023-2-3统计学第1章绪论1-504.次序统计量次序统计量F将样本按由小到大排列得到的有序样本将样本按由小到大排列得到的有序样本(x(1),x(n)称为样本的次序统计量(称为样本的次序统计量(order
37、statistic),其中,),其中,x(i)为样本的第为样本的第i个次序个次序统计量;统计量;x(1)称为样本的最小次序统计量,称为样本的最小次序统计量,x(n)称为样本的最大次序统计量。称为样本的最大次序统计量。2023-2-3统计学第1章绪论1-515.样本中位数和样本极差样本中位数和样本极差F设设(x(1),x(n)为有序样本,则样本中位数为有序样本,则样本中位数Me(median)定义为定义为12()12,Me,nnnxnxxn22()(+1)当 为奇数时当 为偶数时2023-2-3统计学第1章绪论1-52样本极差样本极差F样本极差样本极差(range)定义为定义为:R=x(n)-x
38、(1)F它是反映样本值分散程度的量,可以用于它是反映样本值分散程度的量,可以用于推断总体的标准差。推断总体的标准差。2023-2-3统计学第1章绪论1-536.经验分布函数经验分布函数F设设(x(1),x(n)为来自于总体的有序样本,为来自于总体的有序样本,对任意实数对任意实数x,称,称(1.8)是经验分布函数是经验分布函数(1)()(1)()0,1,2,1 1.81,knkknnxxFxxxxknxx()2023-2-3统计学第1章绪论1-541.5常用分布常用分布F统计量的概率分布称为抽样分布统计量的概率分布称为抽样分布(samplingdistribution),经典的统计),经典的统计
39、推断大多是基于正态分布以及正态变量构推断大多是基于正态分布以及正态变量构造的三个著名分布(造的三个著名分布(分布、分布、t分布和分布和F分分布)布)F下面介绍这四分布和两个离散型分布(二下面介绍这四分布和两个离散型分布(二项分布和泊松分布)的定义及主要性质。项分布和泊松分布)的定义及主要性质。22023-2-3统计学第1章绪论1-551.5.1正态分布正态分布F定义定义1.3如果随机变量如果随机变量X的密度函数为的密度函数为F则称则称X服从参数为服从参数为和和2的正态分布的正态分布(normaldistribution),记为,记为XN(,2),其中其中和和(0)都是常数。都是常数。2()22
40、1(),-1.92xp xex ()2023-2-3统计学第1章绪论1-56图图1.1正态分布密度函数的曲线正态分布密度函数的曲线2023-2-3统计学第1章绪论1-57图图1.2正态分布正态分布N(,1),N(,22)和和N(,32)的密度曲线的密度曲线2023-2-3统计学第1章绪论1-58图图1.3标准正态分布的密度曲线标准正态分布的密度曲线2023-2-3统计学第1章绪论1-59正态分布的性质正态分布的性质F性质性质1.1若若XN(,2),则,则E(X)=,Var(X)=2,F性质性质1.2若若XN(,2),则,则F即任何一个一般的正态分布都可以经过简即任何一个一般的正态分布都可以经过
41、简单的线性变换转化为标准正态分布。单的线性变换转化为标准正态分布。(0,1)XYN2023-2-3统计学第1章绪论1-60标准正态分布的分位数标准正态分布的分位数F对于标准正态分布随机变量对于标准正态分布随机变量X,对给定,对给定,称满足称满足P(XZ)=的是标准正态分布的分的是标准正态分布的分位数。位数。F分位数可以从附表分位数可以从附表1里查到,比如里查到,比如=0.025,查附表查附表1可得可得Z=1.96。2023-2-3统计学第1章绪论1-611.5.2分布分布22023-2-3统计学第1章绪论1-62卡方分布的性质卡方分布的性质2023-2-3统计学第1章绪论1-63图图1.4卡方
42、分布的密度函数卡方分布的密度函数2023-2-3统计学第1章绪论1-641.5.3t分布分布2023-2-3统计学第1章绪论1-65t分布的性质分布的性质2023-2-3统计学第1章绪论1-66图图1.5t(n)分布与分布与标准正态标准正态N(0,1)的密度函数的密度函数2023-2-3统计学第1章绪论1-671.5.4F分布分布2023-2-3统计学第1章绪论1-68F分布的性质分布的性质2023-2-3统计学第1章绪论1-69图图1.6F(m,n)分布的密度函数分布的密度函数2023-2-3统计学第1章绪论1-701.5.5二项分布二项分布2023-2-3统计学第1章绪论1-711.5.6
43、泊松分布泊松分布2023-2-3统计学第1章绪论1-721.6正态总体的抽样分布正态总体的抽样分布2023-2-3统计学第1章绪论1-732023-2-3统计学第1章绪论1-742023-2-3统计学第1章绪论1-752023-2-3统计学第1章绪论1-761.7统计软件统计软件SPSS简介简介F常用统计软件常用统计软件FSAS,S-Plus,Minitab,R等。等。FEviews,MATLAB,Excel也可以完成很也可以完成很多统计计算和分析。多统计计算和分析。F“师傅领进门,修行靠个人师傅领进门,修行靠个人”2023-2-3统计学第1章绪论1-77本章小结本章小结F本章介绍了统计学的定
44、义和分类,回顾了统计学的发展历本章介绍了统计学的定义和分类,回顾了统计学的发展历史,介绍了随机变量、总体、样本和统计量这四个基本概史,介绍了随机变量、总体、样本和统计量这四个基本概念,介绍了统计学中使用广泛的六个分布:正态分布、卡念,介绍了统计学中使用广泛的六个分布:正态分布、卡方分布、方分布、t t分布、分布、F F分布、二项分布和泊松分布,给出了正分布、二项分布和泊松分布,给出了正态总体下的抽样分布,最后介绍了统计软件态总体下的抽样分布,最后介绍了统计软件SPSSSPSS的特点。的特点。F统计学是一门研究如何有效地收集数据、整理数据、分析统计学是一门研究如何有效地收集数据、整理数据、分析数
45、据,并根据数据作出推断的方法论科学,分为描述统计数据,并根据数据作出推断的方法论科学,分为描述统计学和推断统计学两个部分,其中推断统计是现代统计的核学和推断统计学两个部分,其中推断统计是现代统计的核心内容;正态分布、分布、心内容;正态分布、分布、t t分布、分布、F F分布、二项分布和泊分布、二项分布和泊松分布是统计学中六个重要分布,利用样本信息(统计量)松分布是统计学中六个重要分布,利用样本信息(统计量)推断总体时经常会用到这六个分布。推断总体时经常会用到这六个分布。2023-2-3统计学第1章绪论1-78本章小结本章小结F正态分布是钟形对称的分布,它的中心取决于参正态分布是钟形对称的分布,
46、它的中心取决于参数数,而分布的离散程度取决于参数,而分布的离散程度取决于参数的大小;的大小;t t分布的形状很像正态分布,但分布的形状很像正态分布,但“尾部尾部”比正态分比正态分布更厚一些;卡方分布和布更厚一些;卡方分布和F F分布都是只取非负值的分布都是只取非负值的偏态分布;二项分布和泊松分布是应用广泛的两偏态分布;二项分布和泊松分布是应用广泛的两个离散型分布。个离散型分布。FSPSSSPSS是一种常见的功能齐全、操作简单的统计软是一种常见的功能齐全、操作简单的统计软件,本书采用件,本书采用SPSS16.0SPSS16.0完成相应的统计计算。完成相应的统计计算。2023-2-3统计学第1章绪
47、论1-79案例:新型农村养老保险问题案例:新型农村养老保险问题F零点研究咨询集团零点研究咨询集团2009年发布的年发布的2009年年零点中国公共服务公众评价指数报告零点中国公共服务公众评价指数报告中中关于新型农村养老保险的调查,针对广大关于新型农村养老保险的调查,针对广大农村居民对新农保的认知度、参保意愿、农村居民对新农保的认知度、参保意愿、评价程度等问题进行了分析。评价程度等问题进行了分析。2023-2-3统计学第1章绪论1-80资料来源:零点咨询研究集团资料来源:零点咨询研究集团2009年秋季三期居民生活调查报告年秋季三期居民生活调查报告2023-2-3统计学第1章绪论1-81资料来源:零点咨询研究集团资料来源:零点咨询研究集团2009年零点中国公共服务公众评价指数报告年零点中国公共服务公众评价指数报告2023-2-3统计学第1章绪论1-82讨论讨论F1.1.根据以上资料,你认为农村居民中优先根据以上资料,你认为农村居民中优先选择的缴费标准是多少?选择的缴费标准是多少?F2.2.根据资料,你认为农村居民不愿意参加根据资料,你认为农村居民不愿意参加新农保的主要因素是什么?调查中体现了新农保的主要因素是什么?调查中体现了哪几方面的原因?哪几方面的原因?