用样本估计总体课件.ppt

上传人(卖家):晟晟文业 文档编号:4324441 上传时间:2022-11-29 格式:PPT 页数:93 大小:2.25MB
下载 相关 举报
用样本估计总体课件.ppt_第1页
第1页 / 共93页
用样本估计总体课件.ppt_第2页
第2页 / 共93页
用样本估计总体课件.ppt_第3页
第3页 / 共93页
用样本估计总体课件.ppt_第4页
第4页 / 共93页
用样本估计总体课件.ppt_第5页
第5页 / 共93页
点击查看更多>>
资源描述

1、1ppt课件分层抽样系统抽样随机数法抓阄抽签简单随机抽样抽样方法)(复习回顾复习回顾1.抽样方法有哪些?2ppt课件类别类别共同点共同点各自特点各自特点相互联系相互联系适用范围适用范围 简单随机简单随机 抽样抽样 系统系统 抽样抽样 分层抽样分层抽样2.三三种抽样方式比较种抽样方式比较1.不放不放回抽样回抽样2.抽样过抽样过程中程中,每每个个体个个体被抽取被抽取的机会的机会均等均等从总体中从总体中逐个抽取逐个抽取将总体均分为将总体均分为几部分几部分,按简单按简单随机抽样抽取随机抽样抽取第一个样本,第一个样本,然后按相同的然后按相同的间隔抽取其他间隔抽取其他样本样本将总体分成将总体分成几层,分层

2、几层,分层进行抽取进行抽取 抽取第一抽取第一个样本时个样本时采用简单采用简单随机抽样随机抽样 各层抽样时,各层抽样时,采用简单随采用简单随机抽样或系机抽样或系统抽样统抽样总体中的个总体中的个体数较少体数较少总体中的个体总体中的个体数较多数较多 (间隔相同的间隔相同的时间或距离时间或距离)总体由差异总体由差异明显的几部明显的几部分组成分组成3ppt课件练习:在练习:在下列问题中,各采用什么抽样下列问题中,各采用什么抽样方法抽取样本较合适?方法抽取样本较合适?1、从、从20台电脑中抽取台电脑中抽取4台进行质量检测;台进行质量检测;2、从、从2004名同学中,抽取一个容量为名同学中,抽取一个容量为2

3、0的样本的样本3、某中学有、某中学有180名教工,其中业务人员名教工,其中业务人员136名,名,管理人员管理人员20名,后勤人员名,后勤人员24名,从中抽取一个名,从中抽取一个容量为容量为15的样本。的样本。简单随机抽样简单随机抽样系统抽样系统抽样分层抽样分层抽样4ppt课件 如何从样本数据中提取基本信如何从样本数据中提取基本信息来估计总体的情况呢?息来估计总体的情况呢?抽样是统计的第一步,抽样是统计的第一步,接下来就要对样本进行分析。接下来就要对样本进行分析。5ppt课件2.2 2.2 用样本估计总体用样本估计总体一、用样本的频率分布估计总体的分布一、用样本的频率分布估计总体的分布二、用样本

4、的数字特征估计总体的特征二、用样本的数字特征估计总体的特征平均数、中位数、众数、平均数、中位数、众数、极差、方差、标准差极差、方差、标准差频率分布表、频率分布直方图、频率分布表、频率分布直方图、频率折线图、茎叶图频率折线图、茎叶图6ppt课件采用抽样调查的方采用抽样调查的方式获得样本数据式获得样本数据分析样本数据来估分析样本数据来估计全市居民用水量的计全市居民用水量的分布情况分布情况我国是世界上严重缺水我国是世界上严重缺水的国家之一,城市缺水的国家之一,城市缺水问题较为突出,某市政问题较为突出,某市政府为了节约生活用水,府为了节约生活用水,计划在本市试行居民生计划在本市试行居民生活用水定额管理

5、,即确活用水定额管理,即确定一个居民月用水量标定一个居民月用水量标准准a a,用水量不超过,用水量不超过a a的的部分按平价收费,超出部分按平价收费,超出a a的部分按议价收费。的部分按议价收费。如果希望大部分居民的如果希望大部分居民的日常生活不受影响,那日常生活不受影响,那么标准么标准a a定为多少比较定为多少比较合理呢合理呢?探究探究:你认为,为了较为你认为,为了较为合理地确定出这个合理地确定出这个标准,需要做哪些标准,需要做哪些工作?工作?7ppt课件下表给出下表给出100100位居民的月均用水量表位居民的月均用水量表 分析数据的一种分析数据的一种基本方法基本方法是用图将它们画出来,或者

6、是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式供解释数据的新方式讨论:如何分讨论:如何分析数据?析数据?根据这些数据根据这些数据你能得出用水你能得出用水量其他信息吗量其他信息吗?为此我们要对这些数据进行整理与分析为此我们要对这些数据进行整理与分析8ppt课件初中我们曾经学过频数分布图和频数分初中我们曾经学过频数分布图和频数分布

7、表,这使我们能够清楚地知道数据分布表,这使我们能够清楚地知道数据分布在各个小组的个数。下面将要学习的布在各个小组的个数。下面将要学习的频率分布图和频率分布表,则是从各个频率分布图和频率分布表,则是从各个小组数据在样本容量中所占比例大小的小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律。它可以角度,来表示数据分布的规律。它可以使我们看到整个样本数据的频率分布情使我们看到整个样本数据的频率分布情况。况。9ppt课件一一频率分布的概念:频率分布的概念:频率分布频率分布是指一个样本数据在各个小范围是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方内所占比例的大小。一般用频率分

8、布直方图反映样本的频率分布图反映样本的频率分布 一、频率分布直方图一、频率分布直方图10ppt课件第一步第一步:求极差求极差:(数据组中最大值与最小值的差距数据组中最大值与最小值的差距)最大值最大值=4.3 =4.3 最小值最小值=0.2 =0.2 所以极差所以极差=4.3-0.2=4.1=4.3-0.2=4.1第二步第二步:决定组距与组数决定组距与组数:(注意取整)(注意取整)当样本容量不超过当样本容量不超过100100时时,按照数据的多少按照数据的多少,常常分成分成512512组组.为方便组距的选择应力求为方便组距的选择应力求“取整取整”.本题如果组距为本题如果组距为0.5(t).0.5(

9、t).则则 4.18.20.5极差组数=组距第三步第三步:将数据分组:将数据分组:(给出组的界限给出组的界限)所以将数据分成所以将数据分成9 9组较合适组较合适.0,0.5),0.5,1),1,1.5),4,4.5)共共9组组.11ppt课件第四步第四步:列频率分布表列频率分布表.分组分组频数频数频率频率频率频率/组距组距0-0.5)40.5-1)8 1-1.5)15 1.5-2)22 2-2.5)25 2.5-3)15 3-3.5)5 3.5-4)4 4-4.5)2合计合计100组距组距=0.5=0.5 0.040.080.080.160.30.150.440.220.250.512.000

10、.020.040.040.080.10.30.150.0512ppt课件 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O13ppt课件 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/

11、t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O14ppt课件 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O15ppt课件 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示

12、:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O16ppt课件 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O17ppt课件 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,

13、我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O18ppt课件 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O19ppt课件 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中

14、的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O20ppt课件 为了直观反映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O21ppt课件 为了直观反

15、映样本数据在各组中的为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:关信息用下面的图形表示:月均用水量月均用水量/t频率频率组距组距0.50.40.30.20.10.5 1 1.5 2 2.5 3 3.5 4 4.5 O22ppt课件00.10.20.30.40.50.6 0.5 1 1.5 2 2.5 3 3.5 4 4.5频率频率/组距组距 月均用水量月均用水量/t/t (组距组距=0.5)=0.5)0.080.160.30.440.50.30.10.080.04小长方形的面小长方形的面积积=?=?小长方形的面小

16、长方形的面积总和积总和=?=?月均用水月均用水量居量居民人数最民人数最多的多的在哪个区间在哪个区间?请大家阅读第请大家阅读第6868页页,直方图有直方图有哪些优点和缺哪些优点和缺点点?第五步第五步:画出频率分布直方图画出频率分布直方图.23ppt课件 同样一组数据同样一组数据,如果组距不同如果组距不同,横轴、纵轴的单位横轴、纵轴的单位不同不同,得到的图的形状也会不同得到的图的形状也会不同.不同的形状给人以不不同的形状给人以不同的印象同的印象,这种印象有时会影响我们对总体的判断这种印象有时会影响我们对总体的判断.分分别以别以1 1和和0.10.1为组距重新作图为组距重新作图,然后谈谈你对图的印象

17、然后谈谈你对图的印象.24ppt课件频率分布直方图的特征:频率分布直方图的特征:1.频频率分布直率分布直方图频率分布表更直观方图频率分布表更直观地地反映了样本的分布规律反映了样本的分布规律.2.从从频率分布直方图得不出原始的数频率分布直方图得不出原始的数据内容,把数据表示成直方图后,据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。原有的具体数据信息就被抹掉了。25ppt课件 如如果当地政府希望使果当地政府希望使85%85%以上的居民每以上的居民每月的用水量不超出标准,根据频率分布表月的用水量不超出标准,根据频率分布表2-22-2和频率分布直方图和频率分布直方图2.2-12.2-1,

18、你能对制定月用水量标准提出建议吗你能对制定月用水量标准提出建议吗?88%88%的居民月用水量在的居民月用水量在3t 3t以下,以下,可建议取可建议取a=3.a=3.26ppt课件小结小结:画频率分布直方图的步骤画频率分布直方图的步骤:第一步第一步:求极差求极差:(数据组中最大值与最小值的差距数据组中最大值与最小值的差距)第二步第二步:决定组距与组数决定组距与组数:(强调取整)(强调取整)第三步第三步:将数据分组将数据分组 (给出组的界限给出组的界限)第四步第四步:列频率分布表列频率分布表.(包括分组、频数、频率(包括分组、频数、频率、频、频率率/组距组距)第五步第五步:画频率分布直方图画频率分

19、布直方图(在频率分布表的基础上(在频率分布表的基础上绘制,横坐标为样本数据尺寸,纵坐标为频率绘制,横坐标为样本数据尺寸,纵坐标为频率/组距组距.)组距组距:指每个小组的两个端点的距离指每个小组的两个端点的距离组数组数:将数据分组,当数据在将数据分组,当数据在100个以内时,个以内时,按数据多少常分按数据多少常分5-12组。组。27ppt课件注意注意第几组频数(1)第几组频率样本容量(2)纵坐标为纵坐标为:频率组距28ppt课件练习:练习:例例 某地区为了了解知识分子的年龄结构,某地区为了了解知识分子的年龄结构,随机抽样随机抽样5050名,其年龄分别如下:名,其年龄分别如下:4242,3838,

20、2929,3636,4141,4343,5454,4343,3434,4444,4040,5959,3939,4242,4444,5050,3737,4444,4545,2929,4848,4545,5353,4848,3737,2828,4646,5050,3737,4444,4242,3939,5151,5252,6262,4747,5959,4646,4545,6767,5353,4949,6565,4747,5454,6363,5757,4343,4646,58.58.(1)(1)列出样本频率分布表;列出样本频率分布表;(2)(2)画出频率分布直方图;画出频率分布直方图;(3)(3)估

21、计年龄在估计年龄在32325252岁的知识分子所占的比例岁的知识分子所占的比例约是多少约是多少.29ppt课件(1)(1)极差为极差为67-28=3967-28=39,取组距为,取组距为5 5,分为,分为8 8组组.分分 组组 频数频数 频率频率 2727,3232)3 0.063 0.06 32 32,3737)3 0.063 0.06 37 37,4242)9 0.189 0.18 42 42,4747)16 0.3216 0.32 47 47,5252)7 0.147 0.14 52 52,5757)5 0.105 0.10 57 57,6262)4 0.084 0.08 62 62,6

22、767)3 0.063 0.06 合合 计计 50 1.0050 1.00样本频率分布表:样本频率分布表:30ppt课件(2 2)样本频率分布直方图:)样本频率分布直方图:年龄年龄0.060.060.050.050.040.040.030.030.020.020.010.0127 32 37 42 47 52 57 62 6727 32 37 42 47 52 57 62 67频率频率组距组距O(3 3)因为)因为0.06+0.18+0.32+0.14=0.70.06+0.18+0.32+0.14=0.7,故年龄在故年龄在32325252岁的知识分子约占岁的知识分子约占70%.70%.31pp

23、t课件课堂练习课堂练习2(2006年全国卷年全国卷II)一个社会调查机构就某地居民一个社会调查机构就某地居民的月收入调查了的月收入调查了10 000人,并根据所得数据画了样人,并根据所得数据画了样本的频率分布直方图本的频率分布直方图(如下图如下图).为了分析居民的收入为了分析居民的收入与年龄、学历、职业等方面的关系,要从这与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出人中再用分层抽样方法抽出100人作进一步调查,人作进一步调查,则在则在2500,3000(元元)月收入段应抽出月收入段应抽出_人人.0.00010.00020.00030.00040.0005月收入月收

24、入(元元)频率频率/组距组距251000 1500 2000 2500 3000 3500 400032ppt课件频率组距课堂练习课堂练习0.30.14.34.54.74.95.1视力视力频率频率/组距组距A.0.27,78B.0.27,83C.2.7,78D.2.7,83A33ppt课件34ppt课件频率分布直方图如下频率分布直方图如下:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5连接频率分布直方图连接频率分布直方图中各小长方形上端的中各小长方形上端的中点中点,得到得到频率分布折频率分布折线图线图35ppt课件频率分

25、布折线图频率分布折线图 由于样本是随机的,不同的样本的由于样本是随机的,不同的样本的得到的频率分布折线图不同,即使对于得到的频率分布折线图不同,即使对于同一样本,不同的分组情况得到的频率同一样本,不同的分组情况得到的频率分布折线图也不同,频率分布折线图是分布折线图也不同,频率分布折线图是随着随着样本的容量样本的容量和和分组情况分组情况的变化而变的变化而变化的。化的。36ppt课件利用样本频分布对总体分布进行相应估计利用样本频分布对总体分布进行相应估计(3)当样本容量无限增大,组距无限缩小,)当样本容量无限增大,组距无限缩小,那么频率折线图就会无限接近于一条光滑曲那么频率折线图就会无限接近于一条

26、光滑曲线线总体密度曲线总体密度曲线。(2)样本容量越大,这种估计越精确。)样本容量越大,这种估计越精确。(1)上例的样本容量为)上例的样本容量为100,如果增至,如果增至1000,其频率分布直方图的情况会有什么变化?假如增其频率分布直方图的情况会有什么变化?假如增至至10000呢?呢?37ppt课件总体密度曲线总体密度曲线频率频率组距组距月均用月均用水量水量/tab (图中阴影部分的面积,表示总体在(图中阴影部分的面积,表示总体在某个区间某个区间(a,b)内取值的百分比)。内取值的百分比)。38ppt课件 用样本分布直方图去估计相应的总体分布时,用样本分布直方图去估计相应的总体分布时,一般样本

27、容量越大,一般样本容量越大,频率分布直方图频率分布直方图就会无限接就会无限接近近总体密度曲线总体密度曲线,就越精确地反映了总体的分布,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值规律,即越精确地反映了总体在各个范围内取值百分比。百分比。总体密度曲线反映了总体在各个范围内取值的总体密度曲线反映了总体在各个范围内取值的百分比百分比,精确地反映了总体的分布规律。是研究总精确地反映了总体的分布规律。是研究总体分布的工具体分布的工具.总体密度曲线总体密度曲线并非所有的总体都存在密度曲线,如一些离散型总体并非所有的总体都存在密度曲线,如一些离散型总体不能由样本折线图得到准确的总体密

28、度曲线不能由样本折线图得到准确的总体密度曲线39ppt课件随堂训练随堂训练40ppt课件41ppt课件42ppt课件43ppt课件44ppt课件6.6.如图是总体密度曲线,下列说法正确的是如图是总体密度曲线,下列说法正确的是()()(A A)组距越大,频率分布折线图越接近于它)组距越大,频率分布折线图越接近于它(B B)样本容量越小,频率分布折线图越接近于它)样本容量越小,频率分布折线图越接近于它(C C)阴影部分的面积代表总体在)阴影部分的面积代表总体在(a,b)(a,b)内取值的百分比内取值的百分比(D D)阴影部分的平均高度代表总体在()阴影部分的平均高度代表总体在(a,b)a,b)内取

29、值的百分比内取值的百分比c45ppt课件茎叶图茎叶图 某赛季甲、乙两名篮球运动员每场比赛某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:得分的原始记录如下:甲运动员得分:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39乙运动员得分:乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,3946ppt课件甲甲乙乙0 12345 2 55 41 6 1 6 7 9 4 90 8 4 6 3 3 6 8 3 8 9 1 叶叶 茎茎 叶叶 当数据是两位有效数字时,用中间的数字表示十位数,即当数据是两位有效数字时,用中间的数字表示十位数,

30、即第一个有效数字,两边的数字表示个位数,即第二个有效数字,第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。因此通常把这样的图叫做茎叶图。1.茎叶图茎叶图:47ppt课件2.画茎叶图的步骤画茎叶图的步骤:1.将每个数据分为茎将每个数据分为茎(高位高位)和叶和叶(低位低位)两部分两部分,在此例中在此例中,茎为十茎为十位上的数字位上的数字,叶为个位上的数字叶为个位上的数字;2.将最小茎和最大茎之间的数按大小次序排成一列将最小茎和最大茎之间的数按大小次序

31、排成一列,写在左写在左(右右)侧侧;3.将各个数据的叶按大小次序将各个数据的叶按大小次序写在其茎右写在其茎右(左左)侧侧.茎叶0813 4 523 6 833 8 945148ppt课件3.茎茎叶叶图优缺点:图优缺点:从统计图上没有原始数据信息的损失,所有从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;茎叶图中的数数据信息都可以从茎叶图中得到;茎叶图中的数据可以随时记录,随时添加据可以随时记录,随时添加,方便记录方便记录与表示与表示 茎叶图只便于表示两位或一位有效数字的数据,茎叶图只便于表示两位或一位有效数字的数据,对位数多的数据不太容易操作;茎叶图只便于记录两对位数多的数

32、据不太容易操作;茎叶图只便于记录两组数据,两组以上的数据虽然能够记录但是没有表示组数据,两组以上的数据虽然能够记录但是没有表示两组记录那么直观、清晰两组记录那么直观、清晰茎叶图对重复出现的数据要重复记录,不能遗漏优点:优点:缺点:缺点:49ppt课件 甲、乙两个小组各甲、乙两个小组各10名学生的英语口语测试成绩如名学生的英语口语测试成绩如下:下:甲组甲组 76 90 84 86 81 87 86 82 85 83乙组乙组 82 84 85 89 79 80 91 89 79 74用茎叶图表示两小组的成绩,并判断哪个小组用茎叶图表示两小组的成绩,并判断哪个小组的成绩更整齐一些的成绩更整齐一些甲甲

33、乙乙7894 9 90 2 4 5 9 91 6 7 6 6 5 4 3 2 1 0甲组成绩较集中,甲组成绩较集中,所以甲组成绩更所以甲组成绩更稳定一些稳定一些50ppt课件 小小 结结 图形图形 优点优点 缺点缺点频率分布频率分布 1)易表示)易表示大量数据大量数据 丢失一些丢失一些直方图直方图 2)直观直观地表明分布地地表明分布地 情况情况 信息信息 1)无信息损失无信息损失 只能处理样本只能处理样本 茎叶图茎叶图 2)随时记录方便记录和表示)随时记录方便记录和表示 容量较小数据容量较小数据51ppt课件几种表示频率分布的方法的优点与不足几种表示频率分布的方法的优点与不足1.频率分布表频率

34、分布表在数量表示上比较确切,但不够直在数量表示上比较确切,但不够直观、形象,分析数据分布的总体态势不太方便。观、形象,分析数据分布的总体态势不太方便。2.频率分布直方图频率分布直方图能够很容易地表示大量数据,能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式。但是从直方在分布表中看不清楚的数据模式。但是从直方图本身得不出原始的数据内容。图本身得不出原始的数据内容。3.频率分布折线图频率分布折线图的优点是它反映了数据的变化的优点是它反映了数据的变化趋势。如果样本容量不断增大,分组的组距不断趋势。如果样本容量不断增

35、大,分组的组距不断缩小,那么折线图就趋向于总体分布的密度曲线。缩小,那么折线图就趋向于总体分布的密度曲线。4.用用茎叶图茎叶图刻画数据有两个优点:一是所有的信刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况。但当样记录和表示,能够展示数据的分布情况。但当样本数据较多或数据位数较多时,茎叶图就显得不本数据较多或数据位数较多时,茎叶图就显得不太方便了。太方便了。52ppt课件4.4.(20102010龙岩高一检测)如图是某赛季甲、乙两名篮球运龙岩高一检测)如图是某赛季甲、乙两名篮球运动员参加的每场

36、比赛得分的茎叶图,则甲、乙两人这几场比动员参加的每场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是赛得分的中位数之和是()()(A A)65 65 (B B)64 64 (C C)63 63 (D D)626253ppt课件用样本的数字特征估计总体的数字特征用样本的数字特征估计总体的数字特征54ppt课件中位数中位数:将一组数据按大小依次排列,把处在:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数平均数)叫做这组数据的中位数.众数众数:在一组数据中,出现次数最多的数据叫:在一组数据中,出现

37、次数最多的数据叫做这组数据的众数做这组数据的众数 平均数平均数:一组数据的算术平均数一组数据的算术平均数,即即 )(121nxxxnX三三 众数、中位数、平均数的概念众数、中位数、平均数的概念55ppt课件 问题问题1:众数、中位数、平均数这三个数众数、中位数、平均数这三个数一般都会来自于同一个总体或样本,它们一般都会来自于同一个总体或样本,它们能表明总体或样本的什么性质?能表明总体或样本的什么性质?平均数平均数:反映所有数据的平均水平反映所有数据的平均水平 众数众数:反映的往往是局部较集中的数据信息反映的往往是局部较集中的数据信息 中位数中位数:是位置型数,反映处于中间部位的是位置型数,反映

38、处于中间部位的 数据信息数据信息 56ppt课件三种数字特征的优缺点三种数字特征的优缺点特征数特征数优优 点点缺缺 点点众数众数体现了样本数据的最大体现了样本数据的最大集中点集中点无法客观反映总体无法客观反映总体特征特征中位数中位数不受少数极端值的影响不受少数极端值的影响 不受少数极端值的不受少数极端值的影响有时也是缺点影响有时也是缺点平均数平均数与每一个数据有关,更与每一个数据有关,更能反映全体的信息能反映全体的信息.受少数极端值的影受少数极端值的影响较大,使其在估响较大,使其在估计总体时的可靠性计总体时的可靠性降低降低.57ppt课件月均用水量月均用水量/t频率频率/组距组距o4.543.

39、532.521.510.50.500.400.300.200.10思考思考1:如何从频率分布直方图中估计:如何从频率分布直方图中估计众数众数?2.25 众数在样本数据的频率分布直方图中,众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。就是最高矩形的中点的横坐标。58ppt课件思考思考2:如何从频率分布直方图中估计:如何从频率分布直方图中估计中位数中位数?0.020.040.060.140.250.220.150.080.04月均用水量月均用水量/t频率频率/组距组距o4.543.532.521.510.50.500.400.300.200.10前四个小矩形的面积前四个小矩形的面积

40、和和=0.492.02后四个小矩形的后四个小矩形的面积和面积和=0.26分析:分析:在样本数据中,有在样本数据中,有50%50%的个体小于或等于中位数,也有的个体小于或等于中位数,也有50%50%的个体大的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等。的面积应该相等。总结:总结:在频率分布直方图中,把频率分布直方图划分左右两在频率分布直方图中,把频率分布直方图划分左右两个面积相等的分界线与个面积相等的分界线与x轴交点的横坐标称为中位数。轴交点的横坐标称为中位数。注注:图中的数据是小矩形的

41、面积即频率图中的数据是小矩形的面积即频率上图中,设中位数为上图中,设中位数为x,则,则 02.25.05.0)2(22.015.008.004.0 xx59ppt课件 思考思考3 3:如何从频率分布直方图中估计:如何从频率分布直方图中估计平均数平均数?注注:图中的数据是小矩形的面积即频率图中的数据是小矩形的面积即频率0.020.040.060.140.250.220.150.080.04月均用水量月均用水量/t频率频率/组距组距o4.543.532.521.510.50.500.400.300.200.10.0.250.751.251.752.25.2.753.253.754.25 平均数等于

42、频率分布直方图中每个小矩形平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。的面积乘以小矩形底边中点的横坐标之和。2.0260ppt课件在频率分布直方图中如何估计在频率分布直方图中如何估计众数众数?月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5众数:频率分布直方图众数:频率分布直方图中中最高最高小长方形底边中小长方形底边中点的点的横坐标横坐标.左图中,众数为左图中,众数为_.2.2561ppt课件在频率分布直方图中如何估计在频率分布直方图中如何估计中位数中位数?月均用水量月均用水量/t频率频率组距

43、组距0.100.200.300.400.500.511.5 22.533.544.5中位数中位数:在频率分布直方图中,:在频率分布直方图中,把频率分布直方图划分左右两个把频率分布直方图划分左右两个面积相等的分界线与面积相等的分界线与x轴交点的轴交点的横坐标横坐标。左图中左图中,中位数为,中位数为_.2.0262ppt课件在频率分布直方图中如何估计在频率分布直方图中如何估计平均数平均数?月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5 平均数是频率分布直方图的平均数是频率分布直方图的“重心重心”,等于频率分布直方图中,等于频

44、率分布直方图中每个小矩形的面积乘以小矩形底边每个小矩形的面积乘以小矩形底边中点的横坐标之和中点的横坐标之和.左图中左图中,平均数为,平均数为_.2.0263ppt课件方差与标准差方差与标准差64ppt课件1.频率分布折线图频率分布折线图:月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5连接频率分布直方图连接频率分布直方图中各小长方形上端的中各小长方形上端的中点中点,得到得到频率分布折频率分布折线图线图复习提问:65ppt课件2.总体总体密度曲线密度曲线频率频率组距组距月均用月均用水量水量/tab (图中阴影部分的面积,表示

45、总体在(图中阴影部分的面积,表示总体在某个区间某个区间(a,b)内取值的百分比)。内取值的百分比)。66ppt课件3.茎茎叶叶图优缺点:图优缺点:从统计图上没有原始数据信息的损失,所有从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;茎叶图中的数数据信息都可以从茎叶图中得到;茎叶图中的数据可以随时记录,随时添加据可以随时记录,随时添加,方便记录方便记录与表示与表示 茎叶图只便于表示两位或一位有效数字的数据,茎叶图只便于表示两位或一位有效数字的数据,对位数多的数据不太容易操作;茎叶图只便于记录两对位数多的数据不太容易操作;茎叶图只便于记录两组数据,两组以上的数据虽然能够记录但是

46、没有表示组数据,两组以上的数据虽然能够记录但是没有表示两组记录那么直观、清晰两组记录那么直观、清晰茎叶图对重复出现的数据要重复记录,不能遗漏优点:优点:缺点:缺点:67ppt课件在频率分布直方图中如何估计在频率分布直方图中如何估计众数众数?月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5众数:频率分布直方图众数:频率分布直方图中中最高最高小长方形底边中小长方形底边中点的点的横坐标横坐标.左图中,众数为左图中,众数为_.2.2568ppt课件在频率分布直方图中如何估计在频率分布直方图中如何估计中位数中位数?月均用水量月均用水

47、量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5中位数中位数:在频率分布直方图中,:在频率分布直方图中,把频率分布直方图划分左右两个把频率分布直方图划分左右两个面积相等的分界线与面积相等的分界线与x轴交点的轴交点的横坐标横坐标。左图中左图中,中位数为,中位数为_.2.0269ppt课件在频率分布直方图中如何估计在频率分布直方图中如何估计平均数平均数?月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5 平均数是频率分布直方图的平均数是频率分布直方图的“重心重心”,等于频率分

48、布直方图中,等于频率分布直方图中每个小矩形的面积乘以小矩形底边每个小矩形的面积乘以小矩形底边中点的横坐标之和中点的横坐标之和.左图中左图中,平均数为,平均数为_.2.0270ppt课件 引言引言:样本的众数、中位数和平均数常用来表样本的众数、中位数和平均数常用来表示样本数据的示样本数据的“中心值中心值”,其中众数和中位数容,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息达样本数据中的少量信息.平均数代表了数据更多平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的的信息,但受样本中每个数据的影响,越极端的数

49、据对平均数的影响也越大数据对平均数的影响也越大.当样本数据质量比较当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度统计数字刻画样本数据的离散程度.71ppt课件情境一情境一:某农场种植了甲、乙两种玉米苗,从中各某农场种植了甲、乙两种玉米苗,从中各抽取了抽取了1010株,分别测得它们的株高如下:株,分别测得它们的株高如下:(单位单位cm)cm)甲:

50、甲:31 32 35 37 33 30 32 31 30 29乙:乙:53 16 54 13 66 16 13 11 16 62思考:思考:哪种玉米苗长得齐?哪种玉米苗长得齐?x=32乙x=32甲72ppt课件甲甲37(最大值)(最大值)29(最小值(最小值)8乙乙66(最大值)(最大值)11(最小值)(最小值)55极极 差差 甲甲:31 32 35 37 33 30 32 31 30 29 乙乙:53 16 54 13 66 16 13 11 16 62甲甲32372937321166乙乙73ppt课件情景二情景二:在一次射击选拔赛中,甲、乙两在一次射击选拔赛中,甲、乙两名运动员各射击名运动

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(用样本估计总体课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|