1、1.51.5用样本估计总体用样本估计总体数理统计的基本思想:用样本估计总体. 用样本的某些特性估计总体相应的特性. 用样本的平均数、中位数和众数去估计相应总体的平均水平特性. 用样本的频数、频率、频数分布表、频数分布直方图和频数分布折线图去估计相应总体数据的分布情况. 用样本的极差、方差或标准差去估计相应总体数据的波动情况.复习回顾复习回顾1 1、什么是简单随机抽样?、什么是简单随机抽样?什么样的总体什么样的总体适宜简单随机抽样?适宜简单随机抽样? 2 2、什么是系统抽样?、什么是系统抽样?什么样的总体适宜什么样的总体适宜 系统抽样?系统抽样? 3 3、什么是分层抽样?什么样的总体适宜什么是分
2、层抽样?什么样的总体适宜分层抽样?分层抽样?通过图、表、计算来分析通过图、表、计算来分析样本样本数据数据,找出数找出数据中的规律据中的规律,就可以对就可以对总体总体作出相应的作出相应的估计估计.这种估计一般分成两种这种估计一般分成两种: 是用样本的频率分布估计总体的分布是用样本的频率分布估计总体的分布. 是用样本的数字特征是用样本的数字特征(如平均数、标准差如平均数、标准差 等等)估计总体的数字特征估计总体的数字特征.用样本去估计总体,是研究统计问题的一用样本去估计总体,是研究统计问题的一个基本思想个基本思想.初中时我们学习过样本的频率分布初中时我们学习过样本的频率分布,包括频数、包括频数、频
3、率的概念频率的概念,频率分布表和频率分布直方图的制频率分布表和频率分布直方图的制作作.频率分布频率分布 样本中所有数据(或数据组)的频数和样样本中所有数据(或数据组)的频数和样本容量的比,叫做该数据的本容量的比,叫做该数据的频率频率.频率分布的表示形式有:频率分布的表示形式有: 样本频率分布表样本频率分布表样本频率分布条形图样本频率分布条形图样本频率分布直方图样本频率分布直方图所有数据(或数据组)的频数的分布变化所有数据(或数据组)的频数的分布变化规律叫做规律叫做样本的频率分布样本的频率分布.数据的“代表”平均数:平均数:一般地,对于一般地,对于n n个数个数x x1 1,x,x2 2, ,x
4、,xn n, ,我们把我们把(x(x1 1+x+x2 2+ +x+xn n) )n n叫做这个数的平均数叫做这个数的平均数, ,简称算术平简称算术平均数均数. .中位数中位数: :一般地一般地,n,n个数据按大小顺序排列个数据按大小顺序排列, ,处于最中间处于最中间位置的一个数据位置的一个数据( (或最中间两个数据的平均数或最中间两个数据的平均数) )叫做这叫做这组数据的中位数组数据的中位数. .众数众数: :一组数据中出现次数最多的那个数据叫做这组数一组数据中出现次数最多的那个数据叫做这组数据的众数据的众数. . 平均数平均数, ,中位数和众数中位数和众数都是数据的代表都是数据的代表, ,它
5、们刻画了一它们刻画了一组数据的组数据的“集中趋势集中趋势”. .平均数反映的是数据平均水平平均数反映的是数据平均水平,中位数反映的是一组数据的中间水平,众数反映的,中位数反映的是一组数据的中间水平,众数反映的是一组数据的大多数水平。是一组数据的大多数水平。 极差、方差、标准差,1222212xxxxxxnsn1.5.11.5.1用样本的频率分布用样本的频率分布 估计总体分布估计总体分布(1)(1)我国是世界上严重缺水的国家之一,我国是世界上严重缺水的国家之一,城市缺水问题较为突出。城市缺水问题较为突出。20002000年全国主要城市中缺年全国主要城市中缺水情况排在前水情况排在前1010位的城市
6、位的城市探究探究: :某市政府为了节约生活用水,计划在本某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个市试行居民生活用水定额管理,即确定一个居民月用水量标准居民月用水量标准a , a , 用水量不超过用水量不超过a a的部分的部分按平价收费,超过按平价收费,超过a a的部分按议价收费。的部分按议价收费。如果希望大部分居民的日常生活不受影响,如果希望大部分居民的日常生活不受影响,那么标准那么标准a a定为多少比较合理呢定为多少比较合理呢?为了较合理地确定这个标准,你认为需要做为了较合理地确定这个标准,你认为需要做哪些工作?哪些工作?根据这些数根据这些数据你能得出据你能得
7、出用水量其他用水量其他信息吗信息吗?1.求极差求极差(即一组数据中最大值与最小值的差即一组数据中最大值与最小值的差) 知道这组数据的变动范围知道这组数据的变动范围4.3-0.2=4.12.决定组距与组数(将数据分组)决定组距与组数(将数据分组)3.将数据分组将数据分组(8.2取整取整,分为分为9组组)画频率分布直方图的步骤画频率分布直方图的步骤4.列出列出频率分布表频率分布表.(学生填写频率学生填写频率/组距一栏组距一栏)5.画出画出频率分布直方图频率分布直方图组距组距:指每个小组的两个端点的距离,指每个小组的两个端点的距离, 组数组数:将数据分组将数据分组,当数据在当数据在100个以内时,个
8、以内时,按数据多少常分按数据多少常分5-12组组.4.18.20.5 极极差差组组数数= =组组距距1.1.求极差求极差: 步骤:步骤: 2.2.决定组距与组数决定组距与组数: 组数组数= = 4.3 - 0.2 = 4.14.10.5 = 8.2组距组距极差极差= =3.3.将数据分组将数据分组0,0.5 ),0.5,1 ),4,4.5 画频率分布直方图画频率分布直方图iifx 4.4.列频率分布表列频率分布表100100位居民月均用水量的频率分布表位居民月均用水量的频率分布表第几组频率第几组频率=第几组频数第几组频数样本容量样本容量0.080.080.160.160.300.300.440
9、.440.500.500.280.280.120.120.080.080.020.02频率频率组距组距小长方形的小长方形的面积面积=?5.5.画频率分布直方图画频率分布直方图其相应组距上其相应组距上的频率等于该的频率等于该组距上长方形组距上长方形的面积的面积. = 频频率率长长方方形形的的面面积积组组距距频频率率组组距距月均用水量月均用水量/t0.100.200.300.400.500.511.5 22.533.544.5iifx 一般地一般地, ,作频率分布直方图的方法为作频率分布直方图的方法为: :把把横轴横轴分成若干段,每一段分成若干段,每一段对应对应一个一个组的组的组距组距,以此线段,
10、以此线段为底为底作矩形作矩形,高高等于等于该组的该组的频率频率/ /组距组距( )( ), , 这样这样得到一系列矩形得到一系列矩形, ,每一个矩形的每一个矩形的面积面积恰好恰好是是该组上的该组上的频率频率, ,这些矩形构成这些矩形构成了了频率分布直方图频率分布直方图. .iifx 小长方形的小长方形的面积总和面积总和=?5.5.画频率分布直方图画频率分布直方图月均用水量月均用水量/t0.100.200.300.400.500.511.5 22.533.544.5iifx 月均用水量月均用水量最多的在那最多的在那个区间个区间?5.5.画频率分布直方图画频率分布直方图月均用水量月均用水量/t0.
11、100.200.300.400.500.511.5 22.533.544.5iifx 直方图有那些优直方图有那些优点和缺点点和缺点?5.5.画频率画频率折线图折线图月均用水量月均用水量/t0.100.200.300.400.500.511.5 22.533.544.5iifx 频率分布直方图的特征:频率分布直方图的特征:(1 1)从频率分布直方图可以清楚的)从频率分布直方图可以清楚的看出数据分布的总体趋势看出数据分布的总体趋势(2 2)从频率分布直方图得不出原始)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了原有的具体
12、数据信息就被抹掉了探究:探究:同样一组数据同样一组数据, ,如果组距不同如果组距不同, ,横轴、纵轴横轴、纵轴的单位不同的单位不同, ,得到的图的形状也会不同得到的图的形状也会不同. .不同的形不同的形状给人以不同的印象状给人以不同的印象, ,这种印象有时会影响我们这种印象有时会影响我们对总体的判断对总体的判断. .分别以分别以1和和0.1为组距重新作图为组距重新作图, ,然然后谈谈你对图的印象后谈谈你对图的印象. 样本量越大,样本中落在每个区间内的样本样本量越大,样本中落在每个区间内的样本数的频率越稳定于总体在相应区间内的取值的概数的频率越稳定于总体在相应区间内的取值的概率,率, 样本量越大
13、,用样本的频率分布去估计总体样本量越大,用样本的频率分布去估计总体的分布就越精确。的分布就越精确。 样本量越大,划分的区间越多,每个区间长样本量越大,划分的区间越多,每个区间长度越短,频率折线图就越接近于一条曲线度越短,频率折线图就越接近于一条曲线已知样本已知样本10, 8, 6, 10, 8,13,11,10,12,7,8,9,12,9,11,12,9,10,11,11, 那么频率为那么频率为0.2范围的是范围的是( )A. 5.57.5 B. 7.59.5 C. 9.511.5 D. 11.513.5 分组分组 频数频数 频率频率 5.57.5 2 0.1 7.59.5 6 0.3 9.5
14、11.5 8 0.411.513.5 4 0.2 合计合计 20 1.0D练习练习1:练习练习2:2:有一个容量为有一个容量为50的样本数据的分组的的样本数据的分组的频数如下:频数如下:12.5, 15.5) 315.5, 18.5) 818.5, 21.5) 921.5, 24.5) 1124.5, 27.5) 1027.5, 30.5) 530.5, 33.5) 4(1)列出样本的频率分布表列出样本的频率分布表;(2)画出频率分布直方图画出频率分布直方图;(3)根据频率分布直方图估计根据频率分布直方图估计,数据落在数据落在15.5, 24.5)的百分比是多少)的百分比是多少? 解解:组距为
15、组距为3 分组分组 频数频数 频率频率 频率频率/ 组距组距 12.5, 15.5) 315.5, 18.5) 818.5, 21.5) 921.5, 24.5) 1124.5, 27.5) 1027.5, 30.5) 530.5, 33.5) 40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027频率分布直方图如下频率分布直方图如下:频率频率组距组距0.0100.0200.0300.0400.05012.5 15.50.0600.070 小结:小结:思考思考: 如果当地政府希望使如果当地政府希望使 85% 以上的居以上
16、的居民每月的用水量不超出标准,根据频率民每月的用水量不超出标准,根据频率分分布布表和频率分布直方图,你能对制定月用水量表和频率分布直方图,你能对制定月用水量标准提出建议吗?标准提出建议吗? 频率分布直方图频率分布直方图应用应用步骤步骤1.1.求极差求极差2.2.决定组距与组数决定组距与组数3.3.将数据分组将数据分组4.4.列频率分布表列频率分布表5.5.画频率分布直方图画频率分布直方图1.求极差求极差(即一组数据中最大值与最小值的差即一组数据中最大值与最小值的差) 知道这组数据的变动范围知道这组数据的变动范围4.3-0.2=4.12.决定组距与组数(将数据分组)决定组距与组数(将数据分组)3.将数据分组将数据分组(8.2取整取整,分为分为9组组)小结小结: :画频率分布直方图的步骤画频率分布直方图的步骤4.列出列出频率分布表频率分布表.(学生填写频率学生填写频率/组距一栏组距一栏)5.画出画出频率分布直方图频率分布直方图组距组距:指每个小组的两个端点的距离指每个小组的两个端点的距离 , 组数组数:将数据分组将数据分组,当数据在当数据在100个以内时,个以内时,按数据多少常分按数据多少常分5-12组组.4.18.20.5 极极差差组组数数= =组组距距