1、总体百分位数的估计 复习引入 前面我们用频率分布表、频率分布直方图描述了居民用户月均用水量的样本数据,前面我们用频率分布表、频率分布直方图描述了居民用户月均用水量的样本数据,通过对图表的观察与分析,得出了一些样本数据的频率分布规律,由此推测了该通过对图表的观察与分析,得出了一些样本数据的频率分布规律,由此推测了该市全体居民用户月均用水量的分布情况,得出了市全体居民用户月均用水量的分布情况,得出了“大部分居民用户的月均用水量大部分居民用户的月均用水量集中在一个较低值区域集中在一个较低值区域”等推断等推断.接下来的问题是,如何利用这些信息,为政府决接下来的问题是,如何利用这些信息,为政府决策服务呢
2、?下面我们对此进行讨论策服务呢?下面我们对此进行讨论.问题1 如果如果该市政府希望使该市政府希望使80%的居民用户生活用水费支出不受影响,根据的居民用户生活用水费支出不受影响,根据9.2.1节中节中100户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用水量标准户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用水量标准的建议吗?的建议吗?问题2首先要明确一下问题:根据市政府首先要明确一下问题:根据市政府的要求确定居民用户月均用水量标的要求确定居民用户月均用水量标准,就是要寻找一个数准,就是要寻找一个数a,a,使全市居使全市居民用户月均用水量中不超过民用户月均用水量中不超
3、过a a的占的占80%,80%,大于大于a a的占的占20%.20%.9.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.09.0 13.6 14.9 5.9 4.0 7.1 6.4 5.4 19.4 2.02.2 8.61 3.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5 2.2 8.61 3.8 5.4 10.2 4.9 6.8 14.0 2.0 10.5 2.1 2.1 5.7 5.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 5.1 16.8 6.0 11.1 1.3 11.2 7.7 4.94.92.3 10.0
4、16.7 12.0 12.4 7.8 5.2 13.6 2.6 2.3 10.0 16.7 12.0 12.4 7.8 5.2 13.6 2.6 2 22.42.43.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.03.6 7.1 8.8 25.6 3.2 18.3 5.1 2.0 3.0 12.022.2 10.8 5.5 2.02 4.3 9.9 3.6 5.6 4.4 7.922.2 10.8 5.5 2.02 4.3 9.9 3.6 5.6 4.4 7.95.1 24.5 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.75.1 24.5
5、 6.4 7.5 4.7 20.5 5.5 15.7 2.6 5.75.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.35.5 6.0 16.0 2.4 9.5 3.7 17.0 3.8 4.1 2.35.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.85.3 7.8 8.1 4.3 13.3 6.8 1.3 7.0 4.9 1.87.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.67.1 28.0 10.2 13.8 17.9 10.1 5.5 4.6 3.2 21.6 下面我们通过样本数据对下面
6、我们通过样本数据对 a 的值进行估计的值进行估计.(1)把把100个样本数据按从小到大排序个样本数据按从小到大排序 1.3 1.3 2.0 2.013.3 13.6 13.8 13.8 28.0 可以发现,区间可以发现,区间(13.6,13.8)内的任意一个数,都能把样本数据分成符合要求的两内的任意一个数,都能把样本数据分成符合要求的两部分部分(3)我们取这两个数的我们取这两个数的平均数平均数 称此数称此数13.7为这组数据的为这组数据的第第80百分位数百分位数或或80%分位数分位数13.6+13.8=13.72 根据样本数据的第根据样本数据的第80百分位数,我们可以估计总体数据的第百分位数,
7、我们可以估计总体数据的第80百分位数为百分位数为13.7左右左右.由于样本的取值规律与总体的取值规律之间会存在偏差,而在决策问题中,只要由于样本的取值规律与总体的取值规律之间会存在偏差,而在决策问题中,只要临界值近似为第临界值近似为第80百分位数即可,因此为了实际中操作的方便,可以建议市政府百分位数即可,因此为了实际中操作的方便,可以建议市政府把月均用水量标准定为把月均用水量标准定为14 t,或者把年用水量标准定为,或者把年用水量标准定为168 t.第p百分位数的概念一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或者等于这个值,且至少有(100-p)%的数据大
8、于或者等于这个值.求百分位数时,一定要将数据求百分位数时,一定要将数据按照按照从小到大的顺序排列从小到大的顺序排列 第第1步,按从小到大排列原始数据步,按从小到大排列原始数据.第第2步,步,计算计算 第第3步,若步,若i不是整数不是整数,而,而大于大于i的比邻整数为的比邻整数为j,则,则第第p百分位数为第百分位数为第j项数据项数据;若若i是整数是整数,则第,则第p百分位数为百分位数为第第i项与第项与第(i1)项数据的平均数项数据的平均数.计算第p百分位数的步骤%inp 我们在初中学过的我们在初中学过的中位数中位数,相当于是,相当于是第第50百分位数百分位数.在实际应用中,除了中位数外在实际应用
9、中,除了中位数外,常用的分位数还有第常用的分位数还有第25百分位数,第百分位数,第75百分位数百分位数.这三个分位数把一组由小到大排这三个分位数把一组由小到大排列后的数据分成四等份,因此称为列后的数据分成四等份,因此称为四分位数四分位数.其中其中第第25百分位数百分位数也称为也称为第一四分位数第一四分位数或或下四分位数下四分位数等,等,第第75百分位数百分位数也称为也称为第三四分位数第三四分位数或或上四分位数上四分位数等等.另外,像第另外,像第1百分位数百分位数,第第5百分位数,第百分位数,第95百分位数和第百分位数和第99百分位数在统计中也百分位数在统计中也经常被使用经常被使用.例例2.根据
10、根据9.1.2节问题节问题3中中27名女生的样本数据名女生的样本数据,估计树人中学高一年级女生的第估计树人中学高一年级女生的第25,50,75百分百分位数位数.163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0 162.5 154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0 155.0 148.0 172.0 162.5 158.0 155.5 157.0 163.0 172.0 解解:把:把27名女生的样本数据按从小到大排序名女生的样本数据按从小到大排序,可得可得 148.0 149.0 15
11、4.0 154.0 155.0 155.0 155.5 157.0 157.0 158.0 158.0 159.0 161.0 161.0 162.0 162.5 162.5 163.0 163.0 164.0 164.0 164.0 165.0 170.0 171.0 172.0 172.0 例题 例例3、根据下表估计月均用水量的样本数据的、根据下表估计月均用水量的样本数据的80%和和95%分位数分位数.分组分组频数频数频率频率1.2,4.2)230.234.2,7.2)320.327.2,10.2)130.1310.2,13.2)90.0913.2,16.2)90.0916.2,19.2)
12、50.0519.2,22.2)30.0322.2,25.2)40.0425.2,28.220.02合计合计1001.00 解:由解:由频率分布表可知频率分布表可知,月均用水量在月均用水量在13.2t以下的居民用户所占比例以下的居民用户所占比例为为 在在16.2t以下的居民用户所占比例以下的居民用户所占比例为为 因此,因此,80%分位数一定位于分位数一定位于13.2,16.2)内。内。由由 可以估计月均用水量的样本数据的可以估计月均用水量的样本数据的80%分位数约为分位数约为14.2%,77%9%13%32%23%.86%9%77,2.1409.077.080.032.13 类似地,由类似地,由0 50.9422322.95,0.04.9.2可以估计月均用水量的样本数据的95%95%分位数约为22.9522.95 课堂小结谢谢观看