1、第九章第九章 统计统计第九章第九章 统计统计9 9. .2 2 用样本估计用样本估计总体总体9.2.2 总体百分位数的估计第九章 统计第九章第九章 统计统计第九章第九章 统计统计 前面前面, ,我们用频率分布表、频率分布直方图描述了居民用户月我们用频率分布表、频率分布直方图描述了居民用户月均用水量的样本数据均用水量的样本数据, ,通过对图表的观察与分析,得出了一些样本通过对图表的观察与分析,得出了一些样本数据的数据的频率分布规律频率分布规律,并由此推测了该市全体居民用户,并由此推测了该市全体居民用户, ,月均用水月均用水量的分布情况量的分布情况, ,得出了得出了“大部分居民用户的月均用水量集中
2、在一个大部分居民用户的月均用水量集中在一个较低值区域较低值区域”等推断等推断. . 接下来的问题是,如何利用这些信息,为政府决策服务呢接下来的问题是,如何利用这些信息,为政府决策服务呢? ?下面我们对此进行讨论下面我们对此进行讨论. .第九章第九章 统计统计第九章第九章 统计统计问题1 如果该市政府希望使80%的居民用户生活用水费支出不受影响,根据9.2.1节中100户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用水量标准的建议吗? 首先要明确一下问题:根据市政府的要求确定居民首先要明确一下问题:根据市政府的要求确定居民用户月均用水量标准用户月均用水量标准, ,就是要寻找一个数就
3、是要寻找一个数a a, ,使全市居民使全市居民用户月均用水量中用户月均用水量中不超过不超过a a的占的占80%80%,大于,大于a a的占的占20%. 20%. 下下面我们通过样本数据对面我们通过样本数据对a a的值进行估计的值进行估计. .第九章第九章 统计统计第九章第九章 统计统计 把100个样本数据按从小到大排序,得到第80个和第81个数据分别为13.6和13.8.可以发现,区间(13.6,13.8)内的任意一个数,都能把样本数据分成符合要求的两部分. 一般地,我们取这两个数的平均数 (13.6+13.8)2=13.7,并称此数为这组数据的第80百分位数或80%分位数.你认为你认为14t
4、14t这个标准一定能够保证这个标准一定能够保证80%80%的居民用水不超标吗的居民用水不超标吗? ?如果不如果不一定一定, ,那么哪些环节可能会导致结论的差别那么哪些环节可能会导致结论的差别? ?第九章第九章 统计统计第九章第九章 统计统计 一个值能使一组数据中至少有一个值能使一组数据中至少有p%p%的数据小于或等于它,的数据小于或等于它,且至少有且至少有(100-p)%(100-p)%的数据大于或等于它,那么这个值就叫做的数据大于或等于它,那么这个值就叫做这组数据的这组数据的第第p p百分位数百分位数. .1.1.第第p p百分位数的概念:百分位数的概念:2.2.计算计算n n个个第第p p
5、百分位数的步骤:百分位数的步骤:第第1 1步:步:按从小到大排列原始数据按从小到大排列原始数据. .第第2 2步:步:计算计算i=ni=np%p%. . 第第3 3步:步:若若i i不是整数,而大于不是整数,而大于i i的比邻整数为的比邻整数为j j,则第,则第p p百分位百分位 数为第数为第j j项数据项数据; 若若i i是整数,则第是整数,则第p p百分位数为第百分位数为第i i项与第项与第(i+1)(i+1)项数据项数据 的平均数的平均数. .第九章第九章 统计统计第九章第九章 统计统计例2 根据9.1.2节问题3中女生的样本数据,估计树人中学高一年级 女生的第25,50,75 百分位数
6、.163.0 164.0 161.0 157.0 162.0 165.0 158.0 155.0 164.0 162.5 154.0 154.0 164.0 149.0 159.0 161.0 170.0 171.0 155.0 148.0 172.0 162.5 158.0 155.5 157.0 163.0 172.0148.0 149.0 154.0 154.0 155.0 155.0 155.5 157.0 157.0148.0 149.0 154.0 154.0 155.0 155.0 155.5 157.0 157.0158.0 158.0 159.0 161.0 161.0 16
7、2.0 162.5 162.5 163.0158.0 158.0 159.0 161.0 161.0 162.0 162.5 162.5 163.0163.0 164.0 164.0 164.0 165.0 170.0 171.0 172.0 172.0163.0 164.0 164.0 164.0 165.0 170.0 171.0 172.0 172.0解解: : 把把2727名女生的样本数据按从小到大排序,可得名女生的样本数据按从小到大排序,可得据此可以估计树人中学高一年级女生的第据此可以估计树人中学高一年级女生的第2525,5050,7575百百分位数分别约为分位数分别约为155.51
8、55.5,161161和和164164. .由由25%X27=6.7525%X27=6.75, ,50%X27=13.550%X27=13.5, ,75%X27=20.2575%X27=20.25, ,可知样本数据的第可知样本数据的第2525,5050,7575百分位数为百分位数为第第7 7,1414,2121项数据,项数据,分别为分别为155.5155.5,161161,164. 164. 第九章第九章 统计统计第九章第九章 统计统计例3 根据课本表9.2-1或图9.2-1,估计月均用水量的样本数据的80%和95%分位数.分组分组频数频数频率频率1.2,4.2)1.2,4.2)23230.2
9、30.234.2,7.2)4.2,7.2)32320.320.327.2,10.2)7.2,10.2)13130.130.1310.2,13.2)10.2,13.2)9 90.090.0913.2,16.2)13.2,16.2)9 90.090.0916.2,19.2)16.2,19.2)5 50.050.0519.2,22.2)19.2,22.2)3 30.030.0322.2,25.2)22.2,25.2)4 40.040.0425.2,28.225.2,28.2 2 20.020.02合计合计1001001.001.00分析分析:在某些情况下:在某些情况下, ,我们只能获得我们只能获得整
10、理好的统计表或统计图整理好的统计表或统计图, ,与原始数与原始数据相比,它们损失了一些信息、例据相比,它们损失了一些信息、例如由表如由表9.2-19.2-1,我们知道,我们知道16.216.2, ,19.2)19.2)内有内有5 5个数据,但不知道这个数据,但不知道这5 5个数据个数据具体是多少具体是多少. .此时,通常把它们看成此时,通常把它们看成均匀地分布在此区间上均匀地分布在此区间上. .第九章第九章 统计统计第九章第九章 统计统计由表由表9.2-19.2-1知,月均用水量在知,月均用水量在13.2t13.2t以下居民用户所占比例为以下居民用户所占比例为23%+32%+13%+9%=77
11、%.23%+32%+13%+9%=77%.解解: :在在16.2t16.2t以下的居民用户所占的比例为以下的居民用户所占的比例为77%+9%=86%.77%+9%=86%.因此,因此,80%80%分位分位数一定位于数一定位于13.2,16.2)13.2,16.2)内内. .由由13.2+313.2+3 = =0.770.77- -0.860.860.770.77- -0.800.8014.214.2, 估计估计80%80%分位数约为分位数约为14.214.2. .估计估计95%95%分位数约为分位数约为22.9522.95. .同理同理, ,由由22.2+322.2+3 = =0.940.94
12、- -0.980.980.940.94- -0.950.9522.9522.95,第九章第九章 统计统计第九章第九章 统计统计 你能用图9.2-1的直方图估计月均用水量样本数据的80%和95%分位数吗?月均用水量月均用水量/t/t0.0770.077频率频率/ /组距组距0.1070.1070.0430.0430.0300.0300.0300.0300.0170.0170.0100.0100.0130.0130.0070.0070 00.020.020.080.080.10.10.060.060.040.044.24.21.21.27.27.2 10.210.2 13.213.2 16.216
13、.2 19.219.2 22.222.2 25.225.2 28.228.2第九章第九章 统计统计第九章第九章 统计统计设设80%80%分位数为分位数为m m,则,则0.77+(m-13.2)0.77+(m-13.2)0.030=0.800.030=0.80,解得,解得m=14.2.m=14.2.设设9595% %分位数为分位数为m m,则,则0.94+(n-22.2)0.94+(n-22.2)0.013=0.950.013=0.95,解得,解得n=22.97.n=22.97.月均用水量月均用水量/t/t0.0770.077频率频率/ /组距组距0.1070.1070.0430.0430.03
14、00.0300.0300.0300.0170.0170.0100.0100.0130.0130.0070.0070 00.020.020.080.080.10.10.060.060.040.044.24.21.21.27.27.2 10.210.2 13.213.2 16.216.2 19.219.2 22.222.2 25.225.2 28.228.2 为什么利用直方图得到的为什么利用直方图得到的95%95%分位数与利用频率分布表分位数与利用频率分布表得到的得到的95%95%分位数不一样?分位数不一样?第九章第九章 统计统计第九章第九章 统计统计1数据数据7.0, 8.4, 8.4, 8.4
15、, 8.6, 8.7, 9.0, 9.1的第的第30百百分位数是分位数是 8.4因为830%2.4,故30%分位数是第三项数据8.4.课堂检测第九章第九章 统计统计第九章第九章 统计统计2一组样本数据的频率分布直方图如图所示,试估计此样一组样本数据的频率分布直方图如图所示,试估计此样本数据的第本数据的第50百分位数为百分位数为 第九章第九章 统计统计第九章第九章 统计统计3已知已知100个数据的第个数据的第75百分位数是百分位数是9.3,则下列说法正确,则下列说法正确的是的是()A. 这这100个数据中一定有个数据中一定有75个数小于或等于个数小于或等于9.3B. 把这把这100个数据从小到大
16、排列后,个数据从小到大排列后,9.3是第是第75个数据个数据C. 把这把这100个数据从小到大排列后,个数据从小到大排列后,9.3是第是第75个数据和第个数据和第 76个数据的平均数个数据的平均数D. 把这把这100个数据从小到大排列后,个数据从小到大排列后,9.3是第是第75个数据和第个数据和第 74个数据的平均数个数据的平均数C C第九章第九章 统计统计第九章第九章 统计统计4、从某珍珠公司生产的产品中,任意抽取从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它颗珍珠,得到它们的质量们的质量(单位:单位:g)如下:如下:7.9, 9.0, 8.9, 8.6, 8.4, 8.5, 8.5,
17、 8.5, 9.9, 7.8, 8.3, 8.0.(1)分别求出这组数据的第分别求出这组数据的第25,75,95百分位数百分位数第九章第九章 统计统计第九章第九章 统计统计4、从某珍珠公司生产的产品中,任意抽取从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它颗珍珠,得到它们的质量们的质量(单位:单位:g)如下:如下:7.9, 9.0, 8.9, 8.6, 8.4, 8.5, 8.5, 8.5, 9.9, 7.8, 8.3, 8.0.(2)请你找出珍珠质量较小的前请你找出珍珠质量较小的前15%的珍珠质量的珍珠质量第九章第九章 统计统计第九章第九章 统计统计4、从某珍珠公司生产的产品中,任意抽取从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它颗珍珠,得到它们的质量们的质量(单位:单位:g)如下:如下:7.9, 9.0, 8.9, 8.6, 8.4, 8.5, 8.5, 8.5, 9.9, 7.8, 8.3, 8.0.(3)若用第若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准等级的划分标准第九章第九章 统计统计第九章第九章 统计统计作业: