1、画一组数据的频率分布直方图画一组数据的频率分布直方图,可以按以可以按以下的步骤进行下的步骤进行:一一、求求极差,极差,即数据中最大值与最小值的差即数据中最大值与最小值的差二、决定二、决定组距组距与组数与组数:组距:组距=极差极差/组数组数三、分组三、分组,通常对组内数值所在区间,通常对组内数值所在区间,取取左闭右开左闭右开区间区间,最后一组取闭区间最后一组取闭区间四、登记四、登记频数频数,计算计算频率频率,列出列出频率分布表频率分布表五、画出五、画出频率分布直方图频率分布直方图(纵轴表示(纵轴表示频率组距频率组距)频率频率/组距组距月平均用水量月平均用水量/t0.500.400.300.200
2、.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 100100位居民月平均用水量的频率分布直方图位居民月平均用水量的频率分布直方图探究:探究:同样一组数据,如果组距不同,横轴、纵轴的单位同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分同的印象,这种印象有时会影响我们对总体的判断。分别以别以1和和0.1为组距重新作图,然后谈谈你对图的印象。为组距重新作图,然后谈谈你对图的印象。频率分布折线图频率分布折线图月均用水量月均用水量/t频率频率组距
3、组距0.100.200.300.400.500.511.5 22.533.544.5连接频率分布直方图连接频率分布直方图中各小长方形上端的中各小长方形上端的中点中点,得到得到频率分布折频率分布折线图线图利用样本频分布对总体分布进行相应估计利用样本频分布对总体分布进行相应估计(3)当样本容量无限增大,组距无限缩小,)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑那么频率分布直方图就会无限接近于一条光滑曲线曲线总体密度曲线总体密度曲线。(2)样本容量越大,这种估计越精确。)样本容量越大,这种估计越精确。(1)上例的样本容量为)上例的样本容量为100,如果增至,如果增至1
4、000,其频率分布直方图的情况会有什么变化?假如增其频率分布直方图的情况会有什么变化?假如增至至10000呢?呢?总体密度曲线总体密度曲线频率频率组距组距月均用月均用水量水量/tab (图中阴影部分的面积,表示总体在(图中阴影部分的面积,表示总体在某个区间某个区间(a,b)内取值的百分比)。内取值的百分比)。用样本分布直方图去估计相应的总体分布时,用样本分布直方图去估计相应的总体分布时,一般样本容量越大,一般样本容量越大,频率分布直方图频率分布直方图就会无限接就会无限接近近总体密度曲线总体密度曲线,就越精确地反映了总体的分布,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值
5、规律,即越精确地反映了总体在各个范围内取值百分比。百分比。总体密度曲线反映了总体在各个范围内取值的总体密度曲线反映了总体在各个范围内取值的百分比百分比,精确地反映了总体的分布规律。是研究总精确地反映了总体的分布规律。是研究总体分布的工具体分布的工具.总体密度曲线总体密度曲线频率频率/组距组距月平均用水量月平均用水量/t0.500.400.300.200.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 0.040.080.150.220.250.140.060.040.02平均数是多少?方差是多少?众数是多少?中位数是多平均数是多少?方差是多少?众数是多少?中位数是多少?少?例
6、例2 2、为了了解一大片经济林的生长情况,随机测量其中的、为了了解一大片经济林的生长情况,随机测量其中的100100株的株的底部周长,得到如下数据表(长度单位:底部周长,得到如下数据表(长度单位:cmcm):1359810211099121110961001031259711711311092102109104112109124871319710212310410412810512311110310592114108104102129126971001151111061171041091118911012180120121104108118129999099121123107111911009
7、91011169710210810195107101102108117991181061199712610812311998121101113102103104108(1)(1)编制频率分布表;(编制频率分布表;(2)2)绘制频率分布直方图;绘制频率分布直方图;(3 3)估计该片经济林中底部周长小于)估计该片经济林中底部周长小于100cm100cm的树木的树木 约占多约占多少,周长不小于少,周长不小于120cm120cm的树木约占多少。的树木约占多少。解解:(1)1)这组数据的最大值为这组数据的最大值为135135,最小值为,最小值为8080,故极差为故极差为55;55;(2)(2)可将其分为
8、可将其分为1111组,组距为组,组距为5;5;(3)(3)分组分组80,8580,85),85,90),130,135,85,90),130,135(4)(4)频率分布表如下频率分布表如下分组频数频率频数/组距80,85)10.010.00285,90)20.020.00490,95)40.040.00895,100)140.140.028100,105)240.240.048105,110)150.150.03110,115)120.120.024115,120)90.090.018120,125)110.110.022125,130)60.060.012130,135)20.020.004
9、合计10010.200.010.020.030.040.050.06周长(cm)频数/组距80859095135110 115 120 125 130100 105课堂练习:课堂练习:1、为检测某种产品的质量,抽取了一个容量为、为检测某种产品的质量,抽取了一个容量为30的样本,的样本,检测结果为一级品检测结果为一级品5件,二级品件,二级品8件,三级品件,三级品13件,次品件,次品4件件 (1)列出样本的频率分布表;列出样本的频率分布表;(2)(2)根据上述结果,估计此种产品为二级品或三级品的概率根据上述结果,估计此种产品为二级品或三级品的概率约是多少约是多少 解:解:(1)样本的频率分布表为:
10、)样本的频率分布表为:0.134次品次品0.4313三级品三级品0.278二级品二级品0.175一级品一级品频率频率频数频数产品产品(2)此种产品为二级品或三级品的概率约为此种产品为二级品或三级品的概率约为0.270.430.7 2.已知样本已知样本10,8,6,10,8,13,11,10,12,7,8,9,12,9,11,12,9,10,11,11,那么频率为那么频率为0.2范围的是范围的是 ()A.5.57.5 B.7.59.5 C.9.511.5 D.11.513.5 分组分组 频数频数 频率频率 频数累计频数累计 5.57.5 2 0.1 2 7.59.5 6 0.3 8 9.511.5 8 0.4 1611.513.5 4 0.2 20 合计合计 20 1.0D