1、例例4 4 为对某小麦杂交组合为对某小麦杂交组合F2代的株高代的株高X进行研究,抽进行研究,抽取容量为取容量为100的样本,测试的原始数据记录如下的样本,测试的原始数据记录如下(单位:单位:厘米厘米),试根据以上数据,画出它的频率直方图,求随,试根据以上数据,画出它的频率直方图,求随机变量机变量X的分布状况。的分布状况。87 88111 91 73 70 92 98105 94 99 91 98110 98 97 90 83 92 88 86 94102 99 89104 94 94 92 96 87 94 92 86102 88 75 90 90 80 84 91 82 94 99102 9
2、1 96 94 94 85 88 80 83 81 69 95 80 97 92 96109 91 80 80 94102 80 86 91 90 83 84 91 87 95 76 90 91 77103 89 88 85 95 92104 92 95 83 86 81 86 91 89 83 96 86 75 92 1.找出数据中最小值找出数据中最小值m=69,最大值最大值M=111,极差为极差为 Mm=422.数据分组,根据样本容量数据分组,根据样本容量n的大小,决定分组数的大小,决定分组数k。一般规律一般规律 30n40 5k6 40n60 6k8 60n100 8k10 100n50
3、0 10k20方法:整理原始数据,加工为分组资料,作出频率分布方法:整理原始数据,加工为分组资料,作出频率分布表,画直方图,提取样本分布特征的信息表,画直方图,提取样本分布特征的信息.步骤如下:步骤如下:数据分组数参考表数据分组数参考表 数据数4060100150200400600800100015002000500010000分组数68791015162024273035395674 一般采取等距分组(也可以不等距分组),组距一般采取等距分组(也可以不等距分组),组距等于比极差除以组数略大的测量单位的整数倍。等于比极差除以组数略大的测量单位的整数倍。57.4969111kmM本例取本例取k=
4、9.本例测量单位为本例测量单位为1厘米,组距为厘米,组距为 3确定组限和组中点值。确定组限和组中点值。注意:组的上限与下限应比数据多一位小数。注意:组的上限与下限应比数据多一位小数。当取当取a=67.5,b=112.49(a略小于略小于m,b略大于略大于M,且且a和和b都比数据多一位小数),分组如下:都比数据多一位小数),分组如下:一般根据:各组中点值一般根据:各组中点值 组距组距=组的上限或下限组的上限或下限1267.5,72.5)72.5,77.5)77.5,82.5)82.5,87.5)87.5,92.5)92.5,97.5)97.5,102.5)102.5,107.5)107.5,11
5、2.5)组中值分别为:组中值分别为:70 75 80 85 90 95 100 105 1104将数据分组,计算出各组频数,作频数、频率分布表将数据分组,计算出各组频数,作频数、频率分布表组序组序区间范围区间范围频数频数fj频率频率Wj=fj/n累计频率累计频率Fj167.5,72.5)67.5,72.5)20.020.02272.5,77.5)50.050.07377.5,82.5)100.100.17482.5,87.5)180.180.35587.5,92.5)300.30.65692.5,97.5)180.180.83797.5,102.5)100.10.938102.5,107.5)
6、40.040.979107.5,112.5)30.031.005.作出频率直方图作出频率直方图以样本值为横坐标,频率以样本值为横坐标,频率/组距为纵坐标;组距为纵坐标;以分组区间为底,以以分组区间为底,以 为高为高 15jjjjjWWYXX作频率直方图作频率直方图 从频率直方图可看到:靠近两个极端的数据出现比从频率直方图可看到:靠近两个极端的数据出现比较少,而中间附近的数据比较多,即中间大两头小的分较少,而中间附近的数据比较多,即中间大两头小的分布趋势,布趋势,随机变量分布状况的最粗略的信息。随机变量分布状况的最粗略的信息。在频率直方图中,在频率直方图中,每个矩形面积恰好等于样本值每个矩形面积
7、恰好等于样本值落在该矩形对应的分组区间内的频率,即落在该矩形对应的分组区间内的频率,即 频率直方图中的小矩形的面积近似地反映了样本数频率直方图中的小矩形的面积近似地反映了样本数据落在某个区间内的可能性大小,故它可近似描述据落在某个区间内的可能性大小,故它可近似描述X的的分布状况。分布状况。11jjjjjjjWSXXWXX.,)(,2121的随机变量的个数的随机变量的个数中不大于中不大于表示表示的一个样本,用的一个样本,用是总体是总体设设xxxxxxsFXXXnn xxsnxFn)(1)(经验分布函数为经验分布函数为定义定义 2,121,321,0)()(21133xxxxFxFF若若若若若若的
8、观察值为的观察值为,则经验分布函数,则经验分布函数,具有一个样本值具有一个样本值设总体设总体例例)1,2,1(,1,0)()(.,)()1()()1()()2()1(21 nkxxxxxnkxxxFxFxxxnxxxnkknnnn若若若若若若的观察值为的观察值为则经验分布函数则经验分布函数如下:如下:将它们按大小次序排列将它们按大小次序排列值值的样本的样本是总体的一个容量为是总体的一个容量为一般,设一般,设.10)()(suplim ,)(1 )(,xFxFPxFxFnxnxnn即即一致收敛于分布函数一致收敛于分布函数以概率以概率时时当当对于任一实数对于任一实数.)(,)()(,使使用用来来从从而而在在实实际际上上可可当当作作只只有有微微小小的的差差别别与与总总体体分分布布函函数数数数的的任任一一个个观观察察值值经经验验分分布布函函时时充充分分大大当当对对于于任任一一实实数数xFxFxFnxn格里汶科定理格里汶科定理例例4