1、第二节第二节 直方图和箱线图直方图和箱线图一、直方图一、直方图 二、箱线图二、箱线图 三、小结三、小结 男子的头颅的最大宽度男子的头颅的最大宽度(mm),),141 148 132138 154 142150 146 155 158 150 140 147 148 144150 149 145149 158 143 141 144 144 126 140 144142 141 140145 135 147 146 141 136 140 146 142137 148 154137 139 143 140 131 143 141 149 148135 148 152143 144 141 143
2、 147 146 150 132 142142 143 153149 146 149 138 142 149 142 137 134144 146 147140 142 140 137 152 145一、直方图一、直方图例例1 1 下面给出了下面给出了8484个伊特拉斯坎个伊特拉斯坎(Etruscan)人人数据的数据的“频率直方图频率直方图”.现在来画这些现在来画这些步骤:步骤:1.找出最小值找出最小值126,最大值最大值158,现取区间现取区间 124.5,159.5;2.将区间将区间 124.5,159.5 等分为等分为7个小区间,个小区间,3.小区间的端点称为组限小区间的端点称为组限,数
3、出落在每个小区数出落在每个小区./nfi算出频率算出频率,if间的数据的频数间的数据的频数,小区间的长度记成小区间的长度记成称为组距;称为组距;7/)5.1245.159(,5 列表如下:列表如下:组组 限限频频 数数频频 率率累计频率累计频率124.5129.510.01190.0119129.5134.540.04760.0595134.5139.5100.11910.1786139.5144.5330.39290.5715144.5149.5240.28570.8572149.5154.590.10710.9643154.5159.530.03571.0000 nfi个小区间上作以个小区
4、间上作以现在自左向右依次在各现在自左向右依次在各,为高的小矩形为高的小矩形这样的图形叫这样的图形叫频率直方图频率直方图.频率直方图频率直方图129.5 134.5 139.5 144.5 149.5 154.5 159.5 nfi.0.0950.0710.0480.024图图 6-1二、箱线图二、箱线图定义定义 ,21nxxxn的样本观察值的样本观察值设有容量为设有容量为;1pxnp 个观察值小于或等于个观察值小于或等于至少有至少有)(.)1(2pxpn个观察值大于或等于个观察值大于或等于至少有至少有)(.得得分位数可按以下法则求分位数可按以下法则求样本样本 p,21,将将xx.)()2()1
5、(nnxxxx 成成按从小到大的顺序排列按从小到大的顺序排列不是整数,不是整数,若若npo1 中的两点要求,中的两点要求,义义则只有一个数据满足定则只有一个数据满足定的最小整数的最小整数这一数据位于大于这一数据位于大于np样本样本它具有以下的性质:它具有以下的性质:,1)0(pxpp记为记为分位数分位数 处,处,是整数,是整数,若若npo2 综上,综上,.1处的数处的数即为位于即为位于 np处的处的和和就取位于就取位于1 npnp.中位数中位数 ,21)1()(npnpxx ,)1(npxpx 不是整数,不是整数,当当np .是整数是整数当当np 特别,特别,称为第一四分位数,称为第一四分位数
6、,分位数分位数25.025.0 x称为第三四分位数,称为第三四分位数,分位数分位数75.057.0 x即有即有称为样本中位数,称为样本中位数,M或或也记为也记为分位数分位数2505.0Qx.时,时,当当5.0 p;又记为又记为1Q.3Q又记为又记为 ,21)12()2(nnxx ,)12(nx5.0 x 不是整数,不是整数,当当np.是整数是整数当当np例例2 2设有一组容量为设有一组容量为18的样本如下(已经排过序)的样本如下(已经排过序)122 126 133 140 145 145 149 150 157.5.025.02.0 xxx,求样本分位数:求样本分位数:解解处,处,位于第位于第
7、416.32.0 xnp因为因为)1(2.0 x即有即有处,处,位于第位于第515.425.0 xnp因为因为)2(是这组数中间两是这组数中间两5.0 xnp因为因为)3(162 166 175 177 177 183 188 199 21225.0 x即有即有2.018,6.3)(4x.14025.018,5.45.018,9 .145个数的平均值,个数的平均值,0.5x即有即有数据集的箱线图是由箱子和直线组成的图形,数据集的箱线图是由箱子和直线组成的图形,它是基于以下五个数的图形概括:它是基于以下五个数的图形概括:,最小值最小值 Min它的作法如下:它的作法如下:,第一四分位数第一四分位数
8、1Q,中位数中位数M和和第三四分位数第三四分位数3Q.Max最大值最大值画一水平数轴,画一水平数轴,)1(.Max下侧平行于数下侧平行于数在数轴上方画一个上、在数轴上方画一个上、轴的矩形箱子,轴的矩形箱子,于于箱子的左右两侧分别位箱子的左右两侧分别位1Q,在轴上标上在轴上标上 Min,3Q,1Q,M3Q.的上方的上方)162157(21 .5.159.内部内部;线线自箱子左侧引一条水平自箱子左侧引一条水平Min)2(在同一水平在同一水平高度自箱子右侧引一条水平线直至最大值高度自箱子右侧引一条水平线直至最大值.段段点的上方画一条垂直线点的上方画一条垂直线在在M线段位于箱子线段位于箱子如图所示如图
9、所示.inMaxMM1Q3Q图图 6-2以下是以下是8个病人的血压(收缩压,个病人的血压(收缩压,mmHg)数)数解解np因为因为故故1Q例例3 3试作出箱线图试作出箱线图.据(已经过排序)据(已经过排序),102 110 117 118 122 123 132 150 25.08 ,2)117110(21.5.113 5.0 xnp因为因为故故np因为因为故故)122118(21.120,475.08,65.08 2Q 75.0 xMinMax作出箱线图如图所示作出箱线图如图所示.)132123(21.5.1273Q ,102,150inMaxMM1Q3Q图图 6-3例例4 4 量(以升计量
10、(以升计.数据应经过排序)数据应经过排序)女子组女子组2.7 2.8 2.9 3.1 3.1 3.1 3.2 3.4 3.4男子组男子组4.1 4.1 4.3 4.3 4.5 4.6 4.7 4.8 4.8试分别画出这两组数据的箱线图试分别画出这两组数据的箱线图.下面分别给出了下面分别给出了2525个男子和个男子和2525个女子的肺活个女子的肺活3.4 3.4 3.4 3.5 3.5 3.5 3.6 3.7 3.73.7 3.8 3.8 4.0 4.1 4.2 4.25.1 5.3 5.3 5.3 5.4 5.4 5.5 5.6 5.7 5.8 5.8 6.0 6.1 6.3 6.7 6.7解
11、解女子组女子组MinMaxMnp因因1Qnp因因3Q男子组男子组np因因1Qnp因因3Q作出箱线图如图所示作出箱线图如图所示.25.052 ,25.675.052 ,75.18.7.3 25.052 ,25.675.052 ,75.18,7.2,2.4,5.3,1.4Min,7.6Max,3.5M .2.3.7.4.8.5 图图 6-4女子女子 男子男子 在数据集中,在数据集中,之间的距离:之间的距离:与第三四分数与第三四分数第一四分位数第一四分位数31QQIQRQQ 13称为称为四分位数间距四分位数间距.,或大于或大于若数据小于若数据小于IQRQIQRQ5.15.1 31 .则认为它是疑似异
12、常值则认为它是疑似异常值某一个观察值不寻常地大于或某一个观察值不寻常地大于或小于该数据集中的其他数据,小于该数据集中的其他数据,称为称为疑似异常值疑似异常值.疑似异常值疑似异常值修正箱线图修正箱线图;)1(同同,计算计算13QQIQR 则认为它是一个则认为它是一个,或大于或大于IQRQIQRQ5.15.131 若一个数据小于若一个数据小于.疑似异常值疑似异常值画出疑似异常值,画出疑似异常值,;*表示表示并以并以)3(自箱子左侧引一水平线段直至数据集中自箱子左侧引一水平线段直至数据集中又自箱子右侧引一又自箱子右侧引一除去疑似异常值后的最小值,除去疑似异常值后的最小值,水平线直至数据集中除去疑似异
13、常值后的最大值水平线直至数据集中除去疑似异常值后的最大值.)1()2(例例5 5 下面给出了某医院下面给出了某医院21个病人的住院时间(以个病人的住院时间(以1 2 3 3 4 4 5 6 6 7 7 9 9解解MinMaxM25.021 因因1Q得得75.021 又又3Q得得IQRQ5.11 IQRIQRQ5.13 124.8 试画出修正箱线图(数据已经过排序)试画出修正箱线图(数据已经过排序).天计),天计),10 12 12 13 15 18 23 55 ,8,25.5,75.1513QQ 85.112 ,24 ,1 ,55,7,4,12,2455 观察值观察值故故55 是疑似异常值,是
14、疑似异常值,且仅此一个疑且仅此一个疑疑似异常值疑似异常值.作出修正箱线图如图所示作出修正箱线图如图所示.图图 6-5inMaxMM1Q3Q 1.1.频率直方图作图步骤频率直方图作图步骤(1)找出最小值和找出最小值和最大值最大值;(2)将选定区间分为将选定区间分为k个小区间;个小区间;./)3(nfi算出频率算出频率 nfi在各个小区间上作以在各个小区间上作以.为高的小矩形为高的小矩形三、小结三、小结 画一水平数轴,画一水平数轴,)1(.Max下侧平行于数下侧平行于数在数轴上方画一个上、在数轴上方画一个上、轴的矩形箱子,轴的矩形箱子,于于箱子的左右两侧分别位箱子的左右两侧分别位1Q,在轴上标上在轴上标上 Min,3Q,1Q,M3Q.的上方的上方.内部内部;线线自箱子左侧引一条水平自箱子左侧引一条水平Min)2(高度自箱子右侧引一条水平线直至最大值高度自箱子右侧引一条水平线直至最大值.段段点的上方画一条垂直线点的上方画一条垂直线在在M线段位于箱子线段位于箱子2.2.箱线图作图步骤箱线图作图步骤在同一水平在同一水平
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。