1、第第28章章 样本与总体样本与总体 在上节课中,我们知道在选取样本时应注在上节课中,我们知道在选取样本时应注 意:意: 1 1、所选取的样本必须具有代表性,、所选取的样本必须具有代表性, 2 2、所选取的样本的容量应该足够大,这样的、所选取的样本的容量应该足够大,这样的 样本才能反映总体的特性,所选取的样本样本才能反映总体的特性,所选取的样本 才比较可靠才比较可靠. . 为了使样本能较好地反映总体情况,除了有为了使样本能较好地反映总体情况,除了有 合适的样本容量外,抽取时还要尽量使每一合适的样本容量外,抽取时还要尽量使每一 个个体有个个体有相等的机会相等的机会被抽到被抽到 例如,可以在例如,可
2、以在2 0002 000名学生的注册学号中,随名学生的注册学号中,随 意抽取意抽取100100个学号,调查这些学号对应的个学号,调查这些学号对应的100100 名学生名学生 整理概念整理概念 简单的随机抽样简单的随机抽样就是用就是用抽签抽签的方法决定的方法决定 哪些个体进入样本,统计学家称这种理哪些个体进入样本,统计学家称这种理 想的抽样方法为简单随机抽样想的抽样方法为简单随机抽样 让我们仍以上一节让我们仍以上一节300名学生的考试成绩为例,考名学生的考试成绩为例,考 察一下抽样调查的结果是否与总体的情况一致。察一下抽样调查的结果是否与总体的情况一致。 首先对总体情况进行分析,根据已知数据,按
3、照首先对总体情况进行分析,根据已知数据,按照1010分分 的距离将成绩分段,统计每个分数段学生出现的频数,的距离将成绩分段,统计每个分数段学生出现的频数, 填入表填入表28.2.128.2.1 300300名学生考试成绩频数分布表名学生考试成绩频数分布表 成绩成绩 段段 39.5 49.5 49.5 59.5 59.5 69.5 69.5 79.5 79.5 89.5 89.5 100 频频 数数 1 9 62 85 96 47 这就是频数分布表 表表28.2.1 根据上表绘制直方图根据上表绘制直方图 (图(图28.2.128.2.1) 300300名学生成绩频数分布直方图名学生成绩频数分布直
4、方图 总体的平均成绩为总体的平均成绩为78.178.1,方差为,方差为116.3116.3 从图表中可以清楚地看出从图表中可以清楚地看出79.579.5分到分到89.589.5分这个分这个 分数段的学生数最多,分数段的学生数最多,9090分以上的同学较少,不及分以上的同学较少,不及 格的学生数最少。格的学生数最少。 这就是这就是 频数分频数分 布直方布直方 图图 活动活动1中,我们用简单的随机抽样方法,已中,我们用简单的随机抽样方法,已 经得到了第一个样本,这经得到了第一个样本,这5个随机数如下表(表个随机数如下表(表 28.2.2):): 抽到的编抽到的编 号号 ( (学号)学号) 111
5、254 167 94 276 成绩成绩 80 86 66 91 67 图图28.2.2是这个样本的频数分布直方图、平均是这个样本的频数分布直方图、平均 成绩和方差。成绩和方差。 5 5名学生成绩频数分布直方图名学生成绩频数分布直方图 第一样本第一样本 样本平均成绩为样本平均成绩为7878,方差为,方差为100.4100.4 图图28.2.2 下面,我们将同学们选取的一些样本,下面,我们将同学们选取的一些样本, 填入下表:填入下表: 同样,也可以作出这两个样本的频数分布直方同样,也可以作出这两个样本的频数分布直方 图、计算它们的平均成绩和方差,如下图:图、计算它们的平均成绩和方差,如下图: 抽到
6、的编号抽到的编号 (学号)(学号) 132 245 5 98 89 成绩成绩 78 73 76 69 75 抽到的编号抽到的编号 (学号)(学号) 9090 167167 8686 275275 5454 成绩成绩 7272 8686 8383 8282 8282 样本平均成绩样本平均成绩 为:为:80.8, 方差为:方差为:42.25 样本平均成绩样本平均成绩 为:为:74.2, 方差为:方差为:14.44 5 5名学生成绩频数分布直方图名学生成绩频数分布直方图 第二样本第二样本 第三样本第三样本 5 5名学生成绩频数分布直方图名学生成绩频数分布直方图 图图28.2.3 从以上三张图比较来看
7、,它们之间从以上三张图比较来看,它们之间 存在明显的差异,平均数和方差与总体存在明显的差异,平均数和方差与总体 的平均数与方差也差异较大,显然这样的平均数与方差也差异较大,显然这样 选择的样本不能反映总体的特性,是不选择的样本不能反映总体的特性,是不 可靠的。可靠的。 样本平均成绩为样本平均成绩为79.779.7,方差为,方差为88.4188.41 让我们再用大一些的样本试一试,让我们再用大一些的样本试一试, 这次每个样本含有这次每个样本含有1010个个体。个个体。 图图28.2.4 10名学生成绩频数分布直方图 第一样本 10 10名学生成绩频数分布直方图名学生成绩频数分布直方图 第二样本
8、图图28.2.4 我们继续用随机抽样方法,重复上述步骤,再取第我们继续用随机抽样方法,重复上述步骤,再取第 二个样本。图二个样本。图28.2.428.2.4是根据小明取到的样本数据得到的频是根据小明取到的样本数据得到的频 数分布直方图。数分布直方图。 样本平均成绩为样本平均成绩为83.383.3,方差为,方差为132.61132.61 再选取一些含有再选取一些含有1010名学生的样本,我们名学生的样本,我们 发现此时不同样本的平均成绩和方差似乎发现此时不同样本的平均成绩和方差似乎 比较接近总体的平均成绩比较接近总体的平均成绩78.178.1和方差和方差116.3116.3。 看来用大一些的样本
9、来估计总体会比较可看来用大一些的样本来估计总体会比较可 靠一点,让我们再用更大一些的样本试一靠一点,让我们再用更大一些的样本试一 试,这次每个样本含有试,这次每个样本含有4040个个体。个个体。图图28.2.528.2.5 是根据小明取到的两个样本数据得到的频是根据小明取到的两个样本数据得到的频 数分布直方图。数分布直方图。 4040名学生成绩频数分布直方图名学生成绩频数分布直方图 第一样本第一样本 样本平均成绩为样本平均成绩为75.6575.65,方差为,方差为103.5275103.5275 图图28.2.5 4040名学生成绩频数分布直方图名学生成绩频数分布直方图 第二样本第二样本 样本
10、平均成绩为样本平均成绩为77.177.1,方差为,方差为114.49114.49 图图28.2.5 再选取一些含有再选取一些含有40名学生的样本,我们发现此时不同名学生的样本,我们发现此时不同 样本的平均成绩和方差与总体的平均成绩和方差的差距更样本的平均成绩和方差与总体的平均成绩和方差的差距更 小了!(小了!(相当接近总体的平均成绩相当接近总体的平均成绩78.1,方差,方差116.3)你)你 们从自己的抽样过程中是否也得出了同样的结果?们从自己的抽样过程中是否也得出了同样的结果? 样本大更容易认样本大更容易认 识总体的真面目。识总体的真面目。 另外两个另外两个40个个体的样本情况:个个体的样本
11、情况: 样本平均成绩为样本平均成绩为 75.7分,分, 方差为方差为104.04 样本平均成绩为样本平均成绩为 77.1分,分, 方差为方差为114.49 当样本中个体太少时,样本当样本中个体太少时,样本 的平均数、方差往往差距较大,的平均数、方差往往差距较大, 如果选取适当的样本的个体数,如果选取适当的样本的个体数, 各个样本的平均数、方差与总体各个样本的平均数、方差与总体 的方差相当接近。的方差相当接近。 一般来说,用样本估计总体时,样本容量越大,样一般来说,用样本估计总体时,样本容量越大,样 本对总体的估计也就越精确,相应地,搜集、整理、本对总体的估计也就越精确,相应地,搜集、整理、 计
12、算数据的工作量也就越大,因此,在实际工作中,计算数据的工作量也就越大,因此,在实际工作中, 样本容量既要考虑问题本身的需要,又要考虑实现的样本容量既要考虑问题本身的需要,又要考虑实现的 可能性和所付出的代价的大小。可能性和所付出的代价的大小。 请同学们在请同学们在300名学生的成绩中用随机抽样名学生的成绩中用随机抽样 的方法选取两个含有的方法选取两个含有20个个体的样本,并计算个个体的样本,并计算 出它们的平均数与方差,绘制频数分布直方图,出它们的平均数与方差,绘制频数分布直方图, 并与总体的平均数、方差比较。并与总体的平均数、方差比较。 课本课本P92 P92 习题习题28.2 328.2
13、3题题 例例2某养鱼专业户为了估计湖里有多少条鱼,先某养鱼专业户为了估计湖里有多少条鱼,先 捕上捕上100条做上标记,然后放回到湖里,过一段时条做上标记,然后放回到湖里,过一段时 间待带标记的鱼完全混合于鱼群后,再捕上间待带标记的鱼完全混合于鱼群后,再捕上200条条 鱼,发现其中带标记的鱼有鱼,发现其中带标记的鱼有20条,湖里大约有多少条,湖里大约有多少 条鱼条鱼? 解:解: 设湖里大约有设湖里大约有x条鱼,条鱼, 则则 100:x20:200 x1000 答:湖里大约有答:湖里大约有1000条鱼条鱼 评注:评注:本题一方面考查了学生由样本估计总体的思本题一方面考查了学生由样本估计总体的思 想方法和具体做法,另一想方法和具体做法,另一 方面考察了学生应用数学方面考察了学生应用数学 的能力,这也是中考命题的一个重要方向的能力,这也是中考命题的一个重要方向