1、第九章 统计 章章末知识梳理末知识梳理 核心知识归纳核心知识归纳 要点专项突破要点专项突破 知识体系构建知识体系构建 返回导航 第九章 统计 数学(必修第二册RJA) 知识体系构建知识体系构建 返回导航 第九章 统计 数学(必修第二册RJA) 返回导航 第九章 统计 数学(必修第二册RJA) 核心知识归纳核心知识归纳 返回导航 第九章 统计 数学(必修第二册RJA) 一、随机抽样 1简单随机抽样 (1)特征:逐个不放回的抽取;每个个体被抽到的概率都相等. (2)常用方法:抽签法;随机数法. 返回导航 第九章 统计 数学(必修第二册RJA) 2分层随机抽样 (1)定义:按一个或多个变量把总体划分
2、成若干个子总体,每个个体 属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样, 再把所有子总体中抽取的样本合在一起作为总样本. (2)比例分配:在分层随机抽样中,如果每层样本量都与层的大小成 比例,那么称这种样本量的分配方式为比例分配.在比例分配的分层随机 抽样中, m M n N mn MN. (3)在比例分配的分层随机抽样中.我们可以直接用样本平均数估计 总体平均数. 返回导航 第九章 统计 数学(必修第二册RJA) 二、用样本估计总体 1频率分布直方图 可以利用频率分布直方图估计总体的取值规律. 返回导航 第九章 统计 数学(必修第二册RJA) 2百分位数与总体百分位数的估计
3、(1)第p百分位数:一般地,一组数据的第p百分位数是这样一个值, 它使得这组数数据中至少有p%的数据小于或等于这个值,且至少有(100 p)%的数据大于或等于这个值. (2)可以用样本数据的百分位数估计总体的百分位数. 返回导航 第九章 统计 数学(必修第二册RJA) 3众数、中位数和平均数与总体集中趋势的估计 返回导航 第九章 统计 数学(必修第二册RJA) 4总体集中趋势的估计 返回导航 第九章 统计 数学(必修第二册RJA) 要点专项突破要点专项突破 返回导航 第九章 统计 数学(必修第二册RJA) 1两种抽样方法的适用范围:当总体容量较小,样本容量也较小 时,可采用抽签法;当总体容量较
4、大,样本容量较小时,可采用随机数 法;当总体中个体差异较显著时,可采用分层随机抽样. 2掌握两种抽样方法,提升数据分析素养. 要点一要点一 抽样方法的选取及应用 返回导航 第九章 统计 数学(必修第二册RJA) 角度1 分层随机抽样 为了了解学生学习的情况,某校采用分层随机抽样的方 法从高一1 200人、高二1 000人、高三n人中,抽取90人进行问卷调查.已 知高一被抽取的人数为36,那么高三被抽取的人数为 ( ) A20 B24 C30 D32 分析 各层中抽样比例相同. 典典例例 1 B 返回导航 第九章 统计 数学(必修第二册RJA) 解析 根据题意可知,抽取比例为: 36 1 200
5、 3 100, 所以总人数为:90100 3 3 000, 所以高三被抽取的人数为 3 100(3 0001 2001 000)24 返回导航 第九章 统计 数学(必修第二册RJA) 【对点练习】 一个单位有职工800人,其中具有高级职称的160 人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为 了解职工收入情况,决定采用分层随机抽样的方法,从中抽取容量为40 的样本.则从上述各层中依次抽取的人数分别是 ( ) A12,24,15,9 B9,12,12,7 C8,15,12,5 D8,16,10,6 D 解析 由题意知,各种职称的人数比为 1603202001204 8
6、53,所以抽取的具有高、中、初级职称的人数和其他人员的人数分 别为 40 4 208,40 8 2016,40 5 2010,40 3 206 返回导航 第九章 统计 数学(必修第二册RJA) 与频率分布直方图有关问题的常见类型及解题策略 (1)已知频率分布直方图中的部分数据,求其他数据,可利用频率和 等于1求解. (2)已知频率分布直方图,求某种范围内的数据,可利用图形及某范 围结合求解. 要点二要点二 用样本的取值规律估计总体的取值规律 返回导航 第九章 统计 数学(必修第二册RJA) 下表给出了某校500名12岁男孩中用随机抽样得出的120 人的身高资料(单位:cm): (1)列出样本的
7、频率分布表(频率保留两位小数); (2)画出频率分布直方图; (3)估计身高低于134 cm的人数占总人数的百分比. 典典例例 2 区间界限 122,126) 126,130) 130,134) 134,138) 138,142) 人数 5 8 10 22 33 区间界限 142,146) 146,150) 150,154) 154,158 人数 20 11 6 5 返回导航 第九章 统计 数学(必修第二册RJA) 解析 (1)列出样本频率分布表: 分组 频数 频率 122,126) 5 0.04 126,130) 8 0.07 130,134) 10 0.08 134,138) 22 0.1
8、8 138,142) 33 0.28 142,146) 20 0.17 146,150) 11 0.09 150,154) 6 0.05 154,158 5 0.04 合计 120 1.00 返回导航 第九章 统计 数学(必修第二册RJA) (2)画出频率分布直方图,如图所示. (3)因为样本中身高低于 134 cm 的人数的频率为 5810 120 23 120 0.19 所以估计身高低于 134 cm 的人数约占总人数的 19%. 返回导航 第九章 统计 数学(必修第二册RJA) 【对点练习】 某电子商务公司对10 000名网络购物者2018年度 的消费情况进行统计,发现消费金额(单位:万
9、元)都在区间0.3,0.9 内,其频率分布直方图如图所示. (1)直方图中的a_; (2)在这些购物者中, 消费金额在区间0.5,0.9内的 购物者的人数为_. 3 6 000 返回导航 第九章 统计 数学(必修第二册RJA) 解析 (1)由0.11.50.12.50.1a0.12.00.10.8 0.10.21,解得a3 (2)消费金额在区间0.3,0.5)内的频率为0.11.50.12.5 0.4,故在0.5,0.9内的频率为10.40.6 因此,消费金额在区间0.5,0.9内的购物者的人数为0.610 000 6 000 返回导航 第九章 统计 数学(必修第二册RJA) 1四分位数:第2
10、5分位数,第50分位数,第75分位数,这三个分 位数把一组由小到大排列后的数据分成四等份,因此称为四分位数. 2由频率分布直方图求百分位数时,一般采用方程的思想,设出 第p百分位数,根据其意义列出方程求解. 要点三要点三 样本的百分位数 返回导航 第九章 统计 数学(必修第二册RJA) 数学兴趣小组调查了12位大学 毕业生的起始月薪,具体如表: 试确定第85百分位数. 分析 首先从小到大排列各数,再计算i. 解析 将数据从小到大排列:3 710,3 755,3 850,3 880,3 880,3 890,3 920,3 940,3 950,4 050,4 130,4 325计算inp%1285
11、% 10.2,显然i不是整数,所以将i10.2向上取 整,大于i的比邻整数11即为第85百分位数的位 置,所以第85百分位数是4 130 典典例例 3 学生编号 起始月薪 1 3 850 2 3 950 3 4 050 4 3 880 5 3 755 6 3 710 7 3 890 8 4 130 9 3 940 10 4 325 11 3 920 12 3 880 返回导航 第九章 统计 数学(必修第二册RJA) 【对点练习】 新华中学高一年级共有1 200人参加了学校组织的 诗词背诵比赛,已知所有学生成绩的第70百分位数是75分,则成绩大于 或等于75分的学生至少有_人 ( ) A348
12、B360 C372 D384 解析 将1 200人的成绩按照从小到大的顺序排列,75分排在第70 百分位数,就是比75分少的人数占了70%,所以成绩大于或等于75分的 学生至少占了30%,其人数为1 20030%360 B 返回导航 第九章 统计 数学(必修第二册RJA) 为了从整体上更好地把握总体规律,我们还可以通过样本数据的众 数、中位数、平均数估计总体的集中趋势,通过样本数据的方差或标准 差估计总体的离散程度.众数就是样本数据中出现次数最多的那个值;中 位数就是把样本数据按照由小到大(或由大到小)的顺序排列,如果数据 的个数是奇数,中位数为处于中间位置的数,如果数据的个数是偶数, 中位数
13、为中间两个数据的平均数;平均数就是所有样本数据的平均值, 要点四要点四 用样本的集中趋势、离散程度估计总体 返回导航 第九章 统计 数学(必修第二册RJA) 用 x 表示;标准差是反映样本数据分散程度大小的最常用统计量,其计 算公式是 s 1 nx1 x 2x 2 x 2x n x 2.有时也用标准差 的平方(方差)来代替标准差. 返回导航 第九章 统计 数学(必修第二册RJA) 根据某市所在地区的收入水平、消费水平等情况,拟将 家庭年收入低于1.5万元的家庭确定为“贫困户”,家庭年收入在 6.5,7.5)万元的家庭确定为“小康户”,家庭年收入在7.5,8.5万元 的家庭确定为“富裕户”,该市
14、扶贫办为了打好精准脱贫攻坚战,在所 辖某县的100万户家庭中随机抽取200户家庭,对其2019年的全年收入进 行调查,抽查结果的频率分布直方图如图所示. 典典例例 4 返回导航 第九章 统计 数学(必修第二册RJA) 返回导航 第九章 统计 数学(必修第二册RJA) (1)求这 200 户家庭的全年收入的样本均值 x 和方差 s2; (2)用样本的频率分布估计总体分布,估计该县 100 万户家庭中“贫 困户”的数量. 解析 (1)这 200 户家庭的全年收入的样本均值 x 10.06 20.1030.1440.3150.3060.0670.0280.014, 方差 s2(3)20.06(2)20.10(1)20.14020.31 120.30220.06320.02420.011.96 (2)由频率分布直方图可知,样本中“贫困户”的频率为 0.06,所以 估计该县 100 万户家庭中“贫困户”的数量为 1000.066(万户). 返回导航 第九章 统计 数学(必修第二册RJA) 【对点练习】 如图是某班一次考试 结果的频率分布直方图,据此估计该班这次 考试的平均分为_. 75 解析 利用题图中的值估算平均分,有 x 550.1650.2750.4850.2950.175