名师伴你行高考一轮总复习新高考版[数学] 第10章.doc

上传人(卖家):四川天地人教育 文档编号:1716167 上传时间:2021-09-13 格式:DOC 页数:31 大小:1.19MB
下载 相关 举报
名师伴你行高考一轮总复习新高考版[数学] 第10章.doc_第1页
第1页 / 共31页
名师伴你行高考一轮总复习新高考版[数学] 第10章.doc_第2页
第2页 / 共31页
名师伴你行高考一轮总复习新高考版[数学] 第10章.doc_第3页
第3页 / 共31页
亲,该文档总共31页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第十章统计统计案例 第一节随机抽样 复习要点1.理解随机抽样的必要性和重要性 2会用简单随机抽样方法从总体中抽取样本;了解分层抽样方法,并进行简单计算 知识点一简单随机抽样 1定义:设一个总体含有 N 个个体,从中_抽取 n 个个体作为样本(nN),如果每次抽取时总体内的 各个个体被抽到的机会_,就把这种抽样方法叫做简单随机抽样 2最常用的简单随机抽样的方法:_和_ 3抽签法与随机数法的区别与联系 抽签法和随机数法都是简单随机抽样的方法,但是抽签法适合在总体和样本都较少,容易搅拌均匀时使用,而 随机数法除了适合总体和样本都较少的情况外,还适用于总体较多但是需要的样本较少的情况,这时利用随机数法

2、 能够快速地完成抽样 答案:1.逐个不放回地都相等2.抽签法随机数法 知识点二分层抽样 1定义:在抽样时,将总体分成_的层,然后按照一定的_,从各层独立地抽取一定数量的个 体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样 2分层抽样的应用范围:当总体是由_的几个部分组成时,往往选用分层抽样 答案:1.互不交叉比例2.差异明显 链/接/教/材 1必修 3P57练习 T2 改编假设从高一年级全体同学(500 人)中随机抽出 60 人参加一项活动,利用随机数法 抽取样本时,先将 500 名同学按 000,001,499 进行编号,如果从随机数表第 8 行第 11 列的数开始,按三位数

3、 连续向右读取,最先抽出的 5 名同学的号码是(下面摘取了此随机数表第 7 行和第 8 行)() 第 7 行:84421 75331 57245 50688 77047 44767 21763 35025 83921 20676 第 8 行:63016 37859 16955 56719 98105 07175 12867 35807 44395 23879 A455068047447176 B169105071286443 C050358074439332 D447176335025212 答案:B解析:第 8 行第 11 列的数是 1,依次是三位数:169,555,671,998,105,

4、071,751,286,735,807,443, 而 555,671,998,751,735,807 超过最大编号 499,故删掉,所以最先抽出的 5 名同学的号码为 169,105,071,286,443. 2必修 3P64A 组 T5一支田径队有男运动员 56 人,女运动员 42 人,用分层抽样的方法从全体运动员中抽 出一个容量为 28 的样本 解:田径队运动员的总人数是 564298(人),要得到 28 人的样本,占总体的比例为2 7. 于是,应该在男运动员中随机抽取 562 716(人), 在女运动员中随机抽取 281612(人) 这样我们就可以得到一个容量为 28 的样本 易/错/问

5、/题 分层抽样:按比例抽样 某工厂生产 A,B,C 三种不同型号的产品,产品数量之比依次为 k53,现用分层抽样的方法抽出一个容量 为 120 的样本,已知 A 种型号的产品共抽取了 24 件,则 C 种型号产品抽取的件数为_ 答案:36解析:A,B,C 三种产品的数量之比依次为 k53, 由 k k53 24 120,解得 k2, 则 C 种型号产品抽取的件数为 120 3 1036. 核/心/素/养 如图所示,某学校共有教师 120 人,从中选出一个 30 人的样本,其中被选出的青年女教师的人数为() A12 人B6 人 C4 人D3 人 答案:D解析:青年教师占的比例为 130%40%3

6、0%,则青年教师的人数为 12030%36(人),又青 年男教师为 24 人,所以青年女教师为 12 人,故青年女教师被选出的人数约为 12 30 1203(人) 题型简单随机抽样 角度.随机数表的运用 试/题/调/研(题题精选,每题都代表一个方向) 12021 江西吉安模拟总体由编号为 00,01,02,48,49 的 50 个个体组成,利用下面的随机数表选取 6 个 个体,选取方法是从随机数表第 6 行的第 9 列和第 10 列数字开始从左到右依次选取两个数字,则选出的第 3 个个 体的编号为() 附:第 6 行至第 9 行的随机数表如下: 2635 7900 3370 9160 1620

7、 3882 7757 4950 3211 4919 7306 4916 7677 8733 9974 6732 2748 6198 7164 4148 7086 2888 8519 1620 7477 0111 1630 2404 2979 7991 9683 5125 A3B16 C38D20 答案D解析按随机数法, 从随机数表第 6 行的第 9 列和第 10 列数字开始从左到右依次选取两个数字, 超出 0049 及重复的不选,则编号依次为 33,16,20,38,49,32,则选出的第 3 个个体的编号为 20.故选 D. 角度.简单随机抽样 试/题/调/研(题题精选,每题都代表一个方向)

8、 22021 福建模拟下面的抽样方法是简单随机抽样的是() A 在某年明信片的销售活动中, 规定每 100 万张为一个开奖组, 通过随机抽取的方式确定号码的后四位为 2 709 的为三等奖 B某车间包装一种产品,在自动传送带上,每隔 5 分钟抽一包产品,称其质量是否合格 C某校分别从行政、教师、后勤人员中抽取 2 人、14 人、4 人了解学校机构改革的意见 D用抽签法从 10 件产品中选取 3 件进行质量检验 答案D解析A,B 不是简单随机抽样,因为抽取的个体间的间隔是固定的;C 也不是,因为总体的个 体有明显的层次;D 是简单随机抽样中的抽签法故选 D. 32021 山西大同一中月考用简单随

9、机抽样的方法从含有 10 个个体的总体中,抽取一个容量为 3 的样本,其 中某一个体 a“第一次被抽到”的可能性与“第二次被抽到”的可能性分别是() A 1 10, 1 10 B 3 10, 1 5 C 1 5, 3 10 D 3 10, 3 10 答案A解析在抽样过程中,个体 a 每一次被抽中的概率是相等的,因为总体容量为 10,故个体 a“第 一次被抽到”的可能性与“第二次被抽到”的可能性均为 1 10,故选 A. 方/法/指/导(来自课堂的最有用的方法) 1简单随机抽样的特点 (1)抽取的个体数较少(2)是逐个抽取(3)是不放回抽取(4)是等可能抽取只有四个特点都满足的抽样才是 简单随机

10、抽样 2抽签法与随机数法的适用情况 (1)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况 (2)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀 题型分层抽样 角度.求总体或样本容量 试/题/调/研(题题精选,每题都代表一个方向) 12019 全国卷西游记 三国演义 水浒传和红楼梦是中国古典文学瑰宝,并称为中国古 典小说四大名著某中学为了解本校学生阅读四大名著的情况,随机调查了 100 位学生,其中阅读过西游记或 红楼梦的学生共有 90 位,阅读过红楼梦的学生共有 80 位,阅读过西游记且阅读过红楼梦的学生 共有 60 位,则该校阅读过西游记

11、的学生人数与该校学生总数比值的估计值为() A0.5B0.6 C0.7D0.8 答案C解析解法一:设调查的 100 位学生中阅读过西游记的学生人数为 x,则 x806090, 解得 x70, 所以该校阅读过西游记的学生人数与该校学生总数比值的估计值为 70 1000.7.故选 C. 解法二:用 Venn 图表示调查的 100 位学生中阅读过西游记和红楼梦的人数之间的关系如图: 易知调查的 100 位学生中阅读过西游记的学生人数为 70, 所以该校阅读过西游记的学生人数与该校学生总数比值的估计值为 70 1000.7.故选 C. 2交通管理部门为了解机动车驾驶员(简称驾驶员)对某项新法规的知晓情

12、况,对甲、乙、丙、丁四个社区做 分层抽样调查假设四个社区驾驶员的总人数为 N,其中甲社区有驾驶员 96 人若在甲、乙、丙、丁四个社区抽 取驾驶员的人数分别为 12,21,25,43,则这四个社区驾驶员的总人数 N 为() A101B808 C1 212D2 012 答案B解析四个社区抽取的总人数为 12212543101,由分层抽样可知,96 12 N 101,解得 N 808. 角度.求某部分样本的数量 试/题/调/研(题题精选,每题都代表一个方向) 32020 新高考某中学的学生积极参加体育锻炼,其中有 96%的学生喜欢足球或游泳,60%的学生喜欢足 球,82%的学生喜欢游泳,则该中学既喜

13、欢足球又喜欢游泳的学生数占该校学生总数的比例是() A62%B56% C46%D42% 答案C解析该校 60%的学生喜欢足球,82%的学生喜欢游泳,这两组数据包含既喜欢足球又喜欢游泳 的学生,而 96%的学生喜欢足球或游泳,则该校既喜欢足球又喜欢游泳的学生数占该校学生总数的比例为 60% 82%96%46%.故选 C. 4今年“315”,某报社做了一次关于“虚假广告”的调查,在 A,B,C,D 四个单位回收的问卷数依次成 公差为正数的等差数列,共回收 1 000 份,因报道需要,再从回收的问卷中按单位分层抽取容量为 150 的样本,若 在 B 单位抽取 30 份问卷,则在 D 单位抽取的问卷份

14、数是() A45B50 C60D65 答案C解析由于 B 单位抽取的问卷是样本容量的1 5,所以 B 单位回收问卷 200 份 由等差数列知识,可得 C 单位回收问卷 300 份,D 单位回收问卷 400 份,则 D 单位抽取的问卷份数是 B 单位 的 2 倍,即为 60 份 方/法/指/导(来自课堂的最有用的方法) 分层抽样问题的类型及解题思路 (1)求某层应抽个体数量:按该层所占总体的比例计算 (2)已知某层个体数量,求总体容量:根据分层抽样就是按比例抽样,列比例式进行计算 (3)分层抽样的计算应根据抽样比构造方程求解,其中“抽样比样本容量 总体容量 各层样本数量 各层个体数量” 提醒分层

15、抽样时,每层抽取的个体可以不一样多,但必须满足抽取 ninNi N(i 1,2,k)个个体(其中 i 是层数,n 是抽取的样本容量,Ni是第 i 层中个体的个数,N 是总体容量) 提醒 完成限时跟踪检测(五十三) 第二节用样本估计总体 复习要点1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图,体会它们各自的 特点 2理解样本数据标准差的意义和作用,会计算数据标准差 3能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释 4会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计 总体的思想 5会用随机抽样的基本方法和样

16、本估计总体的思想解决一些简单的实际问题 知识点一统计图表的含义 1作频率分布直方图的步骤 (1)求极差(即一组数据中最大值与最小值的差); (2)决定组距和组数; (3)将数据分组; (4)列频率分布表; (5)画频率分布直方图 2频率分布折线图:连接频率分布直方图中各小长方形上端的_,就得到频率分布折线图 3总体密度曲线:随着_的增加,作图时所分的_增加,_减小,相应的频率分布折线 图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线 答案:2.中点3.样本容量组数组距 知识点二样本的数字特征 数字特征定义 众数在一组数据中,出现次数_的数据叫做这组数据的众数 中位数 将一组数据

17、按大小依次排列, 把处在_位置的一个数据(或最中间 两个数据的_)叫做这组数据的中位数 在频率分布直方图中,中位数左边和右边的直方图的面积应该_ 平均数 样本数据的算术平均数,即 x _ 方差s2_,其中 s 为标准差 答案:最多中间平均数相等 1 n(x 1x2xn) 1 n(x 1 x )2(x2 x )2(xn x )2 链/接/教/材 1 必修 3P65探究改编某市为了了解居民用水情况, 通过抽样, 获得了某年 100 位居民每人的月均用水量(单 位:吨),将数据按照0,0.5),0.5,1),4,4.5分成 9 组,制成了如图所示的频率分布直方图则直方图中 a 的 值为_;设该市有

18、30 万居民,估计全市居民中月均用水量不低于 3 吨的人数大约为_ 答案:0.3036 000解析:由频率分布直方图知,月均用水量在0,0.5)中的频率为 0.080.50.04, 同理,在0.5,1),1.5,2),2,2.5),3,3.5),3.5,4),4,4.5中的频率分别为 0.08,0.20,0.26,0.06,0.04,0.02, 由 0.040.080.5a0.200.260.5a0.060.040.021, 解得 a0.30. 100 位居民每人的月均用水量不低于 3 吨的频率为 0.060.040.020.12. 由以上样本的频率分布,可以估计全市 30 万居民中月均用水量

19、不低于 3 吨的人数约为 300 0000.1236 000. 2必修 3P81A 组 T4在去年的足球甲 A 联赛上,一队每场比赛平均失球数是 1.5,全年比赛失球个数的标 准差为 1.1;二队每场比赛平均失球数是 2.1,全年失球个数的标准差为 0.4.你认为下列说法中哪一种是正确的,为 什么? (1)平均说来一队比二队防守技术好; (2)二队比一队技术水平更稳定; (3)一队有时表现很差,有时表现又非常好; (4)二队很少不失球 解:(1)对,从平均数的角度考虑 (2)对,从标准差的角度考虑 (3)对,从标准差的角度考虑 (4)对,从平均数和标准差的角度考虑 易/错/问/题 频率分布直方

20、图:中位数与众数的区别;平均值 某次月考后,从所有考生中随机抽取 50 名考生的数学成绩进行统计,得到频率分布直方图如图所示,则该次 考试数学成绩的中位数的估计值是_ 答案:712 3 解析:由频率分布直方图,可知中位数位于 70 到 80 之间,0.0020.0060.0120.0240.044, 0.5 10 0.0440.006,所以由0.006 0.03610 5 3,得中位数的估计值为 71 2 3. 核/心/素/养 数据分析频率分布直方图问题中的核心素养 以随机抽样获取样本为基础,首先画频率分布表、频率分布直方图,然后应用这些图表计算频率、频数和数字 特征 某中学共有 1 000

21、名学生参加了该地区高三第一次质量检测的数学考试,数学成绩如表所示: 数学成 绩分组 0,30)30,60)60,90)90,120)120,150 人数6090300 x160 (1)为了了解同学们前段复习的效果,以便制定下阶段的复习计划,学校将采用分层抽样的方法抽取 100 名同 学进行问卷调查,甲同学在本次测试中数学成绩为 95 分,求他被抽中的概率; (2)已知本次数学成绩的优秀线为 110 分,试根据所提供数据估计该中学达到优秀线的人数; (3)作出频率分布直方图,并估计该学校本次考试的数学平均分(同一组中的数据用该组区间的中点值作代表) 解:(1)分层抽样中,每个个体被抽到的概率均为

22、 样本容量 总体中个体总数, 故甲同学被抽到的概率 P 1 10. (2)由题意 x1 000(6090300160)390, 故估计该中学达到优秀线的人数为 160390120110 12090 290. (3)频率分布直方图 该学校本次考试数学平均分为 6015904530075390105160135 1 000 90. 估计该学校本次考试的数学平均分为 90 分 题型样本的数字特征的计算与应用 角度.众数、中位数、平均值、方差 试/题/调/研(题题精选,每题都代表一个方向) 12019 全国卷演讲比赛共有 9 位评委分别给出某选手的原始评分,评定该选手的成绩时,从 9 个原始评 分中去

23、掉 1 个最高分、 1 个最低分, 得到 7 个有效评分.7 个有效评分与 9 个原始评分相比, 不变的数字特征是() A中位数B平均数 C方差D极差 答案A解析中位数是将 9 个数据从小到大或从大到小排列后, 处于中间位置的数据, 因而去掉 1 个最 高分和 1 个最低分,不变的是中位数,平均数、方差、极差均受影响故选 A. 22020 全国卷,文设一组样本数据 x1,x2,xn的方差为 0.01,则数据 10 x1,10 x2,10 xn的方差为 () A0.01B0.1 C1D10 答案C解析由已知得数据 10 x1,10 x2,10 xn的方差为 1000.011.故选 C. 3多选2

24、021 山东济宁第五次测试一组数据 2x11,2x21,2x31,2xn1 的平均值为 7,方差为 4,记 3x12,3x22,3x32,3xn2 的平均值为 a,方差为 b,则() Aa7Ba11 Cb12Db9 答案BD解析设 Xxi,数据 2x11,2x21,2x31,2xn1 的平均值为 7,方差为 4,即 E(2X1) 7,D(2X1)4,由离散型随机变量的均值公式可得 E(2X1)2E(X)17,所以 E(X)3,因而 3x12,3x2 2,3x32,3xn2 的平均值 aE(3X2)3E(X)233211.由离散型随机变量的方差公式可得 D(2X1) 4D(X)4,所以 D(X)

25、1,因而 3x12,3x22,3x32,3xn2 的方差 bD(3X2)9D(X)9. 4已知一组正数 x1,x2,x3,x4的方差 s21 4(x 2 1x22x23x2416),则数据 x12,x22,x32,x42 的平均 数为_ 答案4解析设正数 x1,x2,x3,x4的平均数为 x ,则 s21 4(x 1 x )2(x2 x )2(x3 x )2(x4 x )2, 得 s21 4(x 2 1x22x23x24) x 2,又已知 s21 4(x 2 1x22x23x2416)1 4(x 2 1x22x23x24)4,所以 x 24,所以 x 2, 故1 4(x 12)(x22)(x3

26、2)(x42) x 24. 方/法/指/导(来自课堂的最有用的方法) 众数、中位数、平均数、方差的意义及常用结论 (1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义, 平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小 (2)方差的简化计算公式:s21 n(x 2 1x22x2n)n x 2,或写成 s21 n(x 2 1x22x2n) x 2,即方差等于原数 据平方的平均数减去平均数的平方 角度.数字特征的应用 试/题/调/研(题题精选,每题都代表一个方向) 5为评估一种农作物的种植效果,选了 n 块地作试验田这 n 块地的亩产量(单

27、位:kg)分别为 x1,x2,xn, 下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是() Ax1,x2,xn的平均数 Bx1,x2,xn的标准差 Cx1,x2,xn的最大值 Dx1,x2,xn的中位数 答案B解析因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应 该用样本数据的极差、方差或标准差 故选 B. 62021 甘肃天水模拟甲、乙两名同学 6 次考试的成绩统计如图所示,甲、乙两组数据的平均数分别为 x 甲, x 乙,标准差分别为甲,乙,则( ) A x 甲 x 乙,甲乙 B x 甲乙 C x 甲 x 乙,甲 x 乙,甲乙 答案C解析由图可知,甲同学

28、除第二次考试成绩略低于乙同学外,其他考试成绩都远高于乙同学,可 知 x 甲 x 乙题图中数据显示甲同学的成绩比乙同学稳定,故甲乙 7甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示: 甲乙丙丁 平均环数 x 8.38.88.88.7 方差 s23.53.62.25.4 从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是() A甲B乙 C丙D丁 答案C解析由题目表格中数据可知,丙的平均环数最高,且方差最小,说明技术稳定,且成绩好,故 选 C. 题型频率分布直方图 角度.频率分布直方图的计算 试/题/调/研(题题精选,每题都代表一个方向) 1多选容量为 100 的

29、样本,其数据分布在2,18,将样本数据分为 4 组:2,6),6,10),10,14),14,18,得 到频率分布直方图如图所示,则下列说法正确的是() A样本数据分布在6,10)的频率为 0.32 B样本数据分布在10,14)的频数为 40 C样本数据分布在2,10)的频数为 40 D估计总体数据大约有 10%分布在10,14) 答案ABC解析样本数据分布在6,10)的频率为 0.0840.32,A 正确;样本数据分布在10,14)的频数 为 1000.1440,B 正确;样本数据分布在2,10)的频数为 100(0.020.08)440,C 正确;样本数据分布 在10,14)的频率为 0.

30、140.4,故估计总体数据大约有 40%分布在10,14),D 不正确故选 ABC. 2多选调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图和“90 后” 从事互联网行业岗位分布条形图,则下列结论中一定正确的是() A互联网行业从业人员中“90 后”占一半以上 B互联网行业中从事技术岗位的“90 后”人数超过总人数的 20% C互联网行业中从事运营岗位的“90 后”人数比“80 前”少 D互联网行业中从事运营岗位的“90 后”人数比“80 后”多 答案AB解析在 A 中, 由整个互联网行业从业者年龄分布饼状图可知互联网行业从业人员中“90 后” 占 56%,故 A

31、正确; 在 B 中,由整个互联网行业从业者年龄分布饼状图和“90 后”从事互联网行业岗位分布条形图可知互联网行 业中从事技术岗位的“90 后”人数占总人数的 56%39.6%22.176%,故 B 正确; 在 C 中,由于“80 前”从事互联网行业岗位情况没有任何信息,所以互联网行业中从事运营岗位的“90 后” 人数不一定比“80 前”少,故 C 错误; 在 D 中,由于 80 后的从事互联网行业岗位情况没有任何信息,所以互联网行业中从事运营岗位的“90 后”人 数不一定比“80 后”多,故 D 错误故选 AB. 解/题/感/悟(小提示,大智慧) 频率、频数、样本容量的计算方法 (1)频率 组

32、距组距频率 (2) 频数 样本容量频率, 频数 频率样本容量,样本容量频率频数 角度.应用频率分布直方图估计样本的数字特征 试/题/调/研(题题精选,每题都代表一个方向) 3“中国人均读书 4.3 本(包括网络文学和教科书),比韩国的 11 本、法国的 20 本、日本的 40 本、犹太人的 64 本少得多,是世界上人均读书最少的国家”这个论断被各种媒体反复引用,出现这样的统计结果无疑是令人 尴尬的某小区为了提高小区内人员的读书兴趣,准备举办读书活动,并购买一定数量的书籍丰富小区图书站由 于不同年龄段的人看不同类型的书籍,为了合理配备资源,现对小区内看书人员进行年龄调查,随机抽取了 40 名 读

33、书者进行调查,将他们的年龄(单位:岁)分成 6 段:20,30),30,40),40,50),50,60),60,70),70,80后得到 如图所示的频率分布直方图 (1)求在这 40 名读书者中年龄分布在40,70)的人数; (2)求这 40 名读书者的年龄的平均数和中位数 解(1)由频率分布直方图知,年龄在40,70)的频率为(0.0200.0300.025)100.75. 故这 40 名读书者中年龄分布在40,70)的人数为 400.7530. (2)这 40 名读书者年龄的平均数为 250.05 350.10450.20550.30650.25750.1054. 设中位数为 x,则 0

34、.005100.010100.020100.030(x50)0.5,解得 x55. 故这 40 名读书者年龄的中位数为 55. 方/法/指/导(来自课堂的最有用的方法) 频率分布直方图中数字特征的计算 (1)最高的小长方形底边中点的横坐标即是众数 (2)中位数左边和右边的小长方形的面积和是相等的 (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点 的横坐标之和 角度.频率分布直方图与概率的综合 试/题/调/研(题题精选,每题都代表一个方向) 42021 湖北襄阳四校联考某种产品的质量以其质量指标值来衡量,质量指标值越大表明质量越好,且质量 指标值

35、大于或等于 100 的产品为优质产品现用两种新配方(分别称为 A 配方和 B 配方)做试验,各生产了 100 件这 种产品, 并测量了每件产品的质量指标值(都在区间90,110内), 将这些数据分成 4 组: 90,95), 95,100), 100,105), 105,110,得到如下两个频率分布直方图: 已知这两种配方生产的产品利润 y(单位: 百元)与其质量指标值 t 的关系式均为 y 1,t95, 0,95t100, 1,100t50%,所以超过了经济收入的一半,所以 D 正确故选 A. 提醒 完成限时跟踪检测(五十四) 第三节变量间的相关关系、统计案例 复习要点1.会作两个有关联变量

36、的数据的散点图,并利用散点图认识变量间的相关关系 2了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不 要求记忆) 3了解独立性检验的思想、方法,并能初步应用独立性检验的思想方法解决一些简单的实际问题 4通过典型案例了解回归分析的思想方法,并能初步应用回归分析的思想、方法解决一些简单的实际问题 知识点一变量间的相关关系 1对具有_的两个变量进行统计分析的方法叫回归分析其基本步骤是:()画散点图;()求 _;()用回归直线方程作预报 2常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系与函数关系不同,相关关系是一 种非确定性关系 3从散点图

37、上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左 上角到右下角的区域内,两个变量的相关关系为负相关 答案:1.相关关系回归直线方程 知识点二回归方程与回归分析 1线性相关关系与回归直线 如果散点图中点的分布从整体上看大致在_附近,就称这两个变量之间具有线性相关关系,这条直线叫 做回归直线 2回归方程 (1)最小二乘法:求回归直线使得样本数据的点到回归直线的_最小的方法叫做最小二乘法 (2)回归方程:方程y b xa 是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的回归 方程,其中a ,b 是待定数 错误错误! 3回归分析

38、 (1)定义:对具有_的两个变量进行统计分析的一种常用方法 (2)样本点的中心:在具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn)中, x 1 n(x 1xn), y 1 n(y 1 yn),a y b x ,( x , y )称为样本点的中心 (3)相关系数 r错误错误!,当 r0 时,两变量_相关,当 r3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为_ 附表: P(K2k0)0.0500.0100.001 k03.8416.63510.828 答案:5%解析:k3.841,查临界值表,得 P(K23.841)0.05,故这种判断出错的可能性为

39、5%. 核/心/素/养 数学建模回归方程问题中的核心素养 先在实际问题中收集数据,画散点图确定相关关系,再用最小二乘法求回归方程,进而用回归模型对实际问题 进行预测 如图是我国 2011 年至 2017 年生活垃圾无害化处理量(单位:亿吨)的折线图 注:年份代码 17 分别对应年份 20112017. (1)由折线图看出,可用线性回归模型拟合 y 与 t 的关系,请用相关系数加以说明; (2)建立 y 关于 t 的回归方程(系数精确到 0.01),预测 2019 年我国生活垃圾无害化处理量 附注: 参考数据:错误错误!i9.32,错误错误!iyi40.17, 错误错误!0.55, 72.646

40、. 参考公式:相关系数 r错误错误!, 回归方程y a b t 中斜率和截距的最小二乘估计公式分别为:b 错误错误!,a y b t . 解:(1)由折线图中数据和附注中参考数据,得 t 4,错误错误!(ti t )228, 错误错误!0.55, 错误错误!(tit )(yi y )错误错误!iyit 错误错误!i 40.1749.322.89, r 2.89 0.5522.6460.99. 因为 y 与 t 的相关系数近似为 0.99,说明 y 与 t 的线性相关程度相当高,从而可以用线性回归模型拟合 y 与 t 的关系 (2)由 y 9.32 7 1.331 及(1),得 b 错误错误!2

41、.89 28 0.103, a y b t 1.3310.10340.92. 所以 y 关于 t 的回归方程为y 0.920.10t. 将 2019 年对应的 t9 代入回归方程,得y 0.920.1091.82. 所以预测 2019 年我国生活垃圾无害化处理量约为 1.82 亿吨 题型变量间的相关关系 试/题/调/研(题题精选,每题都代表一个方向) 1已知变量 x 和 y 满足关系 y0.1x1,变量 y 与 z 正相关下列结论中正确的是() Ax 与 y 正相关,x 与 z 负相关 Bx 与 y 正相关,x 与 z 正相关 Cx 与 y 负相关,x 与 z 负相关 Dx 与 y 负相关,x

42、 与 z 正相关 答案C解析根据正相关和负相关的定义进行判断若线性回归方程的斜率为正,则两个变量正相关, 若斜率为负,则负相关 因为 y0.1x1 的斜率小于 0,故 x 与 y 负相关 因为 y 与 z 正相关,可设 zb ya ,b 0,则 zb ya 0.1b xb a , 故 x 与 z 负相关 2对变量 x,y 有观测数据(xi,yi)(i1,2,3,4,5),得表 1;对变量 u,v 有观测数据(ui,vi)(i1,2,3,4,5),得表 2. 由这两个表可以判断() 表 1: x12345 y2.93.33.64.45.1 表 2: u12345 v2520211513 A.变量

43、 x 与 y 正相关,u 与 v 正相关 B变量 x 与 y 负相关,u 与 v 正相关 C变量 x 与 y 负相关,u 与 v 负相关 D变量 x 与 y 正相关,u 与 v 负相关 答案D解析由题可知,随着 x 的增大,对应的 y 值增大,其散点图呈上升趋势,故 x 与 y 正相关; 随着 u 的增大,v 减小,其散点图呈下降趋势,故 u 与 v 负相关 32020 全国卷,文,理某校一个课外学习小组为研究某作物种子的发芽率 y 和温度 x(单位:)的关系, 在 20 个不同的温度条件下进行种子发芽实验,由实验数据(xi,yi)(i1,2,20)得到下面的散点图: 由此散点图,在 10 至

44、 40 之间,下面四个回归方程类型中最适宜作为发芽率 y 和温度 x 的回归方程类型的 是() AyabxByabx2 CyabexDyabln x 答案D解析根据题中散点图可知,散点大致分布在某一条“对数型”函数曲线的周围,而 A 选项是 “直线型”的拟合函数,B 选项是“抛物线型”的拟合函数,C 选项是“指数型”的拟合函数,只有 D 选项的拟合 函数更符合故选 D. 方/法/指/导(来自课堂的最有用的方法) 判断相关关系的两种方法 1散点图法 如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系如果所有的样本点都落在某一直线附 近,变量之间就有线性相关关系 2相关系数法 利用相关

45、系数判定,|r|越趋近于 1,相关性越强 题型独立性检验 试/题/调/研(题题精选,每题都代表一个方向) 1多选某机构在研究性别与是否爱好拳击运动的关系中,通过收集数据得到如下 22 列联表: 男女合计 爱好拳击352257 不爱好拳击152843 合计5050100 经计算得 K210035282215 2 57435050 6.895.之后又对被研究者的身高进行了统计,得到男、女身高分别近 似服从正态分布 N(175,16)和 N(164,9),则下列选项中正确的是() 附表: P(K2k0)0.500.050.0100.0050.001 k00.4553.8416.6357.87910.

46、828 A.在犯错误的概率不超过 1%的前提下,认为“爱好拳击运动与性别有关” B在 100 个男生中,至少有一个人爱好打拳击 C男生身高的平均数为 175,男生身高的标准差为 16 D女生身高的平均数为 164,女生身高的标准差为 3 答案AD解析K26.8956.635,所以选项 A 正确;显然选项 B 错误;男生身高的标准差为 4,所以选 项 C 错误;显然选项 D 正确,故选 AD. 22020 全国卷,文,理某学生兴趣小组随机调查了某市 100 天中每天的空气质量等级和当天到某公园锻 炼的人次,整理数据得到下表(单位:天): 锻炼人次 空气质量等级 0,200(200,400(400

47、,600 1(优)21625 2(良)51012 3(轻度污染)678 4(中度污染)720 (1)分别估计该市一天的空气质量等级为 1,2,3,4 的概率; (2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表); (3)若某天的空气质量等级为 1 或 2, 则称这天“空气质量好”; 若某天的空气质量等级为 3 或 4, 则称这天“空 气质量不好”根据所给数据,完成下面的 22 列联表,并根据列联表,判断是否有 95%的把握认为一天中到该 公园锻炼的人次与该市当天的空气质量有关? 人次400人次400 空气质量好 空气质量不好 附:K2 nadbc2 abcd

48、acbd, P(K2k)0.0500.0100.001 k3.8416.63510.828 . 解(1)由所给数据,该市一天的空气质量等级为 1,2,3,4 的概率的估计值如下表: 空气质量等级1234 概率的估计值0.430.270.210.09 (2)一天中到该公园锻炼的平均人次的估计值为 1 100(100203003550045)350. (3)根据所给数据,可得 22 列联表: 人次400人次400 空气质量好3337 空气质量不好228 根据列联表得 K2 1003383722 2 70305545 5.820. 由于 5.8203.841,故有 95%的把握认为一天中到该公园锻炼

49、的人次与该市当天的空气质量有关 方/法/指/导(来自课堂的最有用的方法) 独立性检验的一般步骤 (1)根据样本数据列出 22 列联表 (2)计算随机变量 K2的观测值 k,查下表确定临界值 k0. P(K2k0)0.500.400.250.150.10 k00.4550.7081.3232.0722.706 P(K2k0)0.050.0250.0100.0050.001 k03.8415.0246.6357.87910.828 F(3)如果 kk0,就推断“X 与 Y 有关系”,这种推断犯错误的概率不超过 P(K2k0);否则,就认为在犯错误 的概率不超过 P(K2k0)的前提下不能推断“X

50、与 Y 有关” 题型线性回归方程 角度.线性方程的系数和应用 试/题/调/研(题题精选,每题都代表一个方向) 12017 山东卷为了研究某班学生的脚长 x(单位:厘米)和身高 y(单位:厘米)的关系,从该班随机抽取 10 名 学生, 根据测量数据的散点图可以看出 y 与 x 之间有线性相关关系 设其回归直线方程为y b xa .已知错误错误!i225, 错误错误!i1 600,b 4.该班某学生的脚长为 24,据此估计其身高为() A160B163 C166D170 答案C解析错误错误!i225, x 1 10错误 错误!i22.5. 错误错误!i1 600, y 1 10错误 错误!i160

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高中 > 数学 > 高考专区 > 一轮复习
版权提示 | 免责声明

1,本文(名师伴你行高考一轮总复习新高考版[数学] 第10章.doc)为本站会员(四川天地人教育)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|