1、第六章统计 概述:“统计” 这一章, 是初中数学中的 “统计初步” 的深化和拓展 要求主要会用随机 抽样、 分层抽样的方法从总体中抽取样本, 并用样本频率分布估计总体分布本章高考题 以基本题 (中、 低档题) 为主, 每年只出一道填空题, 常以实际问题为背景, 综合考查学 生应用基础知识解决实际问题的能力高考的热点是总体分布的估计和抽样方法知识的交 汇点是排列、 组合、 概率与统计的解答题 知识网络 第六章统计 随机抽样 分层抽样 系统抽样 简单随机抽样 数据收集 用样本估计总体 样本的频率分布估计总体 样本的数字特征估计总体 线性回归变量的相关性 数据整理与统计 51 高中数学公式、 定理、
2、 定律图表 GAOZHONG SHUXUE GONGSHI DINGLI DINGLU TUBIAO (1) 简单随机抽样 是一种不放回抽样, 所 取的样本没有被重复抽 取的情况. 要点提示: 6.1随 机 抽 样 一、 知识图表 (2) 三种抽样方法 都是一种等概率抽样. 随 机 抽 样 类别共同点不同点联 系适用范围 简单随机抽样 抽样过 程中每 个个体 被抽取 的概率 相等. 从总体中逐个 抽取. 总体中的个体数 较少. 系统抽样 将总体分成几部 分, 按事先确定 的规则在各部分 抽取. 在起始部分 抽样时采用 简单随机抽 样. 总体中个体数 较多. 分层抽样 将总体分成几层 进行抽取.
3、 各层抽样采 用简单随机 抽样或系统 抽样. 总体由差异明显 的几部分组成. 二、 重要概念剖析 1.简单随机抽样: 一般地, 设一个总体含有N个个体, 从中逐个不放回地抽取n个个体作为 样本, 如果每次抽取时总体内的各个个体被抽到的机会相等, 就把这种抽样方法叫做简单随机抽 样.主要有两种方法: 抽签法和随机数表法. 2.系统抽样: 将总体平均分成几个部分, 然后按照预先定出的规则, 从每个部分中抽取一个个 体, 得到所需的样本. 3.系统抽样的步骤 (1) 将总体中的个体编号; (2) 将整个的编号按一定的间隔 (设为R) 分段, 当 N n (N为总体中的个体数,n为样本容 量) 是整数
4、时,R=N n ; 当N n 不是整数时, 从总体中随机剔除一些个体, 使剩下的总体中的个体的 个数N能被n整除, 这时R=N n , 并将剩下的总体中的个体重新编号; (3) 在第一段中用简单随机抽样确定一个个体编号L; (4) 将编号为L,L+R+2R, ,L+(n-1)R的个体抽出。 4.分层抽样: 一般地, 当总体由差异明显的几个部分组成时, 为了使样本更客观地反映总体情 况, 我们常常将总体中的个体按不同的特点分层次比较明显的几部分, 然后按各部分在总体中所占 的比例实施抽样. 5.收集数据的常用方式有试验、 查阅资料、 设计调查问卷. 52 第六章统计 例某公司在甲、 乙、 丙、
5、丁四个地区分别有150 个, 120 个, 180 个, 150个销售点, 公司为了调查产品销售的情况, 需从这600个 销售点中抽取一个容量为100的样本, 记这项调查为; 在丙地区 中有20个特大型销售点, 要从中抽取7个调查其销售收入和售后 服务等情况, 记这项调查为; 则完成这两项调查采用的抽样 方法依次是 () A.分层抽样, 系统抽样 B.分层抽样, 简单随机抽样法 C.系统抽样, 分层抽样 D.简单随机抽样法, 分层抽样法 思路引导:分析各个总体特点, 选择恰当方法. 答案:B (2010 安徽高考文科 T14) 某地有居民100000户, 其中普通家 庭99000户, 高收入家
6、庭1000户, 从普通家庭中以简单随机抽样方 式抽取990户, 从高收入家庭中以简单随机抽样方式抽取100户进 行调查, 发现共有120户家庭拥有3套或3套以上住房, 其中普通 家庭50户, 高收入家庭70户, 依据这些数据并结合所掌握的统计 知识, 你认为该地拥有3套或3套以上住房的家庭所占比例的合理 估计是. 解析: 该地拥有3套或3套以上住房的家庭估计约有: 99000 50 990 +1000 70 100 =5700户. 所以所占比例的合理估计约是5700100000=5.7%. 答案:5.7% 三、 学习方法引导 名师经验谈:抽 样 方 法的考查一般属于易答 题.分 析 总 体 分
7、 布 特 点, 总体个数多少, 是 否有明显的差异性, 来 选择合适的抽样方法. 四、 高考回眸 高考命题趋势:高考抽 样方法通常与频率分布 直方图等知识点交汇出 题, 要真正理解每种抽 样方法的具体步骤、 特 点, 才能在这种易题处 不失分. 53 高中数学公式、 定理、 定律图表 GAOZHONG SHUXUE GONGSHI DINGLI DINGLU TUBIAO 1.绘制频率分布直方图的步骤 二、 重要概念剖析 6.2用样本估计总体 一、 知识图表 频率分布直方图的 纵坐标是频率/组距, 每 个小矩形的面积代表此 部分的频率值. 要点提示: 平均数反映的是这 组数据的平均水平.方 差
8、、 标准差反映的是数 据的稳定与波动, 集中 与离散的程度 要点提示: 用 样 本 估 计 总 体 样本 的频 率分 布估 计总 体 频率 分布 直方 图 茎叶 图 样本 的数 字特 征估 计总 体 样本平均数: x=1 n (x1+x2+xn)=1 n n i=1 移xi x=x1n1+x2n2+xknk n =x1p1+x2p2+xnpn n=n1+n2+nk 如果n个数据中,x1出现n1 次, x2出现n2次, , xk出现nk次. 方差 标准 差 s2= 1 n n ?i=1 移(xi-x)2,s2、s(s0) 分别称为数据x1, x2, ,xn的方差和标准差. s2=1 n (x21
9、+x22+x2n)-nx2 众数 中位 数 平均 数 甲班乙班 2181 99101703689 883216258 8159 122 126 130 134 138 142 146 150 154 158 频率/组距 身高(cm) 1/16 5/96 1/24 1/32 1/48 1/96 54 第六章统计 (1) 求极差, 决定组数和组距; (2) 分组, 通常对组内数值所在区间取左闭右开区间; (3) 列出频率分布表; (4) 画频率分布直方图. 2.平均数、 中位数和众数都是用来描述数据集中趋势的统计量, 它们又有各自的特点: 平均数 是将所有的数据考虑进去得到的度量, 它是反映数据集
10、中趋势最常用的量; 中位数可靠性较差, 当 一组数据中个别数据变动较大时, 常用中位数表示数据的集中趋势; 而众数求法较简单, 也经常被 用到. 例下表给出了某校120名12岁男孩的身高资料.(单位:cm) (1) 画出频率分布直方图; (2) 根据样本的频率分布图, 估计身高小于134 cm的人数约占总 人数的百分比; (3) 如果该校所在的地区,12岁男孩有12万人, 根据上面的统计 结果, 你能估计出身高在150 cm以上 (含150 cm) 的男孩大约有 多少人吗? 思路引导:本题考查列出频 率分布表、 画出频率分布直 方图的方法和步骤, 在画出 频率分布直方图的过程中, 一定要合理分
11、组, 确定恰当 的组距, 严格步骤画出频率 分布直方图. 解: (1) 如右图. (2) 身高小于134 cm的学 生数约占总数的19%. (3) 总体12万人中约有12104 11 120 =11000(人). (2016 山东) 某高校调查了200名学生每周的自习时间 (单位: 区间界限122,126)126,130)130,134) 人数5810 区间界限134,138)138,142)142,146) 人数223320 区间界限146,150)150,154)154,158 人数1165 122 126 130 134 138 142 146 150 154 158 频率/组距 身高(
12、cm) 1/16 5/96 1/24 1/32 1/48 1/96 三、 学习方法引导 四、 高考回眸 名师经验谈:用样本估 计总体时, 虽然从样本 数据得到的分布并不是 总体真正的分布, 而只 是总体的一个估计, 但 这种估计是合理的, 特 别是当样本抽样合理、 样本量较大时. O 55 高中数学公式、 定理、 定律图表 GAOZHONG SHUXUE GONGSHI DINGLI DINGLU TUBIAO 1.当自变量的取值一定时, 因变量的取值带有随机性, 这两个变量之间的关系叫作相关关系. 2.一般地, 设有 (x,y) 的n对观察数据如下: 当a,b使Q=(y1-bx1-a)2+(
13、y2-bx2-a)2+(yn-bxn-a)2取得最小值时, 就称y赞=bx+a为拟合这n对 数据的线性回归方程. 二、 重要概念剖析 xx1x2x3xn yy1y2y3yn 小时), 制成了如图所示 的频率分布直方图, 其中 自 习 时 间 的 范 围 是 17.5,30, 样本数据分 组为 17.5,20), 20, 22.5),22.5,25),25, 27.5),27.5,30.根 据直方图, 这200名学生 中每周的自习时间不少于22.5小时的人数是 () A. 80B. 100C. 120D. 140 答案:D 高考命题趋势:本题主 要考查统计中的平均值 与方差的运算, 属于高 考易
14、答题, 记住公式. 相关关系与函数关 系不同, 函数关系中的 两个变量间是一种确定 性关系, 相关关系是一 种非确定性关系, 即相 关关系是非随机变量与 随机变量之间的关系. 要点提示: 6.3变量的相关性 一、 知识图表 变 量 的 相 关 性 变量 间的 相关 关系 两个 变量 的线 性相 关 用直线方程y赞=bx+a近似表示的相关关系. 加工时间 零件数 y x 140 120 100 80 60 40 20 20 40 60 80100120 O O 频率 组距 自习时间/小时 17.522.527.5 0.16 0.10 0.08 0.04 0.02 202530 56 第六章统计
15、名师经验谈:线性回归 方程一定通过 (x,y) 点. 高考命题趋势:本题主 要考查散点图, 散点图 能够直观地反应两变量 的相关关系, 有正相关 和负相关, 属于基本概 念考查. 例为了考查两个变量x与y之间的线性相关性, 甲、 乙两个同学 各自独立地做了10次试验和15次试验, 并且利用线性回归方法, 求得回归直线分别为l1和l2, 已知两个人在试验中发现对变量x的 观测数据的平均数都为s, 对变量y的观测数据平均数据都为t, 那 么下列说法正确的是 () A. l1和l2有交点 B. l1和l2相交, 但交点不一定是 (s,t) C. l1和l2必平行 D. l1和l2必重合 思路引导:分析线性回归方程的系数求解公式. 答案:A (2009 宁夏海南) 对变量x, y有观测数据 (x1,y1). (i=1,2, ,10), 得散点图1; 对变量u,v有观测数据 (u1,v1) (i=1,2, ,10), 得散点图2.由这两个散点图可以判断 () A.变量x与y正相关,u与v正相关 B.变量x与y正相关,u与v负相关 C.变量x与y负相关,u与v正相关 D.变量x与y负相关,u与v负相关 答案:C 四、 高考回眸 y x 30 25 20 15 10 5 O 123456 y x 60 50 40 30 20 10 O 1234567 图1图2 三、 学习方法引导 57