1、成才之路成才之路 数学数学路漫漫其修远兮路漫漫其修远兮 吾将上下而求索吾将上下而求索北师大版北师大版 必修必修3统计统计第一章第一章章末归纳总结章末归纳总结第一章第一章专专 题题 探探 究究3知知 识识 结结 构构 1知知 识识 梳梳 理理2即即 时时 巩巩 固固4知知 识识 结结 构构知知 识识 梳梳 理理1随机抽样统计分析的基本过程是:当总体容量很大或检测具有一定的破坏性时,可以从总体中抽取适当的样本,通过对样本的分析、研究,得到对总体的估计本章学习了三种比较典型和常用的抽样方法:简单随机抽样、分层抽样和系统抽样,它们的共同点:在抽样过程中每个个体被抽到的可能性(概率)相同,体现了抽样统计
2、的客观性和公平性(1)简单随机抽样:在需要分析的总体中,随机地抽取一部分个体,然后对抽取的对象进行调查,并且在抽取的过程中,要保证每个个体被抽到的概率相等这样的抽样方法叫作简单随机抽样简单随机抽样是抽样中一个最基本的方法,通常采用抽签法或随机数法(2)分层抽样:将总体按其属性特征分成若干类型(有时称为层),然后在每个类型中按照所占比例随机抽取一定的样本这种抽样方法通常叫作分层抽样,有时也称为类型抽样(3)系统抽样:将总体的个体进行编号,按照简单随机抽样抽取第一个样本,然后按相同的间隔(称为抽样距)抽取其他样本,这种抽样方法叫作系统抽样,有时也称为等距抽样或机械抽样2用样本估计总体(1)统计图表
3、条形统计图、折线统计图、扇形统计图各自用途如下:条形统计图用于体现数据分布的频数及频率;扇形统计图用于体现部分在总体中所占比例;折线统计图用于体现数据的变化趋势画茎叶图的步骤:将数据分为“茎”“叶”两部分共茎的叶按从小到大(或从大到小)的顺序同行列出茎叶图只方便记录较少的样本数据,所有数据信息都可以从茎叶图中得到,方便记录与表示画频率分布直方图的步骤:求给定一组数据的极差决定组距与组数分组列频率分布表画频率分布直方图频率分布直方图以面积的形式反映数据在各小组的频率的大小,能清楚反映数据分布的总体态势频率折线图:在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间从所加的左边区间的中点开
4、始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,即频率折线图(3)用样本估计总体的方法用样本的频率分布估计总体的分布:通过样本数据得到频率分布表、频率分布直方图、频率折线图,对总体的频率分布作出估计用样本的数字特征估计总体的数字特征:用样本数据的平均数、标准差估计总体的平均数、标准差从样本数据得到的分布、平均数和标准差并不是总体真正的分布、平均数和标准差,只是总体的一个估计,但这种估计是合理的当样本量很大时,它们的确反映了总体的信息可得线性回归方程yabx.得到的线性回归方程可用于对总体作出估计和预测,为决策提供依据专专 题题 探探 究究抽样方法的应用(3)应
5、用三种抽样方法时需搞清楚它们的使用原则:当总体容量较小,样本容量较小时,制签简单,号签容易搅匀,可采用抽签法;当总体容量较大,样本容量较小时,可用随机数表法;当总体容量较大,样本容量也较大时,可用系统抽样法;当总体中个体差异较显著时,可采用分层抽样法特别提醒在选取抽样方法时,必须使总体中每个个体被抽到的机会是均等的,同学们要理解各种抽样方法的特征及适用范围,在解题时灵活选用在下列问题中,各采用什么抽样方法抽取样本较为合适?(1)从20台彩电中抽取4台进行质量检验;(2)科学会堂有32排,每排有40个座位(座位号为0140),一次报告会坐满了听众,会后为了听取意见,留下了座位号为18的所有32名
6、听众进行座谈;(3)实验中学有180名教工,其中有专职教师144名,管理人员12名,后勤服务人员24名,今从中抽取一个容量为15的样本解析(1)因总体中的个体的数目较少,故采用简单随机抽样(2)因总体中的个体的数目较多,又是“等距”抽取,故采用系统抽样(3)因总体中的个体差异较大,故采用分层抽样.茎叶图是近年高考的热点.主要考查茎叶图的画法,以及对茎叶图的分析和应用用茎叶图刻画数据有两个优点:一是所有的信息都可以从这个茎叶图中得到;二是茎叶图便于记录和表示,能够展示数据的分布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了.茎叶图及应用 解析(1)茎叶图如图所示.AB973587
7、363537148383569239124457750400113675424102567331422400430553444145(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据(3)通过观察茎叶图可以看出:品种A的亩产平均数(或均值)比品种B高;品种A的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差某著名饮食品牌在某地开了甲、乙两家连锁店,一周内的每天回头客的数量统计结果如下:甲:52514948534849乙:60654035256560用茎叶图分析哪个连锁店的客
8、源比较稳定解析茎叶图如下:由茎叶图看出,甲连锁店的回头客数量比较集中,所以甲连锁店的客源比较稳定.甲乙2535998840321560055表现统计数字大小和变动的各种图形总称为统计图其中有条形统计图、扇形统计图、折线统计图、茎叶图等在统计学中把利用统计图形表现统计资料的方法叫作统计图示法其特点是:形象具体、简明生动、通俗易懂、一目了然.其主要用途有:表现现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况统计图表(3)数据的折线统计图如图所示小明家2014年的四个季度的用电量如下:季度名称用电量(单位:千瓦时)第一季度2
9、50第二季度150第三季度400第四季度200其中各种电器用电量如下表:各种电器用电量(单位:千瓦时)空调250冰箱400照明100彩电150其他100解析(1)折线统计图;(2)扇形统计图;(3)条形统计图.频率分布表与频率分布直方图 分组频数频率一组0,5)00二组5,10)10三组10,15)100.10四组15,20)五组20,25)300.30合计1001.00(1)这次抽样的样本容量是多少?(2)在表中填写出缺失的数据并补全频率分布直方图(3)旅客购票用时的平均数可能落在哪一小组?(4)若每增加一个购票窗口可使平均购票用时降低5min,要使平均购票用时不超过10min,那么你估计最
10、少要增加几个窗口?规律总结本题考查了同学们整理数据和分析数据的能力,补全频率分布表可从横向(利用频数与频率的关系)和纵向(各组频数之和等于样本容量,各组频率之和等于1)两个角度进行突破而频率分布直方图可利用小长方形的高的比即各组的频率之比来完成,近年来的高考对这方面的能力考查有明显加强的趋势在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量)共有100个数据,将数据分组如下表所示:分组频数频率1.30,1.34)41.34,1.38)251.38,1.42)301.42,1.46)291.46,1.50)101.50,1.542合计100(1)完成频率分布表,并画出频率分布直方图;(2)求
11、纤度落在1.38,1.50)中的频率及纤度小于1.40的频率解析(1)完成频率分布表如下所示:分组频数频率1.30,1.34)40.041.34,1.38)250.251.38,1.42)300.301.42,1.46)290.291.46,1.50)100.101.50,1.5420.02合计1001.00频率分布直方图如图所示:用样本的数字特征估计总体 特别提醒有时也用标准差的平方s2方差来代替标准差,实质一样规律总结此题两机床生产零件尺寸的平均数相等都是10mm,与规定尺寸相同,但方差不同,从方差可以估计出哪个机床加工的零件较合适为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换
12、已知某校使用的100只日光灯在必须换掉前的使用天数如下表:(1)试估计这种日光灯的平均使用寿命;(2)若定期更换,选择多长时间统一更换合适?天数151180181210211240241270271300301330331360361390灯管数1111820251672线性回归方程及应用 日期12月1日 12月2日 12月3日 12月4日 12月5日温差x()101113128发芽数y(颗)2325302616该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验(1)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12
13、月4日的数据,求出y关于x的线性回归方程ybxa;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)题中所得的线性回归方程是否可靠?规律总结建立回归模型的基本步骤:确定研究对象,明确解释变量与预报变量;画出确定好的解释变量与预报变量的散点图,观察它们之间的关系(如是否存在线性关系等);由经验确定回归方程的类型(或数据呈线性关系,则选用线性回归方程ybxa);按一定规则估计回归方程中的参数(如最小二乘法);将所得的结果进行分析检验,看看是否符合实际情况解析(1)散点图如图所示(2)把数据列成表:序号xyx2y2xy1230490
14、0602440161600160356025360030046503625003005870644900560(3)根据求得的回归直线方程,当产品的广告费支出1千万元时,y6.51017.582.5(百万元)即销售额大约是82 500 000元即即 时时 巩巩 固固一、选择题1某校有高中生900人,其中高一年级300人,高二年级200人,高三年级400人,用分层抽样法抽取一个容量为45的样本,那么高一、高二、高三各年级的抽取人数分别为()A15,5,25B15,15,15C10,5,30D15,10,20答案D2实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与
15、x之间的回归直线方程为()Ayx1Byx2Cy2x1Dyx1答案A3如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为A和B,样本标准差分别为sA和sB,则()答案B答案B二、填空题5为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:小李这5天的平均投篮命中率为_,用线性回归分析法的方法,预测小李该月6号打6小时篮球的投篮命中率为_答案0.50.53 时间x12345命中率y0.40.50.60.60.46如图是容量为100的样本的频率分布直方图,试根据图形中的数据填空(1)样本数据落在范
16、围6,10)内的频率为_;(2)样本数据落在范围10,14)内的频数为_;(3)样本数据落在范围2,10)内的频率为_答案(1)0.32(2)36(3)0.4三、解答题7下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程ybxa;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:32.5435464.566.5)解析(1)由题设所给数据,可得散点图如下图(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为:90(0.71000.35)19.65(吨标准煤)