1、课题课题: :统计统计复习课(复习课(1 1)知识梳理普查普查:对每一个调查对象都进行调查的方法,称为全面调查(overall survey),又称普查.在一个调查中,我们把调查对象的全体称为总体(population),组成总体的每一个调查对象称为个体(individual).抽样调查抽样调查:根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查(sampling survey).我们把从总体中抽取的那部分个体称为样本(sample),样本中包含的个体数称为样本量.一、一、普查与抽样调查普查与抽样调查 方法 特点普查抽样调查优点调查结果
2、全面、系统(1)迅速及时;(2)节约人力、物力和财力缺点工作量大,有时费时费力调查结果不如普查全面、系统适用范围1.调查对象少;2.调查对象多,但是调查结果要求必须全面、系统、准确时1.调查对象太多,且不必要普查的;2.调查方式有破坏性时普查和抽样调查的对比普查和抽样调查的对比例抽样调查的有关概念常考题型2018北京临川学校高一检测某工厂为了了解其加工的一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是( )A.总体 B.个体C.总体的一个样本D.样本量【解析解析】总体是这批零件的长度,个体是这批零件中每个零件的长度,抽取的200个零件的长度是样本,样本量是200
3、.【答案】C知识梳理简单随机抽样的定义:简单随机抽样的定义:如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样(simple random sampling).二、二、简单随机抽样简单随机抽样(不放回)简单随机抽样必须具备下列特征(不放回)简单随机抽样必须具备下列特征(1)被抽取样本的总体中的个体数N是有限的;(2)抽取的样本是从总体中逐个抽取的;(3)简单随机抽
4、样是一种不放回抽样;(4)简单随机抽样是一种等可能的抽样.如果四个特征有一个不满足,就不是简单随机抽样.例 简单随机抽样常考题型已知下列抽取样本的方式:从无限多个个体中抽取100个个体作为样本;盒子里共有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出1个零件进行质量检验后再把它放回盒子里;从20件玩具中不放回地依次抽取3件进行质量检验;某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.其中,不是简单随机抽样的个数是()A.1B.2C.3D.4C【解题提示】根据简单随机抽样的特征:有限性,逐一性,不放回性,等可能性判断即可.【解析】不是简单随机抽样,原因是简单随
5、机抽样中总体的个数是有限的,而题中是无限的;不是简单随机抽样,原因是本章讲的简单随机抽样是不放回抽取,而题中是放回的;是简单随机抽样,符合本章讲的简单随机抽样的特征;不是简单随机抽样,原因是个子最高的5名同学是56名同学中特定的,不存在随机性,不是等可能抽样.【答案】C知识梳理抽签法的操作步骤:抽签法的操作步骤:第一步,编号:将N个个体编号(号码可以从1到N,也可以使用已有的号码).第二步,写签:将N个号码写到大小、形状相同的号签上.第三步,抽签:将号签搅拌均匀,每次从中抽取一个号签,连续不放回地抽取n次,并记录其编号.第四步,定样:从总体中找出与号签上的号码对应的个体,组成样本.提示:提示:
6、(1)给个体编号时可利用已有编号,如学号、考号、标签号等;(2)制作号签时,所使用的工具(如纸条、小球等)形状、大小应当都一样,以确保每个号签被抽到的可能性相等;(3)在抽签法中,搅拌均匀的目的是让每个号签被抽到的机会均等.三、三、抽签法与随机数法抽签法与随机数法随机数法的步骤随机数法的步骤(1)先给N个个数编号,例如按1N进行编号;(2)用随机数工具产生1N范围内的整数随机数;(3)把产生的随机数作为抽中的编号,使与编号对应的研究对象进入样本;(4)重复上述过程,直到抽足样本所需要的人数.抽签法与随机数法的比较抽签法与随机数法的比较(1)抽签法与随机数法的相同点 抽签法与随机数法都是简单随机
7、抽样,并且要求被抽取样本的总 体的个数有限; 抽签法与随机数法都是从总体中逐个进行抽取,都是不放回抽样.(2)抽签法与随机数法的不同点随机数法更适用于总体个数较多的时候,而抽签法适用于总体个数较少时.例抽签法的应用常考题型2019河南信阳高一联考下列抽样试验中,用抽签法方便的是()A.从某厂生产的3 000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D.从某厂生产的3 000件产品中抽取10件进行质量检验B例随机数法的应用常考题型2019甘肃兰州一中高一检测总体由编号为01,02,
8、39,40的40个个体组成,从中选取5个个体.利用科学计算器依次生成一组随机数如下,则选出来的第5个个体的编号为()66 06 58 61 54 35 02 42 35 48 96 32 14 52 41 52 48A.54 B.14 C.35 D.32B知识梳理四、四、简单随机抽样中的两类特征数简单随机抽样中的两类特征数例 简单随机抽样的总体平均数和样本平均数常考题型2019浙江宁波高一检测某校组织了一次知识竞赛.在参加的同学中随机抽取100位同学的回答情况进行统计,答对的题数如下:答对5题的有10人,答对6题的有30人,答对7题的有30人,答对8题的有15人,答对9题的有10人,答对10题
9、的有5人.则可以估计在这次知识竞赛中这所学校的每位学生答对的题数为.解析:710051010915830730610051001001iiyy例 简单随机抽样的总体平均数和样本平均数常考题型2019广东东莞高一期末某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用的时间的条形图如图9-1-1,根据条形图可得这50名学生这一天平均每人的课外阅读时间为()图9-1-1A.0.6小时 B.0.9小时C.1.0小时D.1.5小时解析:9 . 05050 . 2105 . 1100 . 1205 . 05050501iiyyB知识梳理 一般地,按一个或多个变量把总体划
10、分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样(stratified random sampling),每一个子总体称为层. 在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.五、分层随机抽样的概念五、分层随机抽样的概念分层随机抽样的特点分层随机抽样的特点(1)从分层随机抽样的定义可看出,分层随机抽样适用于总体由差异明显的几个部分组成的情况.(2)分层随机抽样是等可能抽样.用分层随机抽样从个体数为N的总体中抽取一个容量为n的样本时,在整个
11、抽样过程中,每个个体被抽到的可能性相等(3)分层随机抽样是建立在简单随机抽样的基础之上的,由于它充分利用了已知信息,因此利用它获取的样本更具有代表性,更能充分反映总体的情况,在实践中的应用也更广泛.分层随机抽样的实施步骤分层随机抽样的实施步骤(1)根据已经掌握的信息,将总体分成互不相交的层;(2)根据总体中的个体数N和样本量n计算抽样比k ;(3)确定第i层应该抽取的个体数目niNik(Ni为第i层所包含的个体数),使得各ni之和为n;(4)在各个层中,按步骤(3)中确定的数目在各层中随机抽取个体,合在一起得到容量为n的样本. Nn例分层随机抽样的判断分层随机抽样的判断常考题型2019淮北一中
12、高一检测某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是()A.抽签法B.随机数法C.简单随机抽样法D.分层随机抽样法D分层随机抽样的一个前提和遵循的两个原则分层随机抽样的一个前提和遵循的两个原则(1)前提:分层随机抽样的适用前提是总体可以分层、层与层之间有明显区别,而层内个体间差异较小.(2)遵循的两个原则:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则;分层随机抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量
13、的比等于抽样比.选择抽样方法的思路选择抽样方法的思路(1)若总体由差异明显的几个层次组成,则选用分层随机抽样.(2)若总体没有差异明显的层次,则考虑采用简单随机抽样.当总体中的个体数较小时,宜用抽签法;当总体中的个体数较大、样本量较小时,宜用随机数法.例分层随机抽样的相关计算常考题型某单位共有老、中、青年职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍,为了解职工身体状况,现采用分层随机抽样方法进行调查,若在抽取的样本中有青年职工32人,则该样本中的老年职工人数为.解析:老年职工人数 )(903)160430(人5116032)(185190人因此样本中老年人职工数为 根
14、据等概率性可知,老年职工被选入样本的概率同青年职工入选概率在分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n, 则总体平均数为样本平均数为NMYXWNjjMii11nmyxwnjjmii11知识梳理例分层随机抽样的平均数常考题型2019广西柳州高二检测为了了解全区科级干部“党风廉政知识”的学习情况,按照分层随机抽样的方法,从全区320名正科级干部和1 280名副科级干部中抽取40名科级干部预测全区科级干部“党风廉政知识”的学习情况.现将这40名科级干部分为正科级干部组和副科级干部组,利用同一份试卷分别进行预测.经过预测后,两组各自将预测成绩统计
15、分析如下表知识梳理1.通过调查获取数据通过调查获取数据:对于有限总体问题,一般通过抽样调查或普查的方法获取数据.2.通过试验获取数据通过试验获取数据:通过试验获取数据时,我们需要严格控制试验环境,通过精心的设计安排试验,以提高数据质量,为获得好的分析结果奠定基础.六、六、数据获取途径数据获取途径3.通过观察获取数据通过观察获取数据:通过观察自然现象所获取的数据性质比较复杂,其中蕴含着所观察现象的本质信息,这些信息十分宝贵,统计学理论和方法是挖掘这些信息的强有力的工具之一.4.通过查询获得数据通过查询获得数据:我们可以收集前人的劳动成果并加以利用,从而减少收集数据的成本.我们往往把这样获得的数据
16、叫做二手数据.随着信息技术的发展,通过互联网获取数据越来越成为获取二手数据的主要方式.但从网络上查找的数据,因为数据来历和渠道多样,所以质量会参差不齐,必须根据问题背景知识“清洗”数据,去伪存真,为进一步的数据分析奠定基础. 七、频率分布表与频率分布直方图知识梳理 频率分布表和频率分布直方图的优缺点(1 1)频率分布表)频率分布表反映具体数据在各个不同区间的取值频率,但不够直观、形象,对分析数据分布的总体态势不太方便.(2 2)频率分布直方图)频率分布直方图能够直观地表明数据分布的形状.但是从直方图本身得不到具体的数据内容,也就是说,将数据表示成直方图以后,原始数据不能在图中表示出来.常考题型
17、 题型一. 频率分布直方图的绘制例一个农技站为了考察某种麦穗长的分布情况,在一块试验田里抽取了100个麦穗,量得长度如下(单位:cm):6.56.46.75.85.95.95.24.05.44.6 5.85.56.06.55.16.55.35.95.55.8 6.25.45.05.06.86.05.05.76.05.5 6.86.06.35.55.06.35.26.07.06.4 6.45.85.95.76.86.66.06.45.77.4 6.05.46.56.06.85.86.36.06.35.6 5.36.45.76.76.25.66.06.76.76.0 5.66.26.15.36.2
18、6.86.64.75.75.7 5.85.37.06.06.05.95.46.05.26.0 6.35.76.8 6.14.5 5.66.3 6.05.8 6.3根据上面的数据列出频率分布表、画出频率分布直方图,并估计长度在5.75,6.05)之间的麦穗在这批麦穗中所占的百分比.极差极差7.4-4.0=3.43.40.311.33,不妨取,不妨取12组距组距0.3【解题提示】依据步骤画出频率分布直方图;用样本中的百分比(即频率)来估计长度在5.75,6.05)之间的麦穗在这批麦穗中所占的百分比(5)画频率分布直方图,如图所示.解题归纳一般地,设数据的总数目为n,则当n50时,分58组比较合适;
19、当50n100时,分812组比较合适.题型二频率分布直方图的相关计算2019河南郑州外国语学校高二检测统计某校n名学生的某次数学同步练习成绩(满分150分),根据成绩分数依次分成六组:90,100)、 100,110)、110,120)、120,130)、130,140)、140,150),得到频率分布直方图如图所示,若不低于140分的人数有110,则 (1)m=0.031;(2)n=800;(3)100分以下的人数为60;(4)分数区间在120,140)的人数占大半。上述说法正确的是()A(1)(2)B(1)(3)C(2)(3)D(2)(4)解题归纳频率分布直方图的性质(1)每个小长方形的面
20、积表示样本数据落在该组内的频率.(2)所有小长方形的面积和等于1. 常用该结论求解频率分布直方图中的小长方形的高.(3)利用一组的频数和频率,可以求样本量.【注意】频率分布直方图中的纵轴不是频率,而是频率/组距.小结1.理解普查与抽样调查2.统计的基本概念 总体 个体 样本 样本量3.(不放回)简单随机抽样必须具备下列特征4.总体平均数与样本平均数的概念5.分层随机抽样的一个前提和遵循的两个原则6.确定各层样本量的方法7.分层随机抽样的步骤8.分层随机抽样平均数的计算9.数据获取途径小结10.总体取值规律的估计,是把样本抽样后,使用频率分布表和频率分布直方图进行估计的.11.制作频率分布表和频率分布直方图时,首先要求出极差,再利用极差求出和组数求出组距,最后统计出各组的频数,进而列出频率分布表,画出频率分布直方图.12.通过频率分布表能观察出各段上的频数分布多和少;通过频率分布直方图能求出各组的频率,还能估计总体中各组的频数.作业完成教材p222-223.复习巩固1,4.综合运用5,6,7