1、第十二章概率统计12.1统计,高考数学,一、抽样方法1.简单随机抽样:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.一般地,如果用简单随机抽样从个体数为N的总体中抽取一个容量为n的样本,那么每个个体被抽到的概率等于.常用的简单随机抽样方法有:抽签法、随机数法.,知识清单,2.系统抽样:当总体中的个体数较多时,采用简单随机抽样显得较为费事.这时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样.系统抽样的步骤可概括为:(1)采用随机的方式将总体中
2、的个体编号.为简便起见,有时可直接利用个体所带有的号码,如考生的准考证号、街道上各户的门牌号等等.(2)为将整个的编号进行分段(即分成几部分),要确定分段的间隔k.当?(N为总体中的个体数,n为样本容量)是整数时,k=?;当?不是整数时,通过从总体中剔除一些个体使剩下的总体中个体数N能被n整除,这时k=?.(3)在第1段用简单随机抽样确定起始的个体编号l.(4)按照事先确定的规律抽取样本(通常是将l加上间隔k,得到第2个编号(l+k),再将(l+k)加上k,得到第3个编号(l+2k),这样继续下去,直到获取整个样本).3.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体
3、的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层.,二、总体分布、总体特征数的估计用样本估计总体是研究统计问题的一个基本思想方法,而对于总体分布,总是用样本的频率分布对它进行估计.1.频率分布表:求一组数据的频率分布,可按以下三步进行:(1)数出落在各小组内的数据的个数,即频数,(2)每小组的频数与样本容量的比值叫做这一小组的频率,(3)算出各小组的频率,填入表中,这个表叫做频率分布表.2.频率分布直方图:为了将频率分布表中的结果直观形象地表示出来,常画出频率分布直方图,画图时,应以纵轴表示频率与组距的比值,以每个组距为底,以各频率除
4、以组距的商为高分别画成矩形,这样得到的直方图就是频率分布直方图.图中每个矩形的面积等于相应组的频率,即?组距=频率,各组频率的和等于1,因此,各矩形的面积的和等于1.,3.用样本频率分布估计总体分布对一组数据进行整理,可以得到它的频率分布,如果这组数据是从一个总体中抽取的一个样本,那么这个频率分布又称为样本频率分布.通常可以根据样本的频率分布来估计总体分布,而且样本容量越大,这种估计就越精确,当样本容量无限增大,分组的组距无限缩小时,频率分布直方图就会趋近于一条光滑曲线即总体分布的概率密度曲线.4.样本平均数?=?(x1+x2+x3+xn).样本方差s2=?(x1-?)2+(x2-?)2+(x
5、n-?)2.,5.茎叶图的画法步骤:第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列;第三步:将各个数据的叶依次写在其茎的右(左)侧.,随机抽样1.简单随机抽样的特点:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小;用简单随机抽样法抽取的个体带有随机性;个体间无固定间距.2.系统抽样的特点:适用于元素个数很多且均衡的总体;各个个体被抽到的机会均等;总体分组后,在起始部分抽样时,采用简单随机抽样.3.分层抽样的特点:适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.,方法技巧,例1
6、(2016山东青岛一中月考)某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,270,使用系统抽样时,将学生统一随机编号为1,2,270,并将整个编号依次分为10段,如果抽得号码有下列四种情况:7,34,61,88,115,142,169,196,223,2505,9,100,107,111,121,180,195,200,26511,38,65,92,119,146,173,200,227,25430,57,84,
7、111,138,165,192,219,246,270关于上述样本的下列结论中,正确的是.(填字母)a.、都不能为系统抽样b.、都不能为分层抽样c.、都可能为系统抽样d.、都可能为分层抽样,解析因为可能为系统抽样,所以a不对;因为可能为分层抽样,所以b不对;因为不为系统抽样,所以c不对.,答案d,茎叶图问题的解题方法茎叶图反映了所有的样本数据,这是茎叶图的优点,但茎叶图在样本数据较多时使用又不方便,在实际问题中要根据情况灵活选用数据分布的表示方法.例2甲、乙两位学生参加数学竞赛培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲:82,81,79,78,95,88,93
8、,84.乙:92,95,80,75,83,80,90,85.(1)用茎叶图表示这两组数据;(2)现要从两人中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.,解题导引(1)根据茎叶图的相关知识表示出两组数据.(2)从平均数和方差两个角度考虑.,解析(1)作出茎叶图如图所示.,(2)?=?(702+804+902+8+9+1+2+4+8+3+5)=85,?=?(701+804+903+5+0+0+3+5+0+2+5)=85,?=?(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2=35.5,?=?(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2=41.,因为?=?,?,所以甲的成绩较稳定,派甲参赛比较合适.,