1、统计1. (2012陕西高考卷T65分) 从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示),设甲乙两组数据的平均数分别为,中位数分别为,则( )A.,B.,C.,D.,【解析】从茎叶图来看乙中数据集中,甲比较分散,所以【答案】B【点评】该题主要考查统计图表和样本数据特征以及数据处理能力.2. (2012山东高考卷T45分)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间1,450的人做问卷A,编号落入区间451,750的人做问卷B
2、,其余的人做问卷C.则抽到的人中,做问卷B的人数为(A)7 (B) 9 (C) 10 (D)15【答案】C【解析】采用系统抽样方法从960人中抽取32人,将整体分成32组,每组30人,即,第k组的号码为,令,而,解得,则满足的整数k有10个,故答案应选C。【点评】本题考查了抽样方法,注意到系统抽样原则的应用,是对学生推理能力的考查。分层抽样也是重要考点,明年可能考分层抽样。3. (2012江西高考卷T95分) 样本()的平均数为,样本()的平均数为,若样本(,)的平均数,其中,则的大小关系为A B C D不能确定【答案】A 【解析】本题考查统计中的平均数,作差法比较大小以及整体思想. 由统计学
3、知识,可得,.,所以.所以故.因为,所以.所以.即.【点评】要牢固掌握统计学中一些基本特征:如平均数,中位数,方差,标准差等的求法.体现考纲中要求会用样本的基本数字特征估计总体的基本数字特征.来年需要注意频率分布直方图中平均值,标准差等的求解等.4. (2012安徽高考卷T55分) 甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则(A)甲的成绩的平均数小于乙的成绩的平均数(B)甲的成绩的中位数等于乙的成绩的中位数(C)甲的成绩的方差小于乙的成绩的方差(D)甲的成绩的极差小于乙的成绩的极差【答案】C【解析】由条形图易知甲的平均数为,中位数为,方差为,极差为;乙的平均数为,中
4、位数为5,方差为,极差为,故,甲乙中位数不相等且.【易错警示】本题学生很容易选择D选项,把极差误看成频数的极差,造成误判.5. (2012湖南高考卷T45分)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是A.y与x具有正的线性相关关系B.回归直线过样本点的中心(,)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重比为58.79kg【答案】D【解析】【解析】由回归方程为=0.85x-
5、85.71知随的增大而增大,所以y与x具有正的线性相关关系,由最小二乘法建立的回归方程得过程知,所以回归直线过样本点的中心(,),利用回归方程可以预测估计总体,所以D不正确.【点评】本题组要考查两个变量间的相关性、最小二乘法及正相关、负相关的概念,并且是找不正确的答案,易错.6(2011年四川)有一个容量为66的样本,数据的分组及各组的频数如下:115,155) 2 155,195) 4 195,235) 9 235,275) 18 275,315) 1l 315,355) 12 355395) 7 395,435) 3 根据样本的频率分布估计,数据落在315,435)的概率约是A B C D
6、【答案】B【解析】从到共有22,所以。7.(2011年陕西)设(,),(,),(,)是变量和的个样本点,直线是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是 A和的相关系数为直线的斜率B和的相关系数在0到1之间C当为偶数时,分布在两侧的样本点的个数一定相同D直线过点【答案】D8.(2011年山东)某产品的广告费用x与销售额y的统计数据如下表广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程中的为94,据此模型预报广告费用为6万元时销售额为 A636万元 B655万元 C677万元 D720万元【答案】B9.(2011年江西)变量X与Y相对应
7、的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),表示变量Y与X之间的线性相关系数,表示变量V与U之间的线性相关系数,则 A B CD【答案】C10.(2011年湖南)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由算得,0050001000013841663510828参照附表,得到的正确结论是 A再犯错误的概率不超过01%的前提下,认为“爱好该项运动与性
8、别有关”B再犯错误的概率不超过01%的前提下,认为“爱好该项运动与性别无关” C有99%以上的把握认为“爱好该项运动与性别有关” D有99%以上的把握认为“爱好该项运动与性别无关”【答案】C11. (2012天津高考卷T95分) 某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取_所学校,中学中抽取_所学校.【答案】【命题透析】本题考查统计初步中的分层抽样法.【思路点拨】先求每个学校被抽取的概率,然后求各自学校的样本容量.设小学、中学各抽取所学校,则有,解得.12. (2012江苏高考卷T25分)某学校高一、高二、高三
9、年级的学生人数之比为,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取 名学生【答案】【解析】根据分层抽样的方法步骤,按照一定比例抽取,样本容量为,那么根据题意得:从高三一共可以抽取人数为:人,答案 .【点评】本题主要考查统计部分知识:抽样方法问题,分层抽样的具体实施步骤.分层抽样也叫做“按比例抽样”,也就是说,要根据每一层的个体数的多少抽取,这样才能够保证样本的科学性与普遍性,这样得到的数据才更有价值、才能够较精确地反映总体水平,本题属于容易题,也是高考热点问题,希望引起重视 13.(2011年天津)一支田径队有男运动员48人,女运动员36人,若用分层抽样
10、的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为_【答案】1214.(2011年辽宁)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_万元.【答案】0.25415.(2011年江苏)某老师从星期一到星期五收到信件数分别是10,6,8,5,6,则该组数据的方差【答案】3.216.(2011年广东)某数学老师身高176cm,他爷爷、父亲和儿子的身高分别是173cm、170cm和182cm 因儿子的
11、身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为_cm【答案】18517.(2011年北京) 以下茎叶图记录了甲、乙两组个四名同学的植树棵树。乙组记录中有一个数据模糊,无法确认,在图中以X表示。()如果X=8,求乙组同学植树棵树的平均数和方差;()如果X=9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵树Y的分布列和数学期望。(注:方差,其中为, 的平均数)解(1)当X=8时,由茎叶图可知,乙组同学的植树棵数是:8,8,9,10,所以平均数为方差为()当X=9时,由茎叶图可知,甲组同学的植树棵树是:9,9,11,11;乙组同学的植树棵数是:9,8,9,10。分别
12、从甲、乙两组中随机选取一名同学,共有44=16种可能的结果,这两名同学植树总棵数Y的可能取值为17,18,19,20,21事件“Y=17”等价于“甲组选出的同学植树9棵,乙组选出的同学植树8棵”所以该事件有2种可能的结果,因此P(Y=17)=同理可得所以随机变量Y的分布列为:Y1718192021PEY=17P(Y=17)+18P(Y=18)+19P(Y=19)+20P(Y=20)+21P(Y=21)=17+18+19+20+21=1918.(2011年辽宁)某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种家和品种乙)进行田间试验选取两大块地,每大块地分成n小块地,在总共2n小
13、块地中,随机选n小块地种植品种甲,另外n小块地种植品种乙(I)假设n=4,在第一大块地中,种植品种甲的小块地的数目记为X,求X的分布列和数学期望;(II)试验时每大块地分成8小块,即n=8,试验结束后得到品种甲和品种乙在个小块地上的每公顷产量(单位:kg/hm2)如下表:品种甲403397390404388400412406品种乙419403412418408423400413分别求品种甲和品种乙的每公顷产量的样本平均数和样本方差;根据试验结果,你认为应该种植哪一品种?附:样本数据的的样本方差,其中为样本平均数解: (I)X可能的取值为0,1,2,3,4,且即X的分布列为X的数学期望为 (II
14、)品种甲的每公顷产量的样本平均数和样本方差分别为: 品种乙的每公顷产量的样本平均数和样本方差分别为:由以上结果可以看出,品种乙的样本平均数大于品种甲的样本平均数,且两品种的样本方差差异不大,故应该选择种植品种乙.19(2011年安徽)某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份20022004200620082010需求量(万吨)236246257276286()利用所给数据求年需求量与年份之间的回归直线方程;()利用()中所求出的直线方程预测该地2012年的粮食需求量。温馨提示:答题前请仔细阅读卷首所给的计算公式及说明.分析:本题考查回归分析的基本思想及其初步应用,回归直线的意义
15、和求法,数据处理的基本方法和能力,考查运用统计知识解决简单实际应用问题的能力.解:(I)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程,为此对数据预处理如下:年份200642024需求量257211101929对预处理后的数据,容易算得由上述计算结果,知所求回归直线方程为即 (II)利用直线方程,可预测2012年的粮食需求量为(万吨)300(万吨).20.(2011年北京)以下茎叶图记录了甲、乙两组各四名同学的植树棵树.乙组记录中有一个数据模糊,无法确认,在图中以X表示.(1)如果X=8,求乙组同学植树棵树的平均数和方差;(2)如果X=9,分别从甲、乙两组中随机选取一名
16、同学,求这两名同学的植树总棵数为19的概率. (注:方差其中为的平均数)解(1)当X=8时,由茎叶图可知,乙组同学的植树棵数是:8,8,9,10,所以平均数为方差为()记甲组四名同学为A1,A2,A3,A4,他们植树的棵数依次为9,9,11,11;乙组四名同学为B1,B2,B3,B4,他们植树的棵数依次为9,8,9,10,分别从甲、乙两组中随机选取一名同学,所有可能的结果有16个,它们是:(A1,B1),(A1,B2),(A1,B3),(A1,B4),(A2,B1),(A2,B2),(A2,B3),(A2,B4),(A3,B1),(A2,B2),(A3,B3),(A1,B4),(A4,B1),(A4,B2),(A4,B3),(A4,B4),用C表示:“选出的两名同学的植树总棵数为19”这一事件,则C中的结果有4个,它们是:(A1,B4),(A2,B4),(A3,B2),(A4,B2),故所求概率为