1、统计复习指导1. 正确理解三种抽样方法 三种抽样方法的共同点:都是等概率抽样,体现了抽样的公平性; 简单随机抽样:一般地,设一个总体的个体数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.系统抽样的步骤:(1)将总体中的个体随机编号;(2)将编号分段;(3)在第1段中用简单随机抽样确定起始的个体编号;(4)按照事先研究的规则抽取样本.分层抽样的步骤:(1)分层;(2)按比例确定每层抽取个体的个数;(3)各层抽样(方法可以不同);(4)汇合成样本.常用的三种抽样方法的比较:类 别共同点不同点联 系适用范围简单随机抽样抽样过程中每个
2、个体被抽取的概率相等从总体中逐个抽取是后两种方法的基础总体个数较少系统抽样将总体均分成几部分,按事先确定的规则在各部分抽取在超始部分抽样时用简单随机抽样总体个数较多分层抽样将总体分成几层,分层进行抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成 二、掌握用样本估计总体思维模式和解决问题的方法1.频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用频率分布表、频率分布直方图、频率折线图、总体密度曲线和茎叶图。2.总体分布:从总体中抽取一个个体,
3、就是一次随机试验,从总体中抽取一个容量为n的样本,就是进行了n次试验,试验连同所出现的结果叫随机事件,所有这些事件的概率分布规律称为总体分布.3.频率分布直方图:作出直方图的一般步骤如下:(1)求极差(即一组数据中最大值与最小值的差);(2)确定组距与组数(极差除以组数得组距);(3)将数据分组;(4)列频率分布表,分别计算各组的频数及频率(频率=);(5)画出频率分布直方图,并作出相应的估计,直方图是用图形面积的大小表示在各区间内取值的频率.4.频率分布折线图与总体密度曲线:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图;在实际统计过程中,随着样本容量的增加,作图时所分的组数
4、增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线,它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息。 5.茎叶图:当数据是两位(也可以是两位以上)有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。茎叶图只便于表示两位有效数字的数据,而
5、且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。 三、把握统计中的数字特征1.众数、中位数、平均数的概念及特征众数:在一组数据中重复出现次数最多的数据称为这组数据的众数.中位数:把一组数据按从小到大的顺序排列,把处于最中间位置的那个数称为这组数据的中位数,当数据个数为奇数时,中位数是按从小到大顺序排列的最中间的那个数,当数据个数为偶数,中位数为排列的最中间两个数据的平均数.平均数:由于平均数与每一个样本数据都有关,所以任何一个样本数据的改变都会引起平均数的改变. 这是中位数、众数都不具有的性质,也正因为这个原因,与众数、中位数比较起来,平均数可以更
6、多的反映出关于样本数据全体的信息.众数、中位数与平均数都是都是描述一组数据集中趋势的量,平均数是样本数据的“重心”;众数考查各个数据出现的频率大小,只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题;中位数仅与数据的排列位置有关,某些数据的变动对中位数没在影响,当一组数据中的个别数据变动较大时可用中位数描述其集中趋势注意:实际问题中求得的平均数众数和中位数应带上单位.2.标准差与方差 (1)标准差 显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小. (2)方差 从数学的角度考虑,人们有时用标准差的平方(即方差)来代替标准差,作为测量样
7、本数据分散程度的工具:极差、标准差、方差都是用来描述一组数据波动情况(即数据的离散程度)的特征,常用来比较两组数据的波动大小.方差较大则波动大,方差较小则波动小. 四、善于分析两个变量之间的关系 是对数据的线性回归方程,该方程所表示的直线称为回归直线., 其中 , 注意:对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数的计算公式,算出由于计算量较大,所以在计算时应借助技术手段,认真细致,谨防计算中产生错误求线性回归方程的步骤:计算平均数;计算的积,求,计算将结果代入公式求,用 求,写出回归方程。注:每个回归方程必过样本中心点()。一、选择题1现要完成下列3项抽样调查:
8、 从10盒酸奶中抽取3盒进行食品卫生检查.科技报告厅有32排,每排有40个座位,有一次报告会恰好坐满了听众,报告会结束后,为了听取意见,需要请32名听众进行座谈.某中学共有160名教职工,其中一般教师120名,行政人员16名,后勤人员2名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.较为合理的抽样方法是( ) A. 系统抽样,简单随机抽样,分层抽样;B.简单随机抽样,分层抽样,系统抽样;C. 简单随机抽样,系统抽样,分层抽样;D.分层抽样,系统抽样,简单随机抽样.2. 数据的平均数为1,标准差为2,则数据,的平均数与标准差分别为( )A-1,4B-1,-1C2,4 D
9、2,-1 4.某市高三数学调研考试中,对90分以上(含90分)的成绩进行统计,其频率分布直方图如图所示,若130140分数段的人数为90,那么90100分数段的人数为( )A630 B720 C810 D9005一个容量为n的样本,分成若干组,已知某组频数和频率分别是36和0.25,则n( )A.9 B.36 C.72 D.1446200辆汽车经过某一雷达地区,时速频率分布直方图 如图所示,则时速超过60km/h的汽车数量为( )第6题图A65辆 B76辆 C88辆 D95辆7对“小康县”的经济评价标准:年人均收入不小于7000元;年人均食品支出不大于年人均收入的35%.某县有40万人口,调查
10、数据如下:年人均收入(元)02000400060008000100001200016000人数(万人)63556753则该县( )A是小康县B达到标准,未达到标准,不是小康县C达到标准,未达到标准,不是小康县D两个标准都未达到,不是小康县二、填空题11已知一组数据为10,10,10,7,7, 9,3,则中位数是 ,众数 12图1是某赛季甲乙两名篮球运动员每场比赛得分的茎叶图,则甲乙两人这几场比赛得分的中位数之和是 13.从一堆苹果中任取5只,称得它们的质量如下:(单位:克)125 124 121 123 127则该样本的标准差是s=_(克) 15.某企业有3个分厂生产同一种电子产品,第一、二、
11、三分厂的产量之比为1:2:1,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共抽取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980h,1020h,1032h,则抽取的100件产品的使用寿命的平均值为_h. 三、解答题:16. ( 10 分)随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图7(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差. 17. ( 12 分)某乡镇供电所为了调查农村居民用电量情况,随机抽取了500户居民去年的用电量(单位:kw/h),将所得数
12、据整理后,画出频率分布直方图如下;其中直方图从左到右前3个小矩形的面积之比为1:2:3。(1)该乡镇月均用电量在3739之内的居民共有多少户?(2)若按分层抽样的方法从中抽出100户作进一步分析,则用电量在3739内居民应抽取多少户?(3)试根据直方图估算该乡镇居民月均用电量的中位数约是多少?(精确到0.01)18. ( 13分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗 (吨标准煤)的几组对照数据 (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:,)2