1、第十章第十章 统计、统计案例、算法初步统计、统计案例、算法初步第一节第一节 随机抽样随机抽样第二节第二节 用样本估计总体用样本估计总体第三节第三节 变量间的相关关系变量间的相关关系 统计案例统计案例第四节第四节 算法初步算法初步目 录第十章 统计、统计案例、算法初步 一、简单随机抽样:一、简单随机抽样:1简单随机抽样的概念:简单随机抽样的概念:一般地,从元素个数为一般地,从元素个数为N的总体中的总体中 地抽取容量地抽取容量为为n的样本,如果每一次抽取时总体中的各个个体有相同的的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这样抽样方法叫做简单随机抽样可能性被抽到,这样抽样方法叫做
2、简单随机抽样 2最常用的简单随机抽样方法有两种最常用的简单随机抽样方法有两种 _ 和和 不放回不放回抽签法抽签法随机数法随机数法 2最常用的简单随机抽样方法有两种最常用的简单随机抽样方法有两种_和和 二、系统抽样的步骤二、系统抽样的步骤假设要从容量为假设要从容量为N的总体中抽取容量为的总体中抽取容量为n的样本:的样本:(1)先将总体的先将总体的N个个体个个体 ;分段间隔分段间隔k (3)在第在第1段用段用 确定第一个个体编号确定第一个个体编号l(lk);抽签法抽签法随机数法随机数法编号编号简单随机抽样简单随机抽样 (4)按照一定的规则抽取样本通常是将按照一定的规则抽取样本通常是将l加上间隔加上
3、间隔k得到得到第第2个个体编号个个体编号 ,再加,再加k得到第得到第3个个体编号个个体编号 ,依,依次进行下去,直到获取整个样本次进行下去,直到获取整个样本 lkl2k 三、分层抽样三、分层抽样 1分层抽样的概念:分层抽样的概念:当总体由有明显差别的几部分组成时,为了使抽取的样本当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,常采用分层抽样,将总体中各个个体更好地反映总体的情况,常采用分层抽样,将总体中各个个体按某种特征分成若干个按某种特征分成若干个 的几部分,每一部分叫的几部分,每一部分叫做做 ,在各层中按层在总体中所占比例进行,在各层中按层在总体中所占比例进行 抽样
4、或抽样或 抽样,这种抽样方法叫做分层抽样抽样,这种抽样方法叫做分层抽样 2当总体是由当总体是由 组成时,往往选用分组成时,往往选用分层抽样的方法层抽样的方法 3分层抽样时,每个个体被抽到的机会是分层抽样时,每个个体被抽到的机会是 的的互不重叠互不重叠简单随机简单随机系统系统层层差异明显的几个部分差异明显的几个部分简单随机简单随机均等均等1(教材习题改编教材习题改编)在某班的在某班的50名学生中,依次抽取学号为名学生中,依次抽取学号为5、10、15、20、25、30、35、40、45、50的的10名学生名学生进行作业检查,这种抽样方法是进行作业检查,这种抽样方法是 ()A随机抽样随机抽样 B分层
5、抽样分层抽样C系统抽样系统抽样 D以上都不是以上都不是解析:由系统抽样的特点可知解析:由系统抽样的特点可知C正确正确小题能否全取小题能否全取答案:答案:C2为了了解一批零件的长度,抽测了其中为了了解一批零件的长度,抽测了其中200个零件的长个零件的长度,在这个问题中,度,在这个问题中,200个零件的长度是个零件的长度是 ()A总体总体 B个体是每一个零件个体是每一个零件C总体的一个样本总体的一个样本 D样本容量样本容量解析:解析:200个零件的长度是总体的一个样本个零件的长度是总体的一个样本答案:答案:C3某工厂生产某工厂生产A,B,C三种不同型号的产品,产品的三种不同型号的产品,产品的数量之
6、比依次为数量之比依次为3 4 7,现在用分层抽样的方法抽,现在用分层抽样的方法抽出容量为出容量为n的样本,样本中的样本,样本中A型产品有型产品有15件,那么样件,那么样本容量本容量n为为()A50 B60C70 D80答案:答案:C4(2012金华模拟金华模拟)某学院有某学院有A,B,C三个专业共三个专业共1 200名学生现采用分层抽样的方法抽取一个容量为名学生现采用分层抽样的方法抽取一个容量为120的样本,已知的样本,已知A专业有专业有420名学生,名学生,B专业有专业有380名学名学生,则在生,则在C专业应抽取专业应抽取_名学生名学生答案:答案:405将某班的将某班的60名学生编号为:名学
7、生编号为:01,02,60,采用系统,采用系统抽样方法抽取一个容量为抽样方法抽取一个容量为5的样本,且随机抽得的一个的样本,且随机抽得的一个号码为号码为04,则剩下的四个号码依次是,则剩下的四个号码依次是_解析:依据系统抽样方法的定义知,将这解析:依据系统抽样方法的定义知,将这60名学生依名学生依次按编号每次按编号每12人作为一组,即人作为一组,即0112、1324、4960,当第一组抽得的号码是,当第一组抽得的号码是04时,剩下的四个号时,剩下的四个号码依次是码依次是16,28,40,52(即其余每一小组所抽出来的号码即其余每一小组所抽出来的号码都是相应的组中的第四个号码都是相应的组中的第四
8、个号码)答案:答案:16,28,40,52三种抽样方法的异同点:三种抽样方法的异同点:类别类别共同点共同点各自特点各自特点相互联系相互联系适用范围适用范围简单随简单随机抽样机抽样抽样过抽样过程中每程中每个个体个个体被抽取被抽取的机会的机会均等均等从总体中逐个抽从总体中逐个抽取取总体中的个总体中的个体数较少体数较少系统系统抽样抽样将总体均匀分成将总体均匀分成几部分,按事先几部分,按事先确定的规则在各确定的规则在各部分抽取部分抽取在起始部分抽在起始部分抽样时采用简单样时采用简单随机抽样随机抽样总体中的个总体中的个体数较多体数较多分层分层抽样抽样将总体分成几层,将总体分成几层,分层进行抽取分层进行抽
9、取各层抽样时采各层抽样时采用简单随机抽用简单随机抽样或系统抽样样或系统抽样总体由差异总体由差异明显的几部明显的几部分组成分组成简单随机抽样简单随机抽样例例1下面的抽样方法是简单随机抽样的是下面的抽样方法是简单随机抽样的是()A在某年明信片销售活动中,规定每在某年明信片销售活动中,规定每100万张为一万张为一个开奖组,通过随机抽取的方式确定号码的后四位为个开奖组,通过随机抽取的方式确定号码的后四位为2 709的为三等奖的为三等奖B某车间包装一种产品,在自动包装的传送带上,某车间包装一种产品,在自动包装的传送带上,每隔每隔30分钟抽一包产品,称其重量是否合格分钟抽一包产品,称其重量是否合格C某学校
10、分别从行政人员、教师、后勤人员中抽某学校分别从行政人员、教师、后勤人员中抽取取2人、人、14人、人、4人了解学校机构改革的意见人了解学校机构改革的意见D用抽签法从用抽签法从10件产品中选取件产品中选取3件进行质量检验件进行质量检验答案答案D自主解答自主解答A、B是系统抽样,因为抽取的个体间是系统抽样,因为抽取的个体间的间隔是固定的;的间隔是固定的;C是分层抽样,因为总体的个体有明是分层抽样,因为总体的个体有明显的层次;显的层次;D是简单随机抽样是简单随机抽样1简单随机抽样需满足:简单随机抽样需满足:(1)抽取的个体数有限;抽取的个体数有限;(2)逐个抽取;逐个抽取;(3)是不放回抽取;是不放回
11、抽取;(4)是等可能抽取是等可能抽取2简单随机抽样常有抽签法简单随机抽样常有抽签法(适用总体中个体数较适用总体中个体数较少的情况少的情况)、随机数表法、随机数表法(适用于个体数较多的情况适用于个体数较多的情况)1(2012宁波月考宁波月考)在简单随机抽样中,某一个个体被在简单随机抽样中,某一个个体被抽到的可能性抽到的可能性()A与第几次抽样有关,第一次抽到的可能性最大与第几次抽样有关,第一次抽到的可能性最大B与第几次抽样有关,第一次抽到的可能性最小与第几次抽样有关,第一次抽到的可能性最小C与第几次抽样无关,每一次抽到的可能性相等与第几次抽样无关,每一次抽到的可能性相等D与第几次抽样无关,与样本
12、容量无关与第几次抽样无关,与样本容量无关解析:由随机抽样的特点知某个体被抽到的可能性解析:由随机抽样的特点知某个体被抽到的可能性与第几次抽样无关,每一次抽到的可能性相等与第几次抽样无关,每一次抽到的可能性相等.答案:答案:C系系 统统 抽抽 样样例例2(2012山东高考山东高考)采用系统抽样方法从采用系统抽样方法从960人中人中抽取抽取32人做问卷调查,为此将他们随机编号为人做问卷调查,为此将他们随机编号为1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号,分组后在第一组采用简单随机抽样的方法抽到的号码为码为9.抽到的抽到的32人中,编号落入区间人中,编号落入区间1,450的人做问卷
13、的人做问卷A,编号落入区间编号落入区间451,750的人做问卷的人做问卷B,其余的人做问卷,其余的人做问卷C.则抽到的人中,做问卷则抽到的人中,做问卷B的人数为的人数为 ()A7 B9C10 D15答案:答案:C1.系统抽样适用的条件是总体容量较大,样本系统抽样适用的条件是总体容量较大,样本容量也较大容量也较大2.使用系统抽样时,若总体容量不能被样本容使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体量整除,可以先从总体中随机地剔除几个个体2(2012武夷模拟武夷模拟)用系统抽样法从用系统抽样法从160名学生中抽取名学生中抽取容量为容量为20的样本,将的样本,将16
14、0名学生随机地从名学生随机地从1160编号,编号,按编号顺序平均分成按编号顺序平均分成20组组(18号,号,916号,号,153160号号),若第,若第16组抽出的号码为组抽出的号码为126,则第,则第1组组中用抽签的方法确定的号码是中用抽签的方法确定的号码是_答案答案:6解析:设第解析:设第1组抽取的号码为组抽取的号码为b,则第,则第n组抽取的号组抽取的号码为码为8(n1)b,8(161)b126,b6,故第故第1组抽取的号码为组抽取的号码为6.例例3(1)(2012福建高考福建高考)一支田径队有男女运动员一支田径队有男女运动员98人,其中男运动员有人,其中男运动员有56人按男女比例用分层抽
15、样的人按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为方法,从全体运动员中抽出一个容量为28的样本,那么的样本,那么应抽取女运动员人数是应抽取女运动员人数是_(2)(2012天津高考天津高考)某地区有小学某地区有小学150所,中学所,中学75所,所,大学大学25所现采用分层抽样的方法从这些学校中抽取所现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取所学校对学生进行视力调查,应从小学中抽取_所学校,中学中抽取所学校,中学中抽取_所学校所学校分分 层层 抽抽 样样答案答案(1)12(2)189 本例本例(2)中条件变为中条件变为“某地区有小学、中学、大某地区
16、有小学、中学、大学若干所,现采用分层抽样的方法从这些学校中抽学若干所,现采用分层抽样的方法从这些学校中抽取取30所学校,其中从所学校,其中从150所小学中抽取所小学中抽取18所所”,试求,试求该地区共有多少所学校该地区共有多少所学校进行分层抽样时应注意以下几点进行分层抽样时应注意以下几点(1)分层抽样中分多少层,如何分层要视具体情况而定,分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠要大,且互不重叠(2)为了保证每个个体等可能入样,所有层中每个个体为了保证每个个体等可能入样,所有
17、层中每个个体被抽到的可能性相同被抽到的可能性相同(3)在每层抽样时,应采用简单随机抽样或系统抽样的在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样方法进行抽样3(2012惠州二调惠州二调)某工厂的一、二、三车间在某工厂的一、二、三车间在12月份共月份共生产了生产了3 600双皮靴,在出厂前要检查这批产品的质量,双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为车间抽取的产品数分别为a、b、c,且,且a、b、c构成等构成等差数列,则二车间生产的产品数为差数列,则二车间生产的产品数为 ()
18、A800B1 000C1 200 D1 500答案答案:C 典例典例(2012四川高考四川高考)交通管理部门为了解机动车交通管理部门为了解机动车驾驶员驾驶员(简称驾驶员简称驾驶员)对某新法规的知晓情况,对甲、乙、对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查假设四个社区驾驶员丙、丁四个社区做分层抽样调查假设四个社区驾驶员的总人数为的总人数为N,其中甲社区有驾驶员,其中甲社区有驾驶员96人若在甲、乙、人若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数,则这四个社区驾驶员的总人数N为为 ()A101
19、B808 C1 212 D2 012答案答案B1.因忽视了分层抽样中各层的抽样比相同而导因忽视了分层抽样中各层的抽样比相同而导致本题不会列出比例关系式求解致本题不会列出比例关系式求解.某单位有职工某单位有职工160名,其中业务人员名,其中业务人员120名,管理人员名,管理人员16名,后勤人员名,后勤人员24名为了解职工的某种情况,要从中抽名为了解职工的某种情况,要从中抽取一个容量为取一个容量为20的样本若用分层抽样的方法,抽取的业的样本若用分层抽样的方法,抽取的业务人员、管理人员、后勤人员的人数应分别为务人员、管理人员、后勤人员的人数应分别为_答案答案:15,2,31(2012抚顺模拟抚顺模拟
20、)某商场有四类食品,其中粮某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分食类、植物油类、动物性食品类及果蔬类分别有别有40种、种、10种、种、30种、种、20种,现从中抽取种,现从中抽取一个容量为一个容量为20的样本进行食品安全检测若的样本进行食品安全检测若采用分层抽样的方法抽取样本,则抽取的植采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是物油类与果蔬类食品种数之和是 ()教师备选题(给有能力的学生加餐)(给有能力的学生加餐)解题训练要高效解题训练要高效见见“课时跟踪检课时跟踪检测(六十七)测(六十七)”A4 B5C6 D7答案答案:C2某工厂生产某工厂生产
21、A、B、C三种不同型号的产品,其相应产三种不同型号的产品,其相应产品数量之比为品数量之比为2 3 5,现用分层抽样方法抽出一个,现用分层抽样方法抽出一个容量为容量为n的样本,样本中的样本,样本中A型号产品有型号产品有16件,那么此样件,那么此样本的容量本的容量n_.答案:答案:80知识能否忆起知识能否忆起 一、作频率分布直方图的步骤一、作频率分布直方图的步骤1求极差求极差(即一组数据中即一组数据中 与与 的差的差)2确定确定 与与 3决定决定 4列列 5画画 最大值最大值最小值最小值组距组距组数组数分组分组频率分布表频率分布表频率分布直方图频率分布直方图 二、频率分布折线图和总体密度曲线二、频
22、率分布折线图和总体密度曲线 1频率分布折线图:连接频率分布直方图中各小频率分布折线图:连接频率分布直方图中各小长方形上端的长方形上端的 ,就得频率分布折线图,就得频率分布折线图 2总体密度曲线:随着总体密度曲线:随着 的增加,作图时的增加,作图时 增加,增加,减小,相应的频率折线图会减小,相应的频率折线图会越来越接近于越来越接近于 ,即总体密度曲线,即总体密度曲线中点中点样本容量样本容量所分的组数所分的组数组距组距一条光滑曲线一条光滑曲线三、样本的数字特征三、样本的数字特征数字数字特征特征定义定义众数众数一组数据中,出现次数一组数据中,出现次数 的数据叫做这组的数据叫做这组数据的众数数据的众数
23、.中位数中位数将一组数据按大小依次排列,把处在将一组数据按大小依次排列,把处在_位置的一个数据位置的一个数据(或最中间两个数据的或最中间两个数据的 )叫叫做这组数据的中位数做这组数据的中位数.,在频率分布直方图中,中在频率分布直方图中,中位数左边和右边的直方图的面积位数左边和右边的直方图的面积 .最多最多最中间最中间平均数平均数相等相等数字数字特征特征定义定义平均数平均数样本数据的算术平均数即样本数据的算术平均数即 .方差方差S2其中其中s为标准差为标准差四、茎叶图四、茎叶图茎叶图的优点是可以保留原始数据,而且可以随时记茎叶图的优点是可以保留原始数据,而且可以随时记录,方便记录与表示录,方便记
24、录与表示小题能否全取小题能否全取1.(教材习题改编教材习题改编)在如图所示的茎叶图在如图所示的茎叶图 表示的数据中,众数和中位数分别是表示的数据中,众数和中位数分别是 ()A23与与26B31与与26 C24与与30 D26与与30答案:答案:B解析:观察茎叶图可知,这组数据的众数是解析:观察茎叶图可知,这组数据的众数是31,中位,中位数是数是26.2(教材习题改编教材习题改编)把样本容量为把样本容量为20的数据分组,分组区的数据分组,分组区间与频数如下:间与频数如下:10,20),2;20,30),3;30,40),4;40,50),5;50,60),4;60,70,2,则在区间,则在区间1
25、0,50)上的数据的频率是上的数据的频率是 ()A0.05B0.25C0.5 D0.7答案:答案:D3(2012长春模拟长春模拟)从某小学随机抽取从某小学随机抽取100名同学,将他们名同学,将他们的身高的身高(单位:厘米单位:厘米)数据绘制成频率分布直方图,由数据绘制成频率分布直方图,由图中数据可知身高在图中数据可知身高在120,130内的学生人数为内的学生人数为 ()A20 B25C30 D35答案:答案:C解析:由题意知解析:由题意知a100.350.20.10.051,则则a0.03,故学生人数为,故学生人数为0.310030.4(教材习题改编教材习题改编)甲、乙两人比赛射击,两人所得的
26、平均甲、乙两人比赛射击,两人所得的平均环数相同,其中甲所得环数的方差为环数相同,其中甲所得环数的方差为5,乙所得环数如,乙所得环数如下:下:5、6、9、10、5,那么这两人中成绩较稳定的是,那么这两人中成绩较稳定的是_答案:乙答案:乙5(2012山西大同山西大同)将容量为将容量为n的样本中的数据分为的样本中的数据分为6组,组,绘制频率分布直方图,若第一组至第六组的数据的频绘制频率分布直方图,若第一组至第六组的数据的频率之比为率之比为2 3 4 6 4 1,且前三组数据的频数之,且前三组数据的频数之和为和为27,则,则n_.答案:答案:601.在频率分布直方图中,中位数左边和右边的直方图的在频率
27、分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值,而平均数的估计值等面积相等,由此可以估计中位数的值,而平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和,众数是最高的矩形的中点的横坐标的横坐标之和,众数是最高的矩形的中点的横坐标2注意区分直方图与条形图,条形图中的纵坐标刻度注意区分直方图与条形图,条形图中的纵坐标刻度为频数或频率,直方图中的纵坐标刻度为频率为频数或频率,直方图中的纵坐标刻度为频率/组距组距3方差与原始数据的单位不同,且平方后可能夸大了方差与原始数据的单位不同,且平方后可能
28、夸大了偏差的程度,虽然方差与标准差在刻画样本数据的分散程度偏差的程度,虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差上是一样的,但在解决实际问题时,一般多采用标准差 例例1(2012广东高考广东高考)某校某校100名学生期中考名学生期中考试语文成绩的频率分布直方试语文成绩的频率分布直方图如图所示,其中成绩分组图如图所示,其中成绩分组区间是:区间是:50,60),60,70),70,80),80,90),90,100用样本的频率分布估计总体分布用样本的频率分布估计总体分布(1)求图中求图中a的值;的值;(2)根据频率分布直方图,估计这根据频率分布直方图,
29、估计这100名学生语文成绩名学生语文成绩的平均分;的平均分;(3)若这若这100名学生语文成绩某些分数段的人数名学生语文成绩某些分数段的人数(x)与数与数学成绩相应分数段的人数学成绩相应分数段的人数(y)之比如下表所示,求数学成之比如下表所示,求数学成绩在绩在50,90)之外的人数之外的人数.分数段分数段50,60)60,70)70,80)80,90)xy11213445自主解答自主解答(1)由频率分布直方图知由频率分布直方图知(2a0.020.030.04)101,解得,解得a0.005.(2)由频率分布直方图知这由频率分布直方图知这100名学生语文成绩的平均分为名学生语文成绩的平均分为55
30、0.00510650.0410750.0310850.0210950.0051073(分分)在本例条件下估计样本数据的众数在本例条件下估计样本数据的众数解:众数应为最高矩形的中点对应的横坐标,故约解:众数应为最高矩形的中点对应的横坐标,故约为为65.解决频率分布直方图问题时要抓住解决频率分布直方图问题时要抓住(1)直方图中各小长方形的面积之和为直方图中各小长方形的面积之和为1.(3)直方图中每组样本的频数为频率直方图中每组样本的频数为频率总体数总体数1(2012深圳调研深圳调研)某中学组某中学组织了织了“迎新杯迎新杯”知识竞赛,知识竞赛,从参加考试的学生中抽出从参加考试的学生中抽出若干名学生,
31、并将其成绩若干名学生,并将其成绩绘制成频率分布直方图绘制成频率分布直方图(如如图图),其中成绩的范围是,其中成绩的范围是50,100,样本数据分组为,样本数据分组为50,60),60,70),70,80),80,90),90,100,已知样本,已知样本中成绩小于中成绩小于70分的个数是分的个数是36,则样本中成绩在,则样本中成绩在60,90)内内的学生人数为的学生人数为_答案:答案:90茎叶图的应用茎叶图的应用答案答案B 由茎叶图可以清晰地看到数据的分布情况,这一点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似它优于频率分布直方图的第一点同频率分布直方图类似它优于频率分布直方
32、图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示其缺点是当样本容量较大时,点是茎叶图便于记录和表示其缺点是当样本容量较大时,作图较繁作图较繁2(2012淮北模考淮北模考)如图所示的茎叶图记录了一组数据,如图所示的茎叶图记录了一组数据,关于这组数据,众数是关于这组数据,众数是9;平均数是;平均数是10;中位;中位数是数是9或或10;标准差是;标准差是3.4.其中说法正确的序号是其中说法正确的序号是_.答案:答案:样本的数字特征样本的数字特征AnmCnm D不能确定不能确定(2)(2012山东高考山东高考)在某次
33、测量中得到的在某次测量中得到的A样本数据样本数据如下:如下:82,84,84,86,86,86,88,88,88,88.若若B样本数据恰好是样本数据恰好是A样本数据每个都加样本数据每个都加2后所得数据,则后所得数据,则A,B两样本的下两样本的下列数字特征对应相同的是列数字特征对应相同的是()A众数众数 B平均数平均数C中位数中位数 D标准差标准差 (2)对样本中每个数据都加上一个非零常数时不改变样对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变本的方差和标准差,众数、中位数、平均数都发生改变答案答案(1)A(2)D(1)众数体现了样本数据的最大集中点
34、,但无法客众数体现了样本数据的最大集中点,但无法客观地反映总体特征观地反映总体特征(2)中位数是样本数据居中的数中位数是样本数据居中的数(3)标准差、方差描述了一组数据围绕平均数波动标准差、方差描述了一组数据围绕平均数波动的大小标准差、方差越大,数据越分散,标准差、的大小标准差、方差越大,数据越分散,标准差、方差越小,数据越集中方差越小,数据越集中3(2012淄博一检淄博一检)一农场在同一块稻田中种植一种水稻,一农场在同一块稻田中种植一种水稻,其连续其连续8年的产量年的产量(单位:单位:kg)如下:如下:450,430,460,440,450,440,470,460,则该组数据的方差为,则该组
35、数据的方差为 ()A120 B80C15 D150答案:答案:D典例典例(2012山东高考山东高考)如图是根据部分城市某年如图是根据部分城市某年6月份的平均气温月份的平均气温(单位:单位:)数据得到的样本频率分布直数据得到的样本频率分布直方图,其中平均气温的范围是方图,其中平均气温的范围是20.5,26.5,样本数据的分,样本数据的分组为组为20.5,21.5),21.5,22.5),22.5,23.5),23.5,24.5),24.5,25.5),25.5,26.5已知样本中平均气温低于已知样本中平均气温低于22.5的城市个数为的城市个数为11,则样本中平均气温不低于,则样本中平均气温不低于
36、25.5的城市个数为的城市个数为_尝试解题尝试解题最左边两个矩形面积之和为最左边两个矩形面积之和为0.1010.1210.22,总城市数为,总城市数为110.2250,最右边矩形,最右边矩形面积为面积为0.1810.18,500.189.答案答案91.忽视频率分布直方图中纵轴的含义为频率忽视频率分布直方图中纵轴的含义为频率/组距,组距,误认为是每组相应的频率值,导致失误误认为是每组相应的频率值,导致失误.2.不清楚直方图中各组的面积之和为不清楚直方图中各组的面积之和为1,导致某组的,导致某组的频率不会求频率不会求.3.不理解由直方图求样本平均值的方法,误用每组不理解由直方图求样本平均值的方法,
37、误用每组的频率乘以每组的端点值,而导致失误的频率乘以每组的端点值,而导致失误.对某种电子元件的使用寿命进行跟踪调查,所得样本对某种电子元件的使用寿命进行跟踪调查,所得样本的频率分布直方图如图所示,由图可知,这一批电子元件的频率分布直方图如图所示,由图可知,这一批电子元件中使用寿命在中使用寿命在100300 h的电子元件的数量与使用寿命在的电子元件的数量与使用寿命在300600 h的电子元件的数量的比是的电子元件的数量的比是 ()答案答案:C1.(2012陕西高考陕西高考)对某商店一个月内每天对某商店一个月内每天 的顾客人数进行了统计,得到样本的茎的顾客人数进行了统计,得到样本的茎 叶图叶图(如
38、图所示如图所示),则该样本的中位数、,则该样本的中位数、众数、极差分别是众数、极差分别是 ()A46,45,56 B46,45,53 C47,45,56 D45,47,53教师备选题(给有能力的学生加餐)(给有能力的学生加餐)解题训练要高效解题训练要高效见见“课时跟踪检课时跟踪检测(六十八)测(六十八)”答案答案:A2.(2012济南调研济南调研)如图是如图是2012年在某大年在某大 学自主招生面试环节中,七位评委为学自主招生面试环节中,七位评委为 某考生打出的分数的茎叶统计图,去某考生打出的分数的茎叶统计图,去 掉一个最高分和一个最低分后,所剩掉一个最高分和一个最低分后,所剩 数据的平均数和
39、方差分别为数据的平均数和方差分别为()A84,4.84 B84,1.6 C85,1.6 D85,4答案:答案:390知识能否忆起知识能否忆起 一、变量间的相关关系一、变量间的相关关系 1常见的两变量之间的关系有两类:一类是函数关常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一系,另一类是相关关系;与函数关系不同,相关关系是一种种 关系关系 2从散点图上看,点分布在从左下角到右上角的区从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为域内,两个变量的这种相关关系称为 ,点分布在左,点分布在左上角到右下角的区域内,两个变量的相关关
40、系为上角到右下角的区域内,两个变量的相关关系为 非非确定性确定性正相关正相关负相关负相关 二、两个变量的线性相关二、两个变量的线性相关 1从散点图上看,如果这些点从整体上看大致分布从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具在通过散点图中心的一条直线附近,称两个变量之间具有有 ,这条直线叫,这条直线叫 线性相关关系线性相关关系回归直线回归直线 当当r0时,表明两个变量时,表明两个变量 ;当当r0时,表明两个变量时,表明两个变量 r的绝对值越接近于的绝对值越接近于1,表明两个变量的线性相关,表明两个变量的线性相关性性 r的绝对值越接近于的绝对值越接近
41、于0时,表明两个变量之间线时,表明两个变量之间线性相关性性相关性 正相关正相关负相关负相关越强越强越弱越弱abcdbdac总计总计cddcx2abbax1合计合计y2y1小题能否全取小题能否全取1(教材习题改编教材习题改编)观察下列各图形观察下列各图形其中两个变量其中两个变量x、y具有相关关系的图是具有相关关系的图是()A BC D解析:由散点图知具有相关关系解析:由散点图知具有相关关系答案:答案:CA2 B1C2 D1答案:答案:A 3在一次对性别与说谎是否相关的调查中,得到如下数在一次对性别与说谎是否相关的调查中,得到如下数 据:据:301614合计合计1798女女1376男男合计合计不说
42、谎不说谎说谎说谎根据表中数据,得到如下结论中正确的一项是根据表中数据,得到如下结论中正确的一项是()A在此次调查中有在此次调查中有95%的把握认为是否说谎与性别有关的把握认为是否说谎与性别有关B在此次调查中有在此次调查中有99%的把握认为是否说谎与性别有关的把握认为是否说谎与性别有关C在此次调查中有在此次调查中有99.5%的把握认为是否说谎与性别有关的把握认为是否说谎与性别有关D在此次调查中没有充分的证据显示说谎与性别有关在此次调查中没有充分的证据显示说谎与性别有关答案:答案:D 答案:答案:83%5已知已知x,y之间的数据如表所示,则回归直线过点之间的数据如表所示,则回归直线过点_.3.83
43、.22.51.81.2y54321x答案:答案:(3,2.5)1.回归分析是对具有相关关系的两个变量进行统计分析回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义程才有实际意义,否则,求出的线性回归方程毫无意义 2由回归方程进行预报,仅是一个预报值,而不是真由回归方程进行预报,仅是一个预报值,而不是真实发生的值实发生的值 3使用使用2统计量作统计量作22列联表的独立性检验时,要求列联表的独立性检验时,要求表中的表中的4个数据都要大于个数据都要大于5,在
44、选取样本容量时一定要注,在选取样本容量时一定要注意意 自主解答自主解答因为所有的点都在直线上,所以它就是因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为确定的函数关系,所以相关系数为1.答案答案D 1相关关系的判断方法一是利用散点图直观判断,相关关系的判断方法一是利用散点图直观判断,二是利用相关系数作出判断二是利用相关系数作出判断 2对于由散点图作出相关性判断时,若散点图呈对于由散点图作出相关性判断时,若散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线型也是有相关性若呈曲线型也是有相关性 3由相关系数由相关系数r判
45、断时判断时|r|越趋近于越趋近于1相关性越强相关性越强1.已知变量已知变量x,y之间具有线性相关关系,其散点图如图所之间具有线性相关关系,其散点图如图所 示,则其回归方程可能为示,则其回归方程可能为()答案:答案:B 例例2(2012福建高考福建高考)某工厂为了对新研发的一某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:试销,得到如下数据:687580838490销量销量y(件件)98.88.68.48.28单价单价x(元元)(2)预计在今后的销售中,销量与单价仍然服从预计在今后的销售中,销量与单价仍然服
46、从(1)中中的关系,且该产品的成本是的关系,且该产品的成本是4元元/件,为使工厂获得最大利件,为使工厂获得最大利润,该产品的单价应定为多少元?润,该产品的单价应定为多少元?(利润销售收入成利润销售收入成本本)1最小二乘法估计的一般步骤:最小二乘法估计的一般步骤:(1)作出散点图,判断是否线性相关;作出散点图,判断是否线性相关;(3)根据方程进行估计根据方程进行估计2(2012长春模拟长春模拟)已知已知x、y取值如下表:取值如下表:9.37.46.15.61.81.3y865410 xA1.30B1.45C1.65 D1.80答案:答案:B 110合计合计30乙班乙班10甲班甲班合计合计非优秀非
47、优秀优秀优秀(1)请完成上面的列联表;请完成上面的列联表;10.8286.6355.0243.8412.706k00.0010.0100.0250.0500.100P(2 k0)自主解答自主解答(1)列联表如下:列联表如下:1108030合计合计503020乙班乙班605010甲班甲班合计合计非优秀非优秀优秀优秀1独立性检验的一般步骤:独立性检验的一般步骤:(1)根据样本数据制成根据样本数据制成22列联表;列联表;(3)查表比较查表比较2与临界值的大小关系,作统计判断与临界值的大小关系,作统计判断2在实际问题中,独立性检验的结论也仅仅是一种数学在实际问题中,独立性检验的结论也仅仅是一种数学关系
48、,得到的结论也可能犯错误关系,得到的结论也可能犯错误3(2012嘉兴联考嘉兴联考)为了判断高中三年级学生选修文科为了判断高中三年级学生选修文科 是否与性别有关,现随机抽取是否与性别有关,现随机抽取50名学生,得到如下名学生,得到如下 22列联表:列联表:503020合计合计27207女女231013男男合计合计文科文科理科理科解析:由解析:由2 4.8443.841.故认为选修文科与性别有关系出错的可能性约为故认为选修文科与性别有关系出错的可能性约为5%.答案:答案:5%概率与统计是高中数学的重要学习内容,在高考试概率与统计是高中数学的重要学习内容,在高考试卷中,每年都有所涉及,以解答题形式出
49、现的试题常常卷中,每年都有所涉及,以解答题形式出现的试题常常设计成包含概率计算,统计图表的识别等知识为主的综设计成包含概率计算,统计图表的识别等知识为主的综合题,以考生比较熟悉的实际应用问题为载体,注重考合题,以考生比较熟悉的实际应用问题为载体,注重考查基础知识和基本方法;以排列组合和概率统计等基础查基础知识和基本方法;以排列组合和概率统计等基础知识为工具,考查对概率事件的识别及概率计算知识为工具,考查对概率事件的识别及概率计算“大题规范解答大题规范解答得全分得全分”系列之系列之(十二十二)概率与统计的综合问题答题模板概率与统计的综合问题答题模板 典例典例(2012辽宁高考改编辽宁高考改编满分
50、满分1212分分)电视传媒公司电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取为了解某地区观众对某类体育节目的收视情况,随机抽取了了100名观众进行调查,其中女性有名观众进行调查,其中女性有55名下面是根据调名下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直查结果绘制的观众日均收看该体育节目时间的频率分布直方图:方图:课件演示更丰富,见配套光盘课件演示更丰富,见配套光盘超链接超链接 将日均收看该体育节目时间不低于将日均收看该体育节目时间不低于40分钟的观众称分钟的观众称为为“体育迷体育迷”,已知,已知“体育迷体育迷”中有中有10名女性名女性 (1)根据已知条件完成下
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。