1、数学必修数学必修苏教版系列课件苏教版系列课件统计的基本思想方法:用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本从总体中抽取一个样本,根据样本的根据样本的情况去估计总体的相应情况情况去估计总体的相应情况.统计的核心问题:如何根据样本的情况对总体的情况作出一种推断.这里包括两类问题:一类是如何从总体中抽取样本?另一类是如何根据对样本的整理、计算、分另一类是如何根据对样本的整理、计算、分析析,对总体的情况作出推断对总体的情况作出推断.用样本的有关情况去估计总体的相应情况用样本的有关情况去估计总体的相应情况,这种估计大体分为两类,这种估计大体分为两类,一类是用样本频率分一类是用样
2、本频率分布估计总体分布,布估计总体分布,一类是用样本的某种数字特一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应征(例如平均数、方差等)去估计总体的相应数字特征。数字特征。整体介绍:整体介绍:国际奥委会国际奥委会2003年年6月月29日决定,日决定,2008年北京年北京奥运会举办的日期比原定日期推迟两周,改在奥运会举办的日期比原定日期推迟两周,改在8月月8日至日至8月月24日举行原因是日举行原因是7月末月末8月初北京地区月初北京地区得气温高于得气温高于8月中下旬月中下旬下表是随机抽取的近年来北京地区下表是随机抽取的近年来北京地区7月月25日至日至8月月24日的日最高气温,得到如
3、下样本日的日最高气温,得到如下样本(单位:单位:C)7月月25日日至至8月月10日日41.937.535.735.437.238.134.733.733.332.534.633.030.831.028.631.528.88月月8日至日至8月月24日日28.631.528.833.232.530.330.229.833.132.829.425.624.730.030.129.530.3l怎样通过上表中的数据,分析比较两时间段的高温(怎样通过上表中的数据,分析比较两时间段的高温(33)状)状况呢?况呢?问题引入:问题引入:知识新授:知识新授:1.频数与频率频数与频率 频数频数是指一组数据中,某范围
4、内的数据出现是指一组数据中,某范围内的数据出现的次数;把频数除以数据的总个数,就得到的次数;把频数除以数据的总个数,就得到频率频率.2.频率分布表频率分布表 当总体很大或不便于获得时,可以用样本的当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布频率分布估计总体的频率分布.我们把反映总体我们把反映总体频率分布的表格称为频率分布的表格称为频率分布表频率分布表.说明说明:样本频率分布与总体频率分布:样本频率分布与总体频率分布有什么关系?有什么关系?通过样本的通过样本的频数分布、频率分布频数分布、频率分布可以可以估计总体的频率分布估计总体的频率分布.7月月25日至日至8月月10日日41
5、.937.535.735.437.238.134.7 33.733.332.534.6 33.0 30.8 31.028.6 31.528.88月月8日至日至8月月24日日28.6 31.528.8 33.232.530.3 30.2 29.8 33.132.8 29.4 25.6 24.7 30.0 30.129.5 30.3时间时间总天数总天数高温天数高温天数频率频率7月月25日至日至8月月10日日17110.6478月月8日至日至8月月24日日1720.118频率分布表频率分布表:3.频率分布条形图频率分布条形图时间时间总天数总天数高温天数高温天数频率频率7月月25日至日至8月月10日日
6、17110.6478月月8日至日至8月月24日日1720.118 各长方形长条的宽度要相同各长方形长条的宽度要相同.相邻长条的间距要适当相邻长条的间距要适当.长方形长条的高度表示取各长方形长条的高度表示取各值的频率值的频率.0.10.20.30.40.50.60.77/25-8/10时间时间频率频率8/8-8/24一幅图胜一幅图胜过一千字过一千字引例引例从某校高一年级的从某校高一年级的1002名新生中用系统抽样的方法抽取一名新生中用系统抽样的方法抽取一个容量为个容量为100的身高样本,数据如下(单位:的身高样本,数据如下(单位:cm)试作出该样)试作出该样本的频率分布表本的频率分布表16816
7、5171167170165170152175174165170168169171166164155164158170155166158155160160164156162160170168164174171165179163172180174173159163172167160164169151168158168176155165165169162177158175165169151163166163167178165158170169159155163153155167163164158168167161162167168161165174156167166162161164166 这个例子
8、与前面问题是不同的,这里的总体可以在一个实这个例子与前面问题是不同的,这里的总体可以在一个实数区间取值,称为连续型总体数区间取值,称为连续型总体.样本的频率分布表示形式有:样本的频率分布表示形式有:频率分布表频率分布表和和频率分布直方图频率分布直方图S1 计算数据中最大值与最小值的差计算数据中最大值与最小值的差(极差),确定(极差),确定全距全距.S2 根据全距,决定组数和组距根据全距,决定组数和组距.S3 分组:通常对组内数据所在区间取左闭右开区间,最后一组分组:通常对组内数据所在区间取左闭右开区间,最后一组取闭区间,且使分点比数据多一位小数取闭区间,且使分点比数据多一位小数.S4 登记频数
9、,计算频率,列出频率分布表登记频数,计算频率,列出频率分布表.算法算法:1.频率分布表频率分布表168165171167170165170152175174165170168169171166164155164158170155166158155160160164156162160170168164174171165179163172180174173159163172167160164169151168158168176155165165169162177158175165169151163166163167178165158170169159155163153155167163164158
10、168167161162167168161165174156167166162161164166S1 计算数据中最大值与最小值的差(极差),确定全距计算数据中最大值与最小值的差(极差),确定全距.组距和组数与数据的数量有关一般数据较多,分的组数组距和组数与数据的数量有关一般数据较多,分的组数也多;数据较少,分的组数也少当数据个数在也多;数据较少,分的组数也少当数据个数在50以内,分以内,分58组;当数据个数在组;当数据个数在50100之间,分之间,分812组应当注意的是如果组应当注意的是如果组内没有数据出现,就应当放宽组距,保证每个组内都有数据,组内没有数据出现,就应当放宽组距,保证每个组内都
11、有数据,且每个数据只属于确定的一组在决定组数时,往往不是一次且每个数据只属于确定的一组在决定组数时,往往不是一次就能成功的,要有一个观察、尝试的过程,一般分点比已知数就能成功的,要有一个观察、尝试的过程,一般分点比已知数据多一位小数,并且第一组的起点要稍稍减小只有合理地确据多一位小数,并且第一组的起点要稍稍减小只有合理地确定组距与组数,才能使数据分布的规律性比较明显地呈现出来;定组距与组数,才能使数据分布的规律性比较明显地呈现出来;S2 根据全距,决定组数和组距根据全距,决定组数和组距.S3 分组:通常对组内数据所在区间取左闭右开区间,最后分组:通常对组内数据所在区间取左闭右开区间,最后一组取
12、闭区间,且使分点比数据多一位小数一组取闭区间,且使分点比数据多一位小数.分组分组频数统计频数统计频数频数频率频率150.5,153.5)153.5,156.5)156.5,159.5)159.5,162.5)162.5,165.5)165.5,168.5)168.5,171.5)171.5,174.5)174.5,177.5)177.5,180.5合合 计计488112219147430.040.080.080.110.220.190.140.070.040.03412203153728693971001001练习练习:1.一个容量为一个容量为32的样本,已知某组样本的频率为的样本,已知某组样
13、本的频率为0.125,那么该组样本的频数为(那么该组样本的频数为()A2 B4 C6 D82.为了分析一次数学考试的情况,全班抽了为了分析一次数学考试的情况,全班抽了50人,将分人,将分数分为数分为5组第一组到第三组的频数分别是组第一组到第三组的频数分别是10,23,1,第四组的频率是第四组的频率是0.08,那么落在第五组的频数是,那么落在第五组的频数是_,频率是频率是_,全年级,全年级800人中分数落在第五组的约有人中分数落在第五组的约有_人人(1)频率,已知其中任意两个量就可以求出第三个量频率,已知其中任意两个量就可以求出第三个量 样本容量样本容量频数频数(2)各小组的频率和等于样本容量的
14、频率和等于各小组的频率和等于样本容量的频率和等于1(3)由样本的频率可以估计总体的频率,从而估计出总体的频数由样本的频率可以估计总体的频率,从而估计出总体的频数 B120.241923.一个容量为一个容量为20的样本数据,分组后组距与频数如下:的样本数据,分组后组距与频数如下:(10,20),),2;(;(20,30),),3;(;(30,40),),4;(40,50),),5;(;(50,60),),4;(;(60,70),),2。则。则样本在区间(样本在区间(10,50上的频率为(上的频率为()A.5%B.25%C.50%D.70%4.已知样本已知样本10,8,6,10,8,13,11,1
15、0,12,7,8,9,11,9,11,12,9,10,11,12,那么频率为,那么频率为0.2的的范围是(范围是()A.5.5-7.5 B.7.5-9.5 C.9.5-11.5 D.11.5-13.5DDS1 作出频率分布表,然后作直角坐标系,以横轴表示数据,纵作出频率分布表,然后作直角坐标系,以横轴表示数据,纵 轴表示轴表示“频率组距频率组距”;S2 把横轴分为若干段,每一线段对应一个组的组距,把横轴分为若干段,每一线段对应一个组的组距,S3 以此线段为底作一矩形,它的高等于该组的频率以此线段为底作一矩形,它的高等于该组的频率/组距组距,这样得这样得 出一系列的矩形,每个矩形的面积恰好是该组
16、上的频率出一系列的矩形,每个矩形的面积恰好是该组上的频率这些矩形就构成了频率分布直方图这些矩形就构成了频率分布直方图 所有矩形的面积和为所有矩形的面积和为1 算法算法:2.频率分布直方图频率分布直方图177.5身高身高cm150.5 153.5 156.5 159.5 162.5 165.5 168.5 171.5 174.5180.5频率频率组距组距0.020.040.060.08频率分布的条形图和频率分布直方图的区别频率分布的条形图和频率分布直方图的区别 两者是不同的概念;两者是不同的概念;横轴:两者表示内容横轴:两者表示内容相同相同.思考:思考:频率分布条形图和频率分布直方图是两个相同的
17、概念吗?频率分布条形图和频率分布直方图是两个相同的概念吗?有什么区别?有什么区别?纵轴:两者表示的内容纵轴:两者表示的内容不相同不相同.频率分布条形图频率分布条形图的纵轴(长方形的高)表示频率的纵轴(长方形的高)表示频率;频率分布直方图频率分布直方图的纵轴(长方形的高)表示频率与组距的纵轴(长方形的高)表示频率与组距的比值的比值.其相应组距上的频率等于该组距上长方形的面积其相应组距上的频率等于该组距上长方形的面积.=频率长方形的面积组距频率组距12.5,15.5)315.5,18.5)818.5,21.5)921.5,24.5)1124.5,27.5)1027.5,30.5)530.5,33.
18、5)4(1)列出样本的频率分布表列出样本的频率分布表;(2)画出频率分布直方图画出频率分布直方图;(3)根据频率分布直方图估计根据频率分布直方图估计,数据落在数据落在15.5,24.5)的概率是)的概率是多少多少?练习练习:2.一个容量为一个容量为100的样本的样本,数据的分组和各组的相数据的分组和各组的相关信息如下表关信息如下表,试完成表中每一行的两个空格试完成表中每一行的两个空格.0.06分组 频数 频率 频率累计12,15)615,18)0.0818,21)0.3021,24)2124,27)0.6927,30)1630,33)0.1033,36 1.00合计合计 100 1.000.0
19、680.140.16160.210.510.18180.160.85100.950.055课堂小结课堂小结编制频率分布直方图的步骤编制频率分布直方图的步骤:找最大值与最小值。找最大值与最小值。决定组距与组数决定组距与组数决定分点决定分点登记频数,计算频率,列表,画直方图登记频数,计算频率,列表,画直方图说明说明:(1)确定分点时确定分点时,使分点比数据多一位小数使分点比数据多一位小数,并且把第并且把第1小组的起点小组的起点稍微再小一点稍微再小一点.一一、求求极差,极差,即数据中最大值与最小值的差即数据中最大值与最小值的差二、决定二、决定组距组距与组数与组数:组距:组距=极差极差/组数组数三、分
20、组三、分组,通常对组内数值所在区间,通常对组内数值所在区间,取取左闭右开左闭右开区间区间,最后一组取闭区间最后一组取闭区间四、登记四、登记频数频数,计算计算频率频率,列出列出频率分布表频率分布表画一组数据的频率分布直方图画一组数据的频率分布直方图,可以按以可以按以下的步骤进行下的步骤进行:五、画出五、画出频率分布直方图频率分布直方图(纵轴表示(纵轴表示频率组距频率组距)频率分布直方图频率分布直方图应用应用步骤步骤1.1.求极差求极差2.2.决定组距与组数决定组距与组数3.3.将数据分组将数据分组4.4.列频率分布表列频率分布表5.5.画频率分布直方图画频率分布直方图课后作业:课后作业:课本课本 P P5959 习题习题2.2 2.2 No.1No.1、2 2、3.3.