1、一、复习回顾一、复习回顾我们已经学习了那些抽我们已经学习了那些抽样的方法?样的方法?二、样本分析二、样本分析 一般通过表、图、计算来分析数据,帮助一般通过表、图、计算来分析数据,帮助我们找出样本数据中的规律,使数据所包含的我们找出样本数据中的规律,使数据所包含的信息转化成直观的容易理解的形式。信息转化成直观的容易理解的形式。用样本估计总体一般有两种方法:一种用样本估计总体一般有两种方法:一种是用样本的频率分布估计总体的分布,另一是用样本的频率分布估计总体的分布,另一种是用样本的数字特征(如平均数、标准差种是用样本的数字特征(如平均数、标准差等)估计总体特征。等)估计总体特征。三、样本估计总体的
2、方法三、样本估计总体的方法 我国是世界上严重缺水的国家之一。我国是世界上严重缺水的国家之一。如何节约用水?如何节约用水?市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费,那么该如何比较合理的确定出这个标a?思考:由上表,大家可以得到什么信息?思考:由上表,大家可以得到什么信息?通过抽样,我们获得了通过抽样,我们获得了100100位居民某年的月平均用水量位居民某年的月平均用水量(单单位:位:t)t),如下表:,如下表:在初中,我们是用什么方法去整理和分析样本数在初中,我们是用什么方法去整理和分析样本数
3、据的?据的?分析数据的一种基本方法是用图将它们画出来,或分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式。者用紧凑的表格改变数据的排列方式。作图可以达到两个目的:作图可以达到两个目的:一是从数据中提取信息一是从数据中提取信息二是利用图形传递信息二是利用图形传递信息 表格则是通过改变数据的构成形式,为我们提供表格则是通过改变数据的构成形式,为我们提供解释数据的新方式。解释数据的新方式。频数分布表频数分布表和和频数分布图频数分布图可以使我们能够清楚可以使我们能够清楚的知道数据分布在各个小组的个数。的知道数据分布在各个小组的个数。频率分布表频率分布表和和频率分布图频率分布
4、图则是从各个小组数则是从各个小组数据在样本容量中据在样本容量中所占比例的大小所占比例的大小的角度,来表示的角度,来表示数据数据分布的规律分布的规律,它可以使我们看到整个样本数,它可以使我们看到整个样本数据的频率分布情况。据的频率分布情况。通过抽样,我们获得了通过抽样,我们获得了100100位居民某年的月平均用水量位居民某年的月平均用水量(单单位:位:t)t),如下表:,如下表:1.1.求极差(即一组数据中最大值与最小值求极差(即一组数据中最大值与最小值 的差)的差)2.2.决定组距与组数决定组距与组数组数组数=4.3-0.2=4.14.3-0.2=4.14.14.10.50.5=8.2=8.2
5、组距组距极差极差=3.3.将数据分组将数据分组0 0,0.5)0.5),0.50.5,1)1),4 4,4.54.5 组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。组距:指每个小组的两个端点的距离,4.4.列频率分布表列频率分布表100100位居民月平均用水量的频率分布表位居民月平均用水量的频率分布表频率频率/组距组距月平均用水量月平均用水量/t0.500.400.300.200.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5.5.画频率分布直方图画频率分布直方图小长方形的面积小长方形的面积组距组距频率频率=组距组距频率频率=注意:这里的纵坐标不是频
6、率,而是频率/组距;某个区间上的频率用这个区间的面积表示;直方图直方图思考:所有小长方形的面积之和等于?思考:所有小长方形的面积之和等于?一、求一、求极差极差,即数据中最大值与最小值的差即数据中最大值与最小值的差二、决定二、决定组距组距与组数与组数:组距:组距=极差极差/组数组数三、分组三、分组,通常对组内数值所在区间,通常对组内数值所在区间,取取左闭右开左闭右开区间区间,最后一组取闭区间最后一组取闭区间四、登记四、登记频数频数,计算计算频率频率,列出列出频率分布表频率分布表画一组数据的频率分布直方图画一组数据的频率分布直方图,可以按以下的步骤进可以按以下的步骤进行行:五、画出五、画出频率分布
7、直方图频率分布直方图(纵轴表示(纵轴表示频率组距频率组距)请同学们尝试以组距为请同学们尝试以组距为1 1重新作出频率分布图重新作出频率分布图.如果当地政府希望使如果当地政府希望使80%以上的居民每月的用水量不以上的居民每月的用水量不超出标准,根据超出标准,根据频率分布表频率分布表和和频率分布直方图频率分布直方图,你能对,你能对制定月用水量标准提出建议吗?制定月用水量标准提出建议吗?你认为你认为3吨这个标准一定能够保证吨这个标准一定能够保证 80以上的以上的居民用水不超标吗?如果不一定,那么哪些环节可居民用水不超标吗?如果不一定,那么哪些环节可能导致结论的差别?能导致结论的差别?必修必修3 3统
8、计统计频率频率/组距组距月平均用水量月平均用水量/t0.500.400.300.200.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 你能从图中分你能从图中分析出样本的哪些信析出样本的哪些信息?息?你认为频率分布直方图的优缺点是什么?你认为频率分布直方图的优缺点是什么?例例1.一个容量为一个容量为100的样本的样本,数据的分组和各组的相关信息如下表数据的分组和各组的相关信息如下表,试完成表中每一行的两个空格试完成表中每一行的两个空格.分组 频数 频率 频率累计12,15)615,18)0.0818,21)0.3021,24)2124,27)0.6927,30)1630,33
9、)0.1033,36 1.00合计合计 100 1.00应用举例:应用举例:0.060.0680.140.16160.210.510.18180.160.85100.950.055练习:O0.050.100.150.40123456 数据数据某个容量为100的样本的频率分布直方图如右,则在区间4,5)上的数据的频数为 高考题型:高考题型:小结:小结:频率分布直方图频率分布直方图总体分布总体分布步骤步骤1.1.求极差求极差2.2.决定组距与组数决定组距与组数3.3.将数据分组将数据分组4.4.列频率分布表列频率分布表5.5.画频率分布直方图画频率分布直方图频率分布直方图以面积的形式反映了数据落在
10、各个小组的频率频率分布直方图以面积的形式反映了数据落在各个小组的频率的大小的大小.估计估计必修必修3 3实验实验频率频率/组距组距月平均用水量月平均用水量/t0.500.400.300.200.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 频率分布折线图连接频率直方图中各小长方形上端中点的折线,叫频率分布折线图频率频率组距组距产品产品尺寸尺寸(mm)当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线总体在区间总体在区间 内取内取值的百分比值的百分比),(baS总体密度曲线a b总体密度曲线反映了总体在各个范围总体密度曲线反映了总体在各个范围内
11、取值的百分比内取值的百分比思考:可以用样本的频率分布折线图得到准确的总思考:可以用样本的频率分布折线图得到准确的总体密度曲线吗?体密度曲线吗?一、样本是随机的,不同的样本得到的频率一、样本是随机的,不同的样本得到的频率分布折线图不同。分布折线图不同。二、对于同一个样本,不二、对于同一个样本,不 同的分同的分组情况得到的频率分布折线图也不组情况得到的频率分布折线图也不同。同。频率分布折线图是随着样本的容量频率分布折线图是随着样本的容量和分组情况的变化而变化的。和分组情况的变化而变化的。还有一种简易的方法,就是将这些数据有条理的列出还有一种简易的方法,就是将这些数据有条理的列出来,从中观察数据的分
12、布情况,这种方法就是来,从中观察数据的分布情况,这种方法就是茎叶图茎叶图。制作茎叶图的方法:制作茎叶图的方法:将所有两位数的将所有两位数的十位数字作为十位数字作为“茎茎”,个位数字作,个位数字作为为“叶叶”,茎相同者共用一个茎,茎按茎相同者共用一个茎,茎按从小到大从小到大的顺序的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。的顺序同行列出。123452 54 51 1 6 6 7 904 9茎:十茎:十位数字位数字叶:表示叶:表示个位数字个位数字例例1:某篮球运动员在某赛季各场比赛的得分情况如下:某篮球运动员在某赛季各场
13、比赛的得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50茎叶图:茎叶图:需注意注:需注意注:1 1、重复出现的数据要重复记录,不能遗漏;特别是、重复出现的数据要重复记录,不能遗漏;特别是“叶叶”部分;部分;2 2、所有的信息都可以从这个茎叶图中得、所有的信息都可以从这个茎叶图中得 到;到;3 3、茎叶图便于记录和表示;、茎叶图便于记录和表示;4 4、不足的是其分析只是粗略的,对差异不大的两组数据、不足的是其分析只是粗略的,对差异不大的两组数据不易分析;表示三位数以上的数据时不够方便;不易分析;表示三位数以上的数据时不够方便;例例2:甲、乙两篮球运动员上赛
14、季每场比赛的得分如下,:甲、乙两篮球运动员上赛季每场比赛的得分如下,试比较这两位运动员的得分水平:试比较这两位运动员的得分水平:甲甲 12,15,24,25,31,31,36,36,37,39,44,49,50乙乙 8,13,14,16,23,26,28,33,38,39,51,33,29 甲甲 乙乙 0 8 2 5 1 3 4 6 0 5 2 3 6 8 9 1 1 6 6 7 9 3 8 9 1 3 4 9 4 0 5 1 注:中间的数字表示得分的十位数字。注:中间的数字表示得分的十位数字。旁边的数字分别表示两个人得分的个位数。旁边的数字分别表示两个人得分的个位数。为了了解各自受欢迎的程度
15、,甲、乙两个网站分别随机选取为了了解各自受欢迎的程度,甲、乙两个网站分别随机选取了了14天,记录下上午天,记录下上午8:0010:00间各自的点击量:间各自的点击量:甲:甲:73,24,58,72,64,38,66,70,20,41,55,67,8,25;乙:乙:12,37,21,5,54,42,61,45,19,6,19,36,42,14.你能用茎叶图表示上面的数据吗?你认为甲、乙两个网站哪你能用茎叶图表示上面的数据吗?你认为甲、乙两个网站哪个更受欢迎?个更受欢迎?例3:小结小结 图形图形 优点优点 缺点缺点频率分布频率分布 1)易表示大量数据)易表示大量数据 丢失原始数据丢失原始数据直方图直方图 2)直观地表明数据分布地)直观地表明数据分布地 情况情况 1)无数据损失)无数据损失 只能处理样本只能处理样本 茎叶图茎叶图 2)随时记录方便记录和表示)随时记录方便记录和表示 容量较小数据容量较小数据谢谢观看!谢谢观看!