第一章-统计总复习(修改版)课件.ppt

上传人(卖家):ziliao2023 文档编号:5695783 上传时间:2023-05-03 格式:PPT 页数:40 大小:1.43MB
下载 相关 举报
第一章-统计总复习(修改版)课件.ppt_第1页
第1页 / 共40页
第一章-统计总复习(修改版)课件.ppt_第2页
第2页 / 共40页
第一章-统计总复习(修改版)课件.ppt_第3页
第3页 / 共40页
第一章-统计总复习(修改版)课件.ppt_第4页
第4页 / 共40页
第一章-统计总复习(修改版)课件.ppt_第5页
第5页 / 共40页
点击查看更多>>
资源描述

1、必修必修3 3复习统计复习统计 v统计知识点:统计知识点:v1、抽样方法。、抽样方法。v(1)简单随机抽样()简单随机抽样(2)系统抽样()系统抽样(3)分层抽样)分层抽样v 2、样本分布估计总体分布、样本分布估计总体分布v(1)频率分布表)频率分布表 (2)直方图)直方图 v (3)折线图)折线图 (4)散点图散点图(5)茎叶图)茎叶图v 3、样本特征数估计总体特征数、样本特征数估计总体特征数v (1)平均数()方差平均数()方差(3)众数众数(4)中位数中位数v 、线性回归方程。、线性回归方程。总体:总体:在统计中,所有考察对象的全体。在统计中,所有考察对象的全体。个体个体:总体中的每一个

2、考察对象。总体中的每一个考察对象。样本样本:从总体中抽取的一部分个体叫做从总体中抽取的一部分个体叫做这个总体的一个样本。这个总体的一个样本。样本容量样本容量:样本中个体的数目。样本中个体的数目。总体、个体、样本、样本容量总体、个体、样本、样本容量1.统计的的统计的的基本思想基本思想是:是:用样本的某个量去估计总体的用样本的某个量去估计总体的某个量某个量抽取样本要求:总体中每个个体被抽取的机会相等(1)简单随机抽样(2)系统抽样(3)分层抽样1 1、抽签法步骤、抽签法步骤(1 1)先将总体中的所有个体(共有)先将总体中的所有个体(共有N N个)个)编号(号码可从编号(号码可从1 1到到N N)(

3、2 2)把号码写在形状、大小相同的号)把号码写在形状、大小相同的号签上,号签可用小球、卡片、纸条等制签上,号签可用小球、卡片、纸条等制作作(3 3)将这些号签放在同一个箱子里,)将这些号签放在同一个箱子里,进行均匀搅拌进行均匀搅拌(4 4)抽签时,每次从中抽出一个号签,)抽签时,每次从中抽出一个号签,连续抽取连续抽取n n次次(5 5)抽出样本)抽出样本2 2、随机数表法步骤、随机数表法步骤(1)将总体中的个体编号)将总体中的个体编号(编号时位数要编号时位数要一样一样);(2)选定开始的数字;)选定开始的数字;(3)按照一定的规则读取号码;)按照一定的规则读取号码;(4)取出样本)取出样本系统

4、抽样步骤系统抽样步骤:1.编号编号,随机剔除多余个体随机剔除多余个体,重新编号重新编号2.分段分段 (段数等于样本容量段数等于样本容量)间隔长度间隔长度 k=N/n3.抽取第一个个体编号为抽取第一个个体编号为i 4.依预定的规则抽取余下的依预定的规则抽取余下的 个体编个体编号为号为i+k,i+2k,分层抽样步骤:分层抽样步骤:1.将总体按一定标准分层将总体按一定标准分层;2.计算各层的个体数与总体的个体数计算各层的个体数与总体的个体数的比的比;3.按比例确定各层应抽取的样本数目按比例确定各层应抽取的样本数目4.在每一层进行抽样在每一层进行抽样 (可用简单随可用简单随机抽样或系统抽样机抽样或系统

5、抽样)类别类别抽样方式抽样方式使用范围使用范围共同点共同点相互联系相互联系简单随机抽样简单随机抽样从总体中逐个抽取从总体中逐个抽取总体中个体数较少总体中个体数较少时时抽样过程中抽样过程中每个个体被每个个体被抽取的可能抽取的可能性相同性相同系统抽样系统抽样分段分段按规则抽取按规则抽取总体中个体数较多总体中个体数较多时时在第一段中采在第一段中采用简单随机抽用简单随机抽样样分层抽样分层抽样分层分层按各层比例抽取按各层比例抽取总体中个体差异明总体中个体差异明显时显时各层中抽样时各层中抽样时采用前两种方采用前两种方式式分析样本,估计总体(1)分析样本的分布情况(2)分析样本的特征数公式公式样本数据:样本

6、数据:nxxx,21nxxxxn 21平均数:平均数:标准差:标准差:nxxxxssn2212)()(1.1.(20142014陕西高考)某公司陕西高考)某公司1010位员工的月工资(单位员工的月工资(单位位:元)为元)为 ,其均值和方差分别为,其均值和方差分别为 和和s s2 2,若从下月起每位员工的月工资增加若从下月起每位员工的月工资增加100100元,则这元,则这1010位位员工下月工资的均值和方差分别为(员工下月工资的均值和方差分别为()A A.,s s2 2+100+1002 2 B B.+100,s +100,s2 2+100+1002 2 C C.,s,s2 2 D D.+100

7、,s+100,s2 2D D1210 x xxxxxxx2 2.(20132013安徽高考)某班级有安徽高考)某班级有5050名学生,其中有名学生,其中有3030名男生和名男生和2020名女生,随机询问了该班五名男生和五名名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别女生在某次数学测验中的成绩,五名男生的成绩分别为为86,94,88,92,9086,94,88,92,90,五名女生的成绩分别为,五名女生的成绩分别为88,93,93,88,93.88,93,93,88,93.下列说法一定正确的是(下列说法一定正确的是()A.A.这种抽样方法是一种分层抽样这种抽

8、样方法是一种分层抽样B.B.这种抽样方法是一种系统抽样这种抽样方法是一种系统抽样C.C.这五名男生成绩的方差大于这五名女生成绩的方差这五名男生成绩的方差大于这五名女生成绩的方差D.D.该班级男生成绩的平均数小于该班女生成绩的平均该班级男生成绩的平均数小于该班女生成绩的平均数数C C3.3.某同学使用计算器求某同学使用计算器求3030个数据的平均数时,个数据的平均数时,错将其中一个数据错将其中一个数据105105输入为输入为1515,那么由此求出,那么由此求出的平均数与实际平均数的差是的平均数与实际平均数的差是_._.-3-34甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人甲、乙、丙、丁四人参

9、加奥运会射击项目选拔赛,四人 的平均成绩和方差如下表所示:的平均成绩和方差如下表所示:从这四个人中选择一人参加奥运会射击项目比赛,最从这四个人中选择一人参加奥运会射击项目比赛,最佳人选是佳人选是 ()A甲甲 B乙乙C丙丙 D丁丁C茎叶图茎叶图茎叶图的概念:茎叶图的概念:当数据是两位有效数字时,用中间的数当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做

10、茎叶图。(见课本例上长出来的叶子,因此通常把这样的图叫做茎叶图。(见课本例子)子)2茎叶图的特征:茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。图中的数据可以随时记录,随时添加,方便记录与表示。()茎叶图只便于表示两位有效数字的数据,而且茎叶图只方()茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表

11、便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。示两个记录那么直观,清晰。3.制作茎叶图的方法:将所有两位数的十位数字作为制作茎叶图的方法:将所有两位数的十位数字作为“茎茎”,个位数字作,个位数字作为叶,茎相同者共用一个茎,茎按从小到大为叶,茎相同者共用一个茎,茎按从小到大 的顺序从上向下列出,共的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。茎的叶一般按从大到小(或从小到大)的顺序同行列出。注意:相同的得分要重复记录,不能遗漏。注意:相同的得分要重复记录,不能遗漏。2.2.如图所示是甲、乙两名篮球运动员每场比赛如图所示是甲、乙两名篮球

12、运动员每场比赛得分情况的茎叶图,则甲和乙得分的中位数的得分情况的茎叶图,则甲和乙得分的中位数的和是和是_._.【解析解析】根据茎叶图可知甲、乙两人的中位数根据茎叶图可知甲、乙两人的中位数分别是分别是3232和和2525,所以两人得分的中位数之和为,所以两人得分的中位数之和为32+25=57.32+25=57.5757甲甲乙乙(1)分析样本的分布情况样本的频率分布表样本的频率分布直方图样本的茎叶图频率分布:频率分布:是指一个样本数据在各个小范围内所占比是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分例的大小。一般用频率分布直方图反映样本的频率分布。布。频率分布直

13、方图的特征:频率分布直方图的特征:(1)从频率分布直方图可以清楚的看出数据分布的)从频率分布直方图可以清楚的看出数据分布的总体趋势。总体趋势。(2)从频率分布直方图得不出原始的数据内容,把)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹数据表示成直方图后,原有的具体数据信息就被抹掉了。掉了。样本的频率分布表v(1)找全距)找全距v(2)分组)分组v(3)找频数,计算频率,列表)找频数,计算频率,列表样本的频率分布直方图 作样本频率分布直方图的步骤:(1 1)求极差;)求极差;(2 2)决定组距与组数)决定组距与组数;(;(组数极差组数极差/组距组距)(3

14、3)将数据分组;)将数据分组;(4 4)列频率分布表(分组,频数,频率);)列频率分布表(分组,频数,频率);(5 5)画频率分布直方图。)画频率分布直方图。作频率分布直方图的方法:作频率分布直方图的方法:v把横轴横轴分成若干段,每一线段对应一个组的组距组距,然后以此线段为底作一矩形,它的高高等于该组的频率频率/组距组距,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率,这些矩形就构成了频率分布直方图。初中统计部分曾学过用什么来反映总体的水平?初中统计部分曾学过用什么来反映总体的水平?用什么来考察稳定程度?它们是怎么定义的?用什么来考察稳定程度?它们是怎么定义的?1、众数众数:在一组数据

15、中,出现次数最多的数据叫做:在一组数据中,出现次数最多的数据叫做这组数据的众数这组数据的众数在初中我们学过用在初中我们学过用平均数、众数和中位数平均数、众数和中位数反映总体的水平,用反映总体的水平,用方差方差考考察稳定程度。察稳定程度。2、中位数中位数:将一组数据按大小依次排列,把处在最中间位置的一个:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数数据(或最中间两个数据的平均数)叫做这组数据的中位数3、平均数、平均数:一般地,如果一般地,如果n个数个数 ,那么,那么,叫做这叫做这n个数的平均数个数的平均数12,.,nxxx121(.)nxx

16、xxn众数、中位数、平均数众数、中位数、平均数都是描述一组数据的都是描述一组数据的集中趋势集中趋势的特征数的特征数,本节课就学习如何利用频率分布直方图求,本节课就学习如何利用频率分布直方图求众数、中位数、平均数?众数、中位数、平均数?众数、中位数、平均数与众数、中位数、平均数与 我们以前面学过的调查我们以前面学过的调查100位居民的月均用水量的问题中,位居民的月均用水量的问题中,所得到的频率分布直方图为例,来研究样本的众数、中位数、所得到的频率分布直方图为例,来研究样本的众数、中位数、平均数等数字特征与样本数据的频率分布直方图的关系。平均数等数字特征与样本数据的频率分布直方图的关系。0.52.

17、521.543.534.5频率频率组距组距1如图为如图为 100位居民的月均用水量的样本频率分布直方图:位居民的月均用水量的样本频率分布直方图:思考思考1:图中最高的小长方形的:图中最高的小长方形的含义是什么?由此你是否能得含义是什么?由此你是否能得 出出众数是几?众数是几?图中最高的小长方形的含义是图中最高的小长方形的含义是样本数据落在样本数据落在2,2.5)的最多,)的最多,所以众数一定在所以众数一定在2,2.5)内,)内,因为在因为在2,2.5)内的数据较多,于是通常取该区间的两个端点的平均数作为众数,即众数是2.25 2.25重要结论重要结论1:众数在样本数据的众数在样本数据的频率分布

18、直方图中,频率分布直方图中,就是就是最高矩形的中最高矩形的中点的横坐标点的横坐标 我们已经会用频率分布直方图来求样本的众数。那么如何求中位数?我们已经会用频率分布直方图来求样本的众数。那么如何求中位数?0.52.521.543.534.5频率频率组距组距1如图为如图为 100位居民的月均用水量的样本频率分布直方图:位居民的月均用水量的样本频率分布直方图:思考思考2:根据中位数的定义知道:根据中位数的定义知道:在样本中,有在样本中,有50的个体小于或的个体小于或等于中位数,也有等于中位数,也有50的个体大的个体大于或等于中位数于或等于中位数,由此你是否能由此你是否能求出中位数是几?求出中位数是几

19、?中位数左边的中位数左边的数据个数数据个数与右与右边的边的数据个数数据个数是相等的是相等的中位数左边和右边的直方图中位数左边和右边的直方图的面积应该相等,由此可以估的面积应该相等,由此可以估计中位数的值计中位数的值 0.52.521.543.534.5频率组距10.040.080.150.220.250.140.060.040.02前四个小长方形的面积和前四个小长方形的面积和=0.49后四个小矩形的面积和后四个小矩形的面积和=0.26x=a若令所求的中若令所求的中位数为位数为a,则直线则直线x=a把整个直方图的面把整个直方图的面积平分为二,于是有积平分为二,于是有0.49+(a-2)0.5=0

20、.5得得a=2.022.02重要结论重要结论2:中位数在样本数据的频率分布直方图中,就是把频率分布直方图划分左右中位数在样本数据的频率分布直方图中,就是把频率分布直方图划分左右两个面积相等的分界线与两个面积相等的分界线与x轴交点的横坐标轴交点的横坐标 思考题思考题中位数一定在最高的小长方形内取得吗?中位数一定在最高的小长方形内取得吗?最高的小长方形左右两边的小长方形的面积和分别最高的小长方形左右两边的小长方形的面积和分别都不会达到都不会达到0.5结论:中位数一定在最高的小长方形内取得,结论:中位数一定在最高的小长方形内取得,但是但是不一定是不一定是该区间的两个端点的平均数,即有可能比平均数大,

21、也可能比平均数小 0.52.521.543.534.5频率组距10.040.080.150.220.250.140.060.040.02我们已经会用频率分布直方图来求出了样本的众数和中位数,那么最后如何求平均我们已经会用频率分布直方图来求出了样本的众数和中位数,那么最后如何求平均数?数?思考思考1:在频率分布直方图中:在频率分布直方图中,各个组的平均数如何找?各个组的平均数如何找?在频率分布直方图在频率分布直方图中中,各个组的平均数各个组的平均数用其区间的中点表用其区间的中点表示即区间的两个端示即区间的两个端点之和的一半点之和的一半0.250.751.251.752.252.753.253.7

22、54.25思考思考2:各个小组的平均数与所求的样本的平均:各个小组的平均数与所求的样本的平均数有何关系?即各个小组的平均数对所求样本的数有何关系?即各个小组的平均数对所求样本的平均数的影响是否与其所在的小长方形的平均数的影响是否与其所在的小长方形的面积有关系?面积有关系?若一个小组所在的小长方形的面积愈若一个小组所在的小长方形的面积愈大,则说明该小组的平均数占所求样大,则说明该小组的平均数占所求样本的平均数的比重愈大,所以为了公本的平均数的比重愈大,所以为了公平体现各个小组的平均数在样本平均平体现各个小组的平均数在样本平均数中所占比例的大小,我们把每个数中所占比例的大小,我们把每个小小组的平均

23、数先乘以其所在的小长方形组的平均数先乘以其所在的小长方形的面积,的面积,然后再然后再相加所得到的和相加所得到的和就叫就叫做样本的平均数。做样本的平均数。所求样本的平均数为:所求样本的平均数为:0.250.04+0.080.75+4.250.02=2.02重要结论重要结论3:平均数在平均数在样本数据的频率分布直样本数据的频率分布直方图中,等于频率分布方图中,等于频率分布图中每个小长方形面积图中每个小长方形面积乘以小矩形底边中点的乘以小矩形底边中点的横坐标之和横坐标之和 例.某校从参加高三模拟考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段90,100),100,110),140,

24、150后得到如下部分频率分布直方图.观察图形的信息,回答下列问题:(1)求分数在120,130)内的频率,并补全这个频率分布直方图(2)估计本次考试的平均分、众数、中位数 补全后的直方图如图:0.30.0310频率组距【解析】(1)分数在120,130)内的频率为:1-(0.1+0.15+0.15+0.25+0.05)=1-0.7=0.3中位数为:10(0.01+0.015+0.015)+(x-120)0.03=0.5解得x=123.3平均分为:950.1+1050.15+1150.15+1250.3+1350.25+1450.05=121(2)众数为125根据上图可得这根据上图可得这1001

25、00名学生中体重在名学生中体重在56.5,64.556.5,64.5的学生人数的学生人数是是()()A.20 B.30 C.40 D.50A.20 B.30 C.40 D.501 1为了了解某地区高三学生的身体发育情况,抽查了该地区为了了解某地区高三学生的身体发育情况,抽查了该地区100100名名年龄为年龄为17.517.5岁岁1818岁的男生体重岁的男生体重(kg),(kg),得到频率分布直方图如下:得到频率分布直方图如下:C C0.030.050.07体重体重(kg)频率频率/组距组距54.5 58.5 62.5 66.5 70.5 74.5 24002400 27002700 30003

26、000 33003300 36003600 39003900X X 体重体重y y0.0010.0012 2、观察新生婴儿的体重,其频率分布直方图如图所示,则、观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重新生婴儿体重(2700,3000)(2700,3000)的频率为:的频率为:.0.30.3C用同样的方法我们可以推导出用同样的方法我们可以推导出n n个点的线性回归方个点的线性回归方程的系数:程的系数:niii 1n22ii 1x ynx yxnx牢记公牢记公式式x0 01 12 23 3y1 13 35 57 7D D1.1.已知已知x x,y y之间的一组数据如下表,则之间的一组数据如下表,则y y与与x x的线性的线性回归方程回归方程y=a+bxy=a+bx必经过点必经过点 ()()A.A.(2 2,2 2)B.B.(1.51.5,0 0)C.C.(1 1,2 2)D.D.(1.51.5,4 4)A AA A

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第一章-统计总复习(修改版)课件.ppt)为本站会员(ziliao2023)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|