1、查漏补缺查漏补缺 1、第 p 百分位数的定义 一般地, 一组数据的第 p 百分位数是这样一个值, 它使得这组数据中至少有 p%的数据小于或等于这个 值,且至少有(100p)%的数据大于或等于这个值 2、计算一组 n 个数据的第 p 百分位数的步骤 第 1 步,按从小到大排列原始数据 第 2 步,计算 inp%. 第 3 步,若 i 不是整数,而大于 i 的比邻整数为 j,则第 p 百分位数为第 j 项数据;若 i 是整数,则第 p 百分位数为第 i 项与第(i1)项数据的平均数 【例 1】:从某珍珠公司生产的产品中,任意抽取 12 颗珍珠,得到它们的质量(单位:g)如下: 7.9 ,9.0 ,
2、8.9 ,8.6 ,8.4 ,8.5 ,8.5,8.5,9.9,7.8,8.3,8.0. (1)分别求出这组数据的第 25,75,95 百分位数 (2)请你找出珍珠质量较小的前 15%的珍珠质量 (3)若用第 25,50,95 百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本 的数据,给出该公司珍珠等级的划分标准 学学科科数学数学教师姓名教师姓名教材版本教材版本人教版新教材 学生姓名学生姓名所在年级所在年级上课时间上课时间 课题名称课题名称随机抽样、用样本估计总体随机抽样、用样本估计总体 教学目标教学目标 1、随机抽样、随机抽样 2、用样本估计总体、用样本估计总体 教学
3、重点教学重点 教学难点教学难点 【例 2】 : 一组样本数据的频率分布直方图如图所示, 试估计此样本数据的第 50 百分位数为 【例 3】:某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三 档,月用电量不超过 200 千瓦时的部分按 0.5 元/千瓦时收费,超过 200 千瓦时但不超过 400 千瓦时的部分 按 0.8 元/千瓦时收费,超过 400 千瓦时的部分按 1.0 元/千瓦时收费 (1)求某户居民用电费用 y(单位:元)关于月用电量 x(单位:千瓦时)的函数解析式 (2)为了了解居民的用电情况,通过抽样获得了今年 1 月份 100 户居民每户的用电量,统计
4、分析后得到如图 所示的频率分布直方图若这 100 户居民中,今年 1 月份用电费用不超过 260 元的占 80%,求 a,b 的值 (3)根据(2)中求得的数据计算用电量的 75%分位数 知识梳理 第一部分、随机抽样第一部分、随机抽样 要点一:简单随机抽样要点一:简单随机抽样 1 1、简单随机抽样的概念:、简单随机抽样的概念: 一般地, 从元素个数为 N 的总体中不放回地抽取容量为n的样本, 如果每一次抽取时总体中的各个个体 被抽到的可能性是相同的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫做简单随机样本. 2 2、简单随机抽样的特点:、简单随机抽样的特点: (1)被抽取样本的总体个数
5、 N 是有限的; (2)简单随机样本数 n 小于等于样本总体的个数 N; (3)从总体中逐个进行抽取,使抽样便于在实践中操作; (4)它是不放回抽取,这使其具有广泛应用性; (5)每一次抽样时,每个个体等可能的被抽到,保证了抽样方法的公平性. 3 3、实施抽样的方法:、实施抽样的方法: (1)抽签法: (2)随机数表法: 随机数表(部分) 034743738636964736614698637162 977424676242811457204253323732 167602276656502671073290797853 125685992696966827310503729315 55595
6、6356438548246223162430990 162277943949544354821737932378 844217533157245506887704744767 例: 假设要考察某公司生产的 500 克袋装牛奶的质量是否达标,现从 800 袋牛奶中抽取 60 袋进行检验, 利用随机数表抽取样本时,先将 800 袋牛奶按 000,001,799 进行编号,如果从随机数表第 8 行第 7 列 的数开始向右读,请你依次写出最先检测的 5 袋牛奶的编号_(下面摘取了随机数表第 7 行至第 9 行) 844217533157245506887704744767217633502583921
7、20676 63016378591695556719981050717512867358074439523879 33211234297864560782524207443815510013429966027954 【答案】785,567,199,507,175 要点二:系统抽样要点二:系统抽样 关键词:关键词: 等距、分组、抽几个就分几组等距、分组、抽几个就分几组 1 1、系统抽样的概念:、系统抽样的概念: 当总体中的个体比较多时,将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分中抽 取一个个体,得到所需要的样本,这样的抽样方法称为系统抽样,也称作等距抽样. 2 2、系统抽样的特
8、征:、系统抽样的特征: (1)当总体容量 N 较大时,采用系统抽样; (2)将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽 样; (3)预先制定的规则指的是:在第 1 段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上 分段间隔的整倍数即为抽样编号. 3 3、系统抽样的一般步骤:、系统抽样的一般步骤: (1)采用随机的方法将总体中的 N 个个体编号; (2)将编号按间隔k分段,当 N n 是整数时,取 N k n ,当 N n 不是整数时,从总体中剔除一些个体,使 剩下的总体中个体的个数N能被n整除,这时取 N k n ,并将剩下的总体重新编号;
9、 (3)在第一段用简单随机抽样确定起始个体的编号()l lNlk,; (4)按照一定的规则抽取样本,通常是将编号为2(1)llklklnk,的个体取出. 要点三:分层抽样要点三:分层抽样 关键词:关键词: 按比例抽样按比例抽样 1 1、分层抽样的概念:、分层抽样的概念: 当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,可将总体中各个个 体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单 随机抽样或系统抽样,这种抽样方法叫做分层抽样. 2 2、分层抽样的特点:、分层抽样的特点: (1)适用于总体是由有明显差别的几部分组成时的情况;
10、 (2)分层抽样对各个个体来说被抽取的可能性相同. 3 3、分层抽样的优点:、分层抽样的优点: (1)样本具有较强的代表性; (2)在各层抽样时,可灵活地选用不同的抽样方法. 4 4、分层抽样的步骤:、分层抽样的步骤: (1)将总体按一定的标准分层; (2)计算各层的个体数与总体的个体数的比; (3)按各层个体数占总体的个体数的比确定各层应抽取的样本容量; (4)在每一层进行抽样(各层可以按简单随机抽样或系统抽样的方法抽取) 要点四:三种抽样方法的比较要点四:三种抽样方法的比较 类别简单随机抽样系统抽样分层抽样 共同点 (1)抽样过程中每个个体被抽到的可能性相等 (2)每次抽出个体后不再将它放
11、回,即不放回抽样 各自特点从总体中逐个抽取 将总体均分成几部分按 事先确定的规则在各部 分抽取 将总体分成n层,分层 进行抽取 相互联系/ 在起始部分抽样时采用 简单随机抽样 各层抽样采用简单随机 抽样或系统抽样 适用范围总体中个体数较少总体中个体数较多 总体由差异明显的几部 分组成 第二部分、用样本估计总体第二部分、用样本估计总体 要点一、频率分布直方图要点一、频率分布直方图 1、求各组的频率 2、求(估计)平均数 3、求(估计)中位数 要点二、茎叶图要点二、茎叶图 要点三、众数、中位数与平均数要点三、众数、中位数与平均数 1.1.众数众数 一组数据中出现次数最多的数据叫做众数 2.2.中位
12、数中位数 将一组数据从小到大依次排列,把中间数据(或中间两数据的平均数)叫做中位数.中位数把样本数据分 成了相同数目的两部分. 3.3.平均数平均数 样本数据的算术平均数,即 12 1 () n xxxx n . 要点四、标准差与方差要点四、标准差与方差 1.1.标准差标准差 222 12 1 ()()() n sxxxxxx n 2.2.方差方差 2222 12 1 ()()() n sxxxxxx n 典型例题 一:随机抽样方法的应用 【例 1】:某政府机关有在编人员 100 人,其中副处级以上干部 10 人,一般干部 70 人,干事 20 人, 上级机关为了了解机关人员对政府机构的改革意
13、见,要从中抽取一个容量为 20 的样本,试确定用何种方法 抽取,如何抽取? 【例 2】:某学校有教师 200 人,男学生 1 200 人,女学生 1 000 人现用分层随机抽样的方法从全体 师生中抽取一个容量为 n 的样本,若女学生一共抽取了 80 人,则 n 的值为() A193B192C191D190 二:频率分布直方图及应用 【例 1】: 某花木公司为了调查某种树苗的生长情况,抽取了一个容量为 100 的样本,测得树苗的高 度(cm)数据的分组及相应频数如下: 107,109),3 株;109,111), 9 株;111,113),13 株; 113,115),16 株;115,117)
14、,26 株;117,119),20 株; 119,121),7 株;121,123),4 株;123,125,2 株 (1)据下述图表,估计数据在109,121)范围内的可能性是百分之几? (2)由频率分布直方图估计树苗的高度(cm)的平均数和中位数。 三:根据频率分布直方图求平均数、中位数和众数 【例 1】:某校从高一年级参加期末考试的学生中抽出 60 名,其成绩(均为整数)的频率分布直方图如 图所示,由此估计此次考试成绩的中位数、众数分别是() A73.3, 75B73.3, 80 C70,70D70,75 【例 2】:某校从参加高二年级学业水平测试的学生中抽出 80 名学生,其数学成绩(
15、均为整数)的频率 分布直方图如图所示 (1)求这次测试数学成绩的众数; (2)求这次测试数学成绩的中位数 四:数据的集中趋势和离散程度的估计 【例 1】:甲、乙两机床同时加工直径为 100 cm 的零件,为检验质量,各从中抽取 6 件测量,数据为 甲:9910098100100103 乙:9910010299100100 (1)分别计算两组数据的平均数及方差; (2)根据计算结果判断哪台机床加工零件的质量更稳定 【例 2】:如图,样本 A 和 B 分别取自两个不同的总体,它们的样本平均数分别为 x A和 x B,样本标 准差分别为 sA和 sB,则() A. x A x B,sAsBB. x
16、AsB C. x A x B,sAsBD. x A x B,sAsB 【例 3】:甲、乙两支田径队体检结果为:甲队的体重的平均数为 60 kg,方差为 200,乙队体重的平 均数为 70 kg,方差为 300,又已知甲、乙两队的队员人数之比为 14,那么甲、乙两队全部队员的平均体 重和方差分别是什么? 【例 4】:甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随 机抽取 8 次,记录如下: 甲8281797895889384 乙9295807583809085 (1)求甲成绩的 80%分位数; (2)现要从中选派一人参加数学竞赛,从统计学的角度(在平均数、方差或标
17、准差中选两个)考虑,你认 为选派哪位学生参加合适?请说明理由? 【例 5】:从某项综合能力测试中抽取 100 人的成绩,统计如表,则这 100 人成绩的标准差为() 分数54321 人数2010303010 A.3B.2 10 5 C3D.8 5 同步练习 1某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分 布直方图, 已知图中从左到右的第一、 二、 三、 四、 五小组的频率分别是 0.30,0.40,0.15,0.10 ,0.05. 求:(1)高一参赛学生成绩的众数、中位数; (2)高一参赛学生的平均成绩 2.某学校为了解学校食堂的服务情况,随机调查了 50 名就餐的教师和学生根据这 50 名师生对食堂 服务质量的评分, 绘制出了如图所示的频率分布直方图, 其中样本数据分组为40,50), 50,60), , 90,100 (1)求频率分布直方图中 a 的值; (2)若采用比例分配的分层随机抽样方法从评分在40,60),60,80),80,100的师生中抽取 10 人,则评 分在60,80)内的师生应抽取多少人? (3)学校规定:师生对食堂服务质量的评分不得低于 75 分,否则将进行内部整顿用每组数据的中点 值代替该组数据,试估计该校师生对食堂服务质量评分的平均分,并据此回答食堂是否需要进行内部整顿