1、7.5正态分布第七章随机变量及其分布目录二、知识讲解三、小结四、练习一、上节回溯五、本章知识结构一、上节回溯二项分布与超几何分布超几何分布二项分布n 重伯努利试验伯努利试验二、知识讲解现实中,除了前面已经研究过的离散型随机变量外,还有大量问题中的随机变量不是离散型的,它们的取值往往充满某个区间甚至整个实轴,但取一点的概率为 0,我们称这类随机变量为连续型随机变量(continuous random variable)下面我们看一个具体问题问题自动流水线包装的食盐,每袋标准质量为 400 g由于各种不可控制的因素,任意抽取一袋食盐,它的质量与标准质量之间或多或少会存在一定的误差(实际质量减去标准
2、质量)用 X 表示这种误差,则 X 是一个连续型随机变量检测人员在一次产品检验中,随机抽取了 100 袋食盐,获得误差 X(单位:g)的观测值如下:二、知识讲解0.6 1.4 0.7 3.3 2.9 5.2 1.4 0.1 4.4 0.92.6 3.4 0.7 3.2 1.7 2.9 0.6 1.7 2.9 1.20.5 3.7 2.7 1.1 3.0 2.6 1.9 1.7 2.6 0.42.6 2.0 0.2 1.8 0.7 1.3 0.5 1.3 0.2 2.12.4 1.5 0.4 3.8 0.1 1.5 0.3 1.8 0.0 2.53.5 4.2 1.0 0.2 0.1 0.9 1
3、.1 2.2 0.9 0.64.4 1.1 3.9 1.0 0.6 1.7 0.3 2.4 0.1 1.70.5 0.8 1.7 1.4 4.4 1.2 1.8 3.1 2.1 1.62.2 0.3 4.8 0.8 3.5 2.7 3.8 1.4 3.5 0.92.2 0.7 1.3 1.5 1.5 2.2 1.0 1.3 1.7 0.9二、知识讲解(1)如何描述这 100 个样本误差数据的分布?(2)如何构建适当的概率模型刻画误差 X 的分布?根据已学的统计知识,可用频率分布直方图描述这组误差数据的分布,如图 7.5-1 所示频率分布直方图中每个小矩形的面积表示误差落在相应区间内的频率,所有
4、小矩形的面积之和为 1观察图形可知:误差观测值有正有负,并大致对称地分布在 X0 的两侧,而且小误差比大误差出现得更频繁频率/组距X-60-4-2 00.150.05图 7.5-10.100.20426二、知识讲解随着样本数据量越来越大,让分组越来越多,组距越来越小,由频率的稳定性可知,频率分布直方图的轮廓就越来越稳定,接近一条光滑的钟形曲线,如图 7.5-2 所示频率/组距X-60-4-200.150.05图 7.5-20.100.20426二、知识讲解随着样本数据量越来越大,让分组越来越多,组距越来越小,由频率的稳定性可知,频率分布直方图的轮廓就越来越稳定,接近一条光滑的钟形曲线,如图 7
5、.5-2 所示PX-60-4-200.150.05图 7.5-30.100.20426二、知识讲解二、知识讲解显然,对任意的 xR,f(x)0,它的图象在 x 轴的上方可以证明 x 轴和曲线之间的区域的面积为 1我们称 f(x)为正态密度函数,称它的图象为正态密度曲线,简称正态曲线,如图 7.5-4 所示若随机变量 X 的概率分布密度函数为 f(x),则称随机变量X 服从正态分布(normal distribution),记为 XN(,2)特别地,当 0,1 时,称随机变量 X 服从标准正态分布f(x)x aA图 7.5-4BxbO二、知识讲解若 XN(,2),则如图 7.5-4 所示,X 取
6、值不超过 x 的概率 P(Xx)为图中区域 A 的面积,而 P(aXb)为区域 B 的面积正态分布在概率和统计中占有重要地位,它广泛存在于自然现象、生产和生活实践之中在现实生活中,很多随机变量都服从或近似服从正态分布例如,某些物理量的测量误差,某一地区同年龄人群的身高、体重、肺活量等,一定条件下生长的小麦的株高、穗长、单位面积产量,自动流水线生产的各种产品的质量指标(如零件的尺寸、纤维的纤度、电容器的电容),某地每年 7月的平均气温、平均湿度、降水量等,一般都近似服从正态分布二、知识讲解观察正态曲线及相应的密度函数,你能发现正态曲线的哪些特点?观察二、知识讲解 一个正态分布由参数 和 完全确定
7、,这两个参数对正态曲线的形状有何影响?它们反映正态分布的哪些特征?思考我们知道,函数 yf(x-)的图象可由 yf(x)的图象平移得到因此,在参数 取固定值时,正态曲线的位置由 确定,且随着 的变化而沿 x 轴平移,如图 7.5-5 所示0.4x-3=12-1图 7.5-5-213O=-1=0y=1二、知识讲解0.4x-3=0.52-1图 7.5-6-213O=2=0y=10.8二、知识讲解观察图 7.5-5 和图 7.5-6 可以发现,参数 反映了正态分布的集中位置,反映了随机变量的分布相对于均值 的离散程度实际上,我们有若 XN(,2),则 E(X),D(X)2二、知识讲解例李明上学有时坐
8、公交车,有时骑自行车他各记录了 50 次坐公交车和骑自行车所花的时间,经数据分析得到:坐公交车平均用时 30 min,样本方差为36;骑自行车平均用时 34 min,样本方差为 4假设坐公交车用时 X 和骑自行车用时 Y 都服从正态分布(1)估计 X,Y 的分布中的参数;(2)根据(1)中的估计结果,利用信息技术工具画出 X 与 Y 的分布密度曲线;(3)如果某天有 38 min 可用,李明应选择哪种交通工具?如果某天只有 34 min 可用,又应该选择哪种交通工具?请说明理由二、知识讲解分析:对于第(1)问,正态分布由参数 和 完全确定,根据正态分布参数的意义,可以分别用样本均值和样本标准差
9、来估计对于第(3)问,这是一个概率决策问题,首先要明确决策的准则,在给定的时间内选择不迟到概率大的交通工具;然后结合图形,根据概率的表示,比较概率的大小,作出判断三、小结正态密度函数正态密度曲线连续型随机变量正态曲线正态分布标准正态分布1设随机变量 XN(0,1),则 X 的密度函数为_,P(X0)=_,P(|X|1)=_,P(X1)=_,P(X1)=_(精确到 0.0001)四、练习2举出两个服从正态分布的随机变量的例子答案:答案不唯一,(1)某地区 16 岁男孩的身高分布可以近似看成服从正态分布;(2)某厂生产的某种型号的灯泡的使用寿命的分布可以近似看成服从正态分布四、练习3对某地区数学考
10、试成绩的数据分析,男生成绩 X 服从正态分布 N(72,82),女生成绩 Y 服从正态分布 N(74,62)请你从不同角度比较男生、女生的考试成绩答案:女生的平均成绩高于男生的平均成绩;男生的成绩比较分散,女生的成绩比较集中四、练习4某市高二年级男生的身高 X(单位:cm)近似服从正态分布 N(170,52),随机选择一名本市高二年级的男生,求下列事件的概率:(1)165175答案:(1)0.6827;(2)0.15865;(3)0.158655若 XN(,2),则 X 位于区域,+内的概率是多少?答案:0.34135五、本章知识结构加法公式乘法公式条件概率全概率公式,贝叶斯公式随机变量离散型随机变量连续型随机变量分布列均值和方差二项分布超几何分布正态分布正态密度曲线3 原则