1、第六章第六章 两种常用的概率分布两种常用的概率分布第一节第一节 概率概率第二节第二节 二项分布二项分布第三节第三节 正态分布正态分布第一节第一节?一、事件及其概率一、事件及其概率?(一)随机事件(一)随机事件概率概率概率论:概率论:是从量的方面研究随机现象的统是从量的方面研究随机现象的统计规律的科学。计规律的科学。?随机现象:随机现象:是指在相同条件下反复进行观是指在相同条件下反复进行观察或实验,其结果无法事先预定的现象。察或实验,其结果无法事先预定的现象。?如:掷硬币,其结果有两个,正面或反面。如:掷硬币,其结果有两个,正面或反面。在随机现象中出现的各种可能结果,称为在随机现象中出现的各种可
2、能结果,称为随随机事件,简称事件机事件,简称事件。?在每次试验中一定发生的事件,在每次试验中一定发生的事件,称为必然事称为必然事件件;而一定不会发生的事件,;而一定不会发生的事件,称为不可能事称为不可能事件件。如纯水在标准大气压下零度结冰等。如纯水在标准大气压下零度结冰等。?(二)事件的概率(二)事件的概率(事件发生的概率与频率有关)事件发生的概率与频率有关)?1、频率:、频率:对于随机事件对于随机事件A,如果在,如果在N次试次试验中出现验中出现a次,则次,则A发生的频率记作发生的频率记作F?A?aN(6.1)频率满足不等式频率满足不等式0F(A)1。若。若A是是必然必然事件,则事件,则F(A
3、)=1,若,若A是是不可能事件不可能事件,则,则F(A)=0。2、经(后)验概率(或统计概率)、经(后)验概率(或统计概率)计数某事件在一系列试验中发生的次数,然后计数某事件在一系列试验中发生的次数,然后计算发生次数与试验总次数的比值得到频率。试验计算发生次数与试验总次数的比值得到频率。试验次数越多,某事件发生的频率会在某个常数上下波次数越多,某事件发生的频率会在某个常数上下波动。当试验次数无穷时该事件发生的频率会与一常动。当试验次数无穷时该事件发生的频率会与一常数相等,把这一常数称为某事件的数相等,把这一常数称为某事件的 概率概率。(统计定。(统计定义)义)?3、先验(古典)概率、先验(古典
4、)概率?试验满足:试验满足:试验中各种可能结果(基本事件)试验中各种可能结果(基本事件)是是有限有限的,并且每种结果发生的的,并且每种结果发生的 可能性是不变可能性是不变(相等)(相等)时,则某事件发生的概率等于该事件包时,则某事件发生的概率等于该事件包含的基本事件数(含的基本事件数(K)除以试验中可能发生的基本)除以试验中可能发生的基本事件总件数(事件总件数(N)之商。)之商。P?A?KN6.2?经验概率经验概率是由计算事件发生的是由计算事件发生的 频率频率而得,而得,先验概先验概率率是在实践之前利用有关事实是在实践之前利用有关事实 确定确定的。前者给出了的。前者给出了概率的概率的操作性定义
5、操作性定义,后者提供了概率的,后者提供了概率的 理论上的基理论上的基本定义本定义。4、概率的性质(公理系统)、概率的性质(公理系统)(1)对任一事件)对任一事件A,有有0P(A)1。(2)不可能事件不可能事件的概率等于的概率等于零零。(3)必然事件必然事件的概率等于的概率等于1。5、小概率事件、小概率事件在统计推断中,将一次试验中发生的在统计推断中,将一次试验中发生的 概率小概率小于于0.05的事件,称为的事件,称为小概率事件小概率事件。认为它是一次。认为它是一次试验中同乎不可能发生的事件。试验中同乎不可能发生的事件。二、概率的两个基本法则二、概率的两个基本法则(一)概率的加法法则(一)概率的
6、加法法则两个互不相容(或互斥)事件两个互不相容(或互斥)事件 A、B之和的概率之和的概率等于两个事件分别发生的概率,即等于两个事件分别发生的概率,即P(A?B)?P?A?P?B?(6.3a)P(A1?A2?An)?P?A1?P?A2?P?An?(6.3b)在一次试验中在一次试验中不可能同时出现不可能同时出现的事件称为的事件称为互不相容事件互不相容事件。例例1 在在9道题中,有道题中,有6道选择题,道选择题,2道是非题,道是非题,1道填道填空题,随机抽出一题,求抽出的为是非或选择题的空题,随机抽出一题,求抽出的为是非或选择题的概率是多少?概率是多少??解:高抽出是非题为事件解:高抽出是非题为事件
7、 A,抽出选择题为事件,抽出选择题为事件 B,随机抽一题,只能是抽取三类题中的一题,所以随机抽一题,只能是抽取三类题中的一题,所以 A,B为互不相容事件为互不相容事件。“抽出的为是非或选择题抽出的为是非或选择题”意思意思是无论抽得两种题中的哪一种都表示该事件发生了,是无论抽得两种题中的哪一种都表示该事件发生了,因此是求两个事件之和的概率因此是求两个事件之和的概率 P(A+B)。)。?P(A)=2/9,P(B)=6/9?所以所以P(A+B)=P(A)+P(B)=8/9(二)概率的乘法法则(二)概率的乘法法则两个相互独立事件两个相互独立事件A、B之积的概率等于两个事件分之积的概率等于两个事件分别发
8、生的概率的积,即别发生的概率的积,即P(A?B)?P?A?P?B?(6.4a)P(A1?A2?An)?P?A1?P?A2?P?An?(6.4b)两个相互独立事件两个相互独立事件就是指一个事件发生的概率与另就是指一个事件发生的概率与另一个事件的发生一个事件的发生无关无关,两个事件的,两个事件的积积就是指就是指两个事两个事件同时发生件同时发生的事件。的事件。例例2 两道四选一题,凭猜测做对一题的概率是多少?两道四选一题,凭猜测做对一题的概率是多少??解:设第一题做对为事件解:设第一题做对为事件 A,做错为事件,做错为事件A,第二,第二题做对为事件题做对为事件B,做错为事件,做错为事件B,做对第一题
9、的概,做对第一题的概率为率为P(A B),做对第二题的概率为),做对第二题的概率为 P(AB),),所以做对任意一题的概率为所以做对任意一题的概率为P(A B)+P(AB)=P(A)P(B)+P(A)P(B)=1/4*3/4+3/4*1/4=3/8(三)概率分布类型(三)概率分布类型?概率分布概率分布(probability distribution)是指对随机变量是指对随机变量取不同值取不同值时的概率的描时的概率的描述,一般用述,一般用概率分布函数概率分布函数进行描述。进行描述。?依不同的标准,对概率分布可作不同的依不同的标准,对概率分布可作不同的分类。分类。、离散型分布与连续型分布、离散型
10、分布与连续型分布?依随机变量的类型,可将概率依随机变量的类型,可将概率分布分为分布分为离散型概率分布离散型概率分布与与连连续型概率分布续型概率分布。教育统计学中。教育统计学中最常用的最常用的离散型分布离散型分布是是二项分二项分布,最常用的布,最常用的连续型分布连续型分布是是正正态分布态分布。、经验分布与理论分布、经验分布与理论分布?依分布函数的来源,可将概率分布分为依分布函数的来源,可将概率分布分为经验分布经验分布与与理论分布理论分布。?经验分布经验分布(empirical distribution)是指)是指根据根据观察或实验观察或实验所获得的所获得的数据数据而编制的而编制的次数分布次数分布
11、或或相对频率分布相对频率分布。?理论分布理论分布(theoretical distribution)是按)是按某种数学模型某种数学模型计算出的计算出的概率分布概率分布。、基本随机变量分布与抽样分布、基本随机变量分布与抽样分布?依所描述的数据的依所描述的数据的样本特性样本特性,可将概,可将概率分布分为率分布分为基本随机变量分布基本随机变量分布与与抽样抽样分布分布(sampling distribution)。)。?基本随机变量分布基本随机变量分布是随机变量是随机变量各种不各种不同取值情况同取值情况的的概率分布概率分布,抽样分布抽样分布是是从同一总体内从同一总体内抽取的抽取的不同样本不同样本的的统
12、计统计量量的的概率分布概率分布。第二节第二节二项分布二项分布?二项分布二项分布(bionimal distribution)是一种具有)是一种具有广泛用途的广泛用途的离散型随机变量离散型随机变量的的概率分布,概率分布,它是由它是由贝努里创始的,因此又称为贝努里创始的,因此又称为 贝努里分布。贝努里分布。一、二项分布模型一、二项分布模型(一)二项分布的概念(一)二项分布的概念所谓分布的指所谓分布的指随机变量随机变量的的概率分布概率分布。如果一次试验中只会发生如果一次试验中只会发生两种两种结果,非结果,非A即即B,A和和B就是就是对立事件对立事件。发生。发生A和和B的概率的概率分别为分别为p和和q
13、,显然,显然P(A)+P(B)=p+q=1。而且而且 重复多次重复多次试验时,各次试验结果之间互试验时,各次试验结果之间互不影响,各次试验结果之间是不影响,各次试验结果之间是相互独立事件相互独立事件,则在则在n次试验中,次试验中,A事件可能出现的次数事件可能出现的次数k(k=0,1,n)是随机的,也就是有是随机的,也就是有n+1个概率个概率值。值。A事件出现各种可能结果这一随机变量事件出现各种可能结果这一随机变量的概率分布的概率分布就叫就叫二项分布二项分布。二项分布中。二项分布中A事事件出现的件出现的k次的概率与二项展开式的各项相对次的概率与二项展开式的各项相对应。应。1 1二项试验二项试验满
14、足以下条件的试验称为满足以下条件的试验称为二项试验二项试验:?一次试验只有一次试验只有两种两种可能的可能的结果结果,即成功和失败;,即成功和失败;?各次试验相互各次试验相互独立独立,即各次试验之间互不影响;,即各次试验之间互不影响;?各次试验中各次试验中成功成功的概率相等,的概率相等,失败失败的概率也的概率也相相等等。2 2二项分布函数二项分布函数?二项分布二项分布是一种是一种离散型随机变量离散型随机变量的概的概率分布。率分布。?用用n 次方的二项展开式次方的二项展开式来表达在来表达在n 次次二项试验中成功事件出现的不同次数二项试验中成功事件出现的不同次数(X0,1)的概率分布,叫做)的概率分
15、布,叫做二二项分布函数。项分布函数。二项式定理:二项式定理:?A?B?n?C A B?Cnnn0n?1nAn?1B?.?C A B1knkn?k?.?C A B(6.5)0n0n二项分布中二项分布中A事件出现事件出现k次的概率与上式中各项对次的概率与上式中各项对应,通式为应,通式为P?k?C p qknknknkn?k(6.6)其中C为n次试验中A事件出现次数为k时的组合数,n!C?。公式(6.5)叫二项分布函数。k!(n?k)!二项展开式的要点:?项数:项数:二项展开式中共有二项展开式中共有n1项。项。方次:方次:p的方次,从的方次,从n0为为降幂降幂;q的方的方次从次从0n为为升幂升幂。每
16、项。每项p与与q方次之和等于方次之和等于n。?系数:系数:各项系数是成功事件次数的各项系数是成功事件次数的组合数组合数。例例3 凭猜测做五道是非题,答对的概率凭猜测做五道是非题,答对的概率 p=1/2,答答错的概率错的概率q=1/2,问五题中答对,问五题中答对k(k=0,1,2,3,4,5)题的题的概率各是多少?概率各是多少?解:根据二项式定理解:根据二项式定理?p?q?5?C p q?C p q?C p q?C p q?C p q?C p q555045413532252315140505答对答对5题的题的概率概率1/32答对答对4题的题的概率概率5/32答对答对3题的题的概率概率10/32
17、答对答对2题的题的概率概率10/32答对答对1题的题的概率概率5/32答对答对0题的题的概率概率1/32?5题中答对各种可能结果的题中答对各种可能结果的概率之和为概率之和为1。所。所以在二项分布中,以在二项分布中,n+1项的概率之和为项的概率之和为1。若。若p=q,则概率分布呈则概率分布呈对称性对称性,与两端等距的项,与两端等距的项的的概率相等概率相等。若若pq,n较小时,概率分布不较小时,概率分布不对称,当对称,当n较大时(大于等于较大时(大于等于30或或50),概),概率分布逐步对称。率分布逐步对称。二项分布的性质二项分布的性质?从概率直方图可以看到,二项分布有如从概率直方图可以看到,二项
18、分布有如下性质:下性质:?当当p=q时,图形是时,图形是对称对称的。的。?当当pq时,直方图呈时,直方图呈偏态偏态。pq与与pq时的时的偏斜方向相反偏斜方向相反。(二)二项分布的平均数与标准差(二)二项分布的平均数与标准差二项分布的二项分布的平均数平均数:随机变量随机变量k算术平均数,算术平均数,以以k 为原始数据,以概率为原始数据,以概率p为权数的加权算术为权数的加权算术平均数)平均数)?np(6.7)二项分布的二项分布的标准差标准差:随机变量:随机变量k的标准差的标准差?npq(6.8)二、二项分布的应用二、二项分布的应用?二项分布函数除了用来求成二项分布函数除了用来求成功事件恰好出现功事
19、件恰好出现X次的概率次的概率之外,在教育中主要用来之外,在教育中主要用来判判断试验结果的机遇性与真实断试验结果的机遇性与真实性的界限。性的界限。二、二项分布的应用二、二项分布的应用例例4 某个学生一次测验回答某个学生一次测验回答 20道是非题,每题道是非题,每题1分,他分,他得了得了18分,问(分,问(1)凭猜测得)凭猜测得18分的概率是多少?(分的概率是多少?(2)他的成绩若在他的成绩若在18分以上,是否是凭猜测得到的?分以上,是否是凭猜测得到的?解:(解:(1)p=0.5,q=0.5,n=20,k=18,代入公式(代入公式(6.6)得)得P?18?Cp q?190?0.5?0.5?0.00
20、0181即凭猜测得即凭猜测得18分的可能性只有十万分之十八。分的可能性只有十万分之十八。1820182182(2)依题意应首)依题意应首先求该学生得先求该学生得18分,分,19分、分、20分分三种分数的概率之和是多少三种分数的概率之和是多少,然后从这个概率的大,然后从这个概率的大小小判断他是否是凭猜测得到这个分数判断他是否是凭猜测得到这个分数。同样同样P(19)=0.000019P(20)=0.000000095三者之和为三者之和为0.000201,即凭猜测得即凭猜测得18分以上分以上的概率只有万分之二,可以断定,他得的概率只有万分之二,可以断定,他得 18分以上分以上不是凭猜测得到的。不是凭
21、猜测得到的。第三节第三节正态分布正态分布?正态分布(正态分布(normal distribution)也称为)也称为常常态分布态分布,是,是连续型随机变量概率分布连续型随机变量概率分布的一种,的一种,是在数理统计的理论与实际应用中占有最重是在数理统计的理论与实际应用中占有最重要地位的一种理论分布。要地位的一种理论分布。?正态分布由正态分布由棣莫弗于棣莫弗于1733年发现的。拉年发现的。拉普拉斯、高斯对正态分布的研究也做出了贡普拉斯、高斯对正态分布的研究也做出了贡献,故有时称献,故有时称正态分布正态分布为为高斯分布高斯分布。第三节第三节一、正态分布的模型一、正态分布的模型(一)正态分布的概念(一
22、)正态分布的概念正态分布是指在一个正态分布是指在一个正态分布正态分布概率分布概率分布中,中,中间频数多,中间频数多,两端频数相对称地减少两端频数相对称地减少,形成一种形成一种“钟钟”形对称的形对称的理论概率分布理论概率分布。图图6-1 正态分布正态分布在二项分布中,当p=q,当均数np=5,n=10时,二项分布可看作正态分布的近似形。图图6-2 平均数、标准差相同的二项分布直条图和正态分布图平均数、标准差相同的二项分布直条图和正态分布图(二)正态分布曲线(二)正态分布曲线图图6-1为正态分布曲线,其方程为为正态分布曲线,其方程为Y?12?e?X?2?22(6.9)其中,其中,Y为正态分布曲线的
23、高度为正态分布曲线的高度,表示随机变量的,表示随机变量的概率的大小或观测值出现的相对次数概率的大小或观测值出现的相对次数,X为观测值为观测值,即即随机变量的可能取值随机变量的可能取值;、分别为分别为X X的的平均数平均数和和标标准差准差,e=2.71828,e=2.71828,=3.1416=3.1416。从式从式6.9可看出,可看出,Y的值与的值与离差离差|X-|的绝对值的绝对值有关,它是有关,它是以以X=这一点的纵线为对称轴的轴对称图形。它的位置这一点的纵线为对称轴的轴对称图形。它的位置和形状由和形状由平均数平均数和标准差和标准差决定决定。在同一直角坐标系。在同一直角坐标系中,中,平均数的
24、大小平均数的大小决定决定图形的位置左移或右移图形的位置左移或右移,当,当较小较小时,图形向左移;当时,图形向左移;当较大时,图形向右移较大时,图形向右移。见图。见图6-36-3(a)a)=0=1=1图图6-3(a)=5=1=1标准差的大小标准差的大小决定决定图形的陡峭平缓程度图形的陡峭平缓程度,即决定,即决定纵线高度的最纵线高度的最大值大值。当。当标准差较大标准差较大时,概率分布的时,概率分布的离中趋势较大离中趋势较大,观测值分,观测值分散在散在较大范围内较大范围内,纵线高度的,纵线高度的最大值较小最大值较小,正态分布曲线,正态分布曲线形状形状较平缓较平缓;当;当标准差较小标准差较小时,概率分
25、布的时,概率分布的离中趋势较小离中趋势较小,观测值,观测值分散在分散在较小范围内较小范围内,纵线高度的,纵线高度的最大值较大最大值较大,正态分布曲线,正态分布曲线形形状较陡峭状较陡峭。如图。如图6-3(b)=0.5=1=1.6图图6-3(b)在无数条正态分布曲线中在无数条正态分布曲线中有一条曲线有一条曲线=0,=1=1,这条曲线称为,这条曲线称为标准正态曲线标准正态曲线,见图见图6-36-3(a a)中左侧的一条曲线。其方程)中左侧的一条曲线。其方程简化为简化为Y?12?e12?Z2(6.10)?以为横坐标,以为纵以为横坐标,以为纵坐标,可绘制标准正态分坐标,可绘制标准正态分布曲线。布曲线。?
26、标准正态分布曲线的标准正态分布曲线的纵线纵线高度为概率密度高度为概率密度,曲线曲线下的面积为概率下的面积为概率。二、标准正态分布曲线的特点二、标准正态分布曲线的特点1、曲线、曲线最高点最高点为为Z=0,Y=0.3989,曲,曲线下的线下的总面积即概率总和为总面积即概率总和为1,对称轴左右,对称轴左右各各0.5。2、曲线是以过、曲线是以过Z=0的纵线的纵线为为对称轴对称轴呈呈钟钟形的形的轴对称图形轴对称图形。3、标准正态分布的、标准正态分布的平均数、中数、众平均数、中数、众数数三点重合在三点重合在Z=0这一点上。这一点上。4、曲线与对称轴交点处曲线与对称轴交点处Y值最大值最大,即此处,即此处观观
27、测值的相对次数最大,概率最大测值的相对次数最大,概率最大;曲线向两侧;曲线向两侧先先快后慢快后慢地下降,在地下降,在Z=1处有处有两个拐点两个拐点;横轴是;横轴是标准正态曲线的水平渐近线标准正态曲线的水平渐近线,曲线向两侧,曲线向两侧逐渐接逐渐接近近横轴,横轴,但永不相交但永不相交。5、标准正态分布曲线的、标准正态分布曲线的平均数平均数为,为,标准差标准差为。从为。从3至至3之间几乎分布着全部之间几乎分布着全部数据。数据。6、曲线的、曲线的拐点拐点为正负一个标准差处。为正负一个标准差处。三、正态分布表三、正态分布表1标准正态分布表?利用积分公式可求出正态曲线下任何区利用积分公式可求出正态曲线下
28、任何区间的面积,但需要计算,非常麻烦。间的面积,但需要计算,非常麻烦。?统计学家已编制好了标准正态分布表,统计学家已编制好了标准正态分布表,使其使用非常方便。使其使用非常方便。正态分布表的特点:?表中仅列有标准正态曲线下的面积,表中仅列有标准正态曲线下的面积,因此,查表前应先将原始变量转因此,查表前应先将原始变量转换为。换为。X?XZ?S?表中列出的数据,是从到右边某表中列出的数据,是从到右边某一值之间的面积,查表时应注意合理一值之间的面积,查表时应注意合理使用。使用。三、正态分布表三、正态分布表?(一)正态分布表的结构(一)正态分布表的结构(P240)?它是通过它是通过公式(公式(6.10)
29、计算得到的。计算得到的。表中第一列给出了从表中第一列给出了从0到到3.99的的Z值,第二值,第二列给出了与列给出了与Z对应的过点对应的过点Z的纵线的高度的纵线的高度Y值,值,第三列给出了曲线下面积第三列给出了曲线下面积P值是过值是过Z=0的纵的纵线与过表中某线与过表中某Z点人纵线所夹图形的面积比点人纵线所夹图形的面积比率,即相应区间的随机变量的概率。率,即相应区间的随机变量的概率。(二)正态分布表的使用(二)正态分布表的使用?已知已知Z值值查出对应的查出对应的P值值和和Y值值;已知;已知P值值查出查出对应的对应的Z值值和和Y值值。1、已知、已知Z值值,求,求P值值。求求0至某一值之间的概率:直
30、接查表至某一值之间的概率:直接查表求两个值之间的概率求两个值之间的概率?两值符号相同:两值符号相同:PZ1Z2PZ2PZ1?两值符号相反:两值符号相反:PZ1Z2PZ2PZ1求某一求某一Z值以上的概率值以上的概率?Z0时,时,PZ0.5PZ?Z0时,时,PZ0.5PZ求某一求某一Z值以下的概率值以下的概率?Z0时,时,PZ0.5PZ?Z0时,时,PZ0.5PZ例例5 在正态分布表中:在正态分布表中:(1)求)求Z=-1与与Z=1之之间的间的面积比率面积比率。解:查表,当解:查表,当Z=1时,时,P1=0.34134,由它的由它的对称对称性性,当,当Z=-1时,时,P2=0.34134,所以所求
31、的面积,所以所求的面积比率为:比率为:P1+P2=0.68268。(2)求)求 Z=-2.58与与Z=2.58之间的之间的面积比率面积比率。解:查表,当解:查表,当Z=2.58时,时,P1=0.49506,由它的由它的对称性,当对称性,当Z=-2.58时,时,P2=0.49506,所以所,所以所求的面积比率为:求的面积比率为:P1+P2=0.99012例例6 利用正态分布表求:利用正态分布表求:(1)正态曲线下)正态曲线下Z=1.34处处左左侧的面积。侧的面积。(2)正态曲线下正态曲线下Z=2.16处处右右侧的面积。侧的面积。(3)正态曲线下)正态曲线下Z=-1.64处处左左侧的面积。侧的面积
32、。(4)正态曲线下)正态曲线下Z=-1.5处处右右侧的面积。侧的面积。解:(解:(1)查表得,)查表得,Z=1.34,P=0.40988,由于由于正态曲线对称轴正态曲线对称轴左左侧的面积为侧的面积为0.5,所以所求面所以所求面积为积为:0.5+0.40988=0.90988.(2)z=2.16,p=0.48461,由于对称轴由于对称轴右右侧的面侧的面积为积为0.5,故所求面积为故所求面积为:0.5-0.48461=0.01539.(3)查表得查表得,Z=1.64时时,P=0.44950,所以所以Z=-1.64时时,P=0.44950,即它与即它与Z=0所夹面积为所夹面积为P=0.44950,故
33、所求面积为故所求面积为:0.5-P=0.0505.(4)当当Z=1.5时时,P=0.43319,所以当所以当Z=-1.5时时,P=0.43319,故所求面积为故所求面积为:0.5+P=0.93319.2、已知、已知面积(概率)面积(概率)P值,求值,求Z值。值。求求Z0以上或以下某一面积对应的以上或以下某一面积对应的Z值:值:直接查表直接查表?求与正态曲线上端或下端某一面积求与正态曲线上端或下端某一面积P相相对应的对应的Z值:先用值:先用0.5PZ,再查表,再查表?求与正态曲线下中央部位某一面积相对求与正态曲线下中央部位某一面积相对应的应的Z值:先计算值:先计算P2,再查表,再查表?3、已知概
34、率或Z值,求概率密度Y?直接查正态分布表就能得到相应的概直接查正态分布表就能得到相应的概率密度值。率密度值。?如果由概率求值,要注意区分已如果由概率求值,要注意区分已知概率是位于正态曲线的中间部分,知概率是位于正态曲线的中间部分,还是两尾端部分,才能通过查表求得还是两尾端部分,才能通过查表求得正确的概率密度。正确的概率密度。?例例7 利用正态分布表,求:利用正态分布表,求:?(1)求)求中央中央50%的面积操作的的面积操作的下限下限Z值值和和上限上限Z值值。?(2)求正态曲线)求正态曲线下右尾下右尾20%的面积的的面积的下限下限Z值值。?(3)求正态曲线)求正态曲线下左侧下左侧30%的面积的的
35、面积的上限上限Z值。值。解:(解:(1)由于正态曲线的)由于正态曲线的对称性对称性,中央中央50%的面积的面积为为对称轴左右两侧各对称轴左右两侧各25%的面的面积的和积的和。所以。所以P=0.25,查附表,表中,查附表,表中没有没有恰等于恰等于0.25的的P值值,可以,可以用误差最小的近用误差最小的近似值似值0.24857作为作为P的近似值的近似值,对应的,对应的Z=0.67,故,故Z的下限为的下限为-0.67,Z的上限为的上限为0.67。(2)所要求的)所要求的Z值是表中值是表中P=0.5-0.2=0.3处对处对应的应的Z值,取值,取最近似的值最近似的值P=0.29955,其对应,其对应的的
36、Z值为值为0.84,故所求的,故所求的下限下限Z值为值为0.84。(3)对称轴与过)对称轴与过Z值点纵线所夹面积为值点纵线所夹面积为P=0.5-0.3=0.2,表中,表中最近的最近的P值为值为0.19847,其对应的其对应的Z=0.52,它的对称点为,它的对称点为Z=-0.52,故,故正态曲线正态曲线下左侧下左侧30%的面积的的面积的上限上限Z值值为为0.52正态分布正态分布在测验记分方面的应用在测验记分方面的应用1以标准分数表示考试成绩?比较学生的考试成绩时,使用原始分比较学生的考试成绩时,使用原始分数有其不合理之处:数有其不合理之处:?原始分制度没有提示考生成绩原始分制度没有提示考生成绩在
37、考生团体成绩中的位置。在考生团体成绩中的位置。?由于各科命题难度不同,导致由于各科命题难度不同,导致各科原始分之间不能直接比较,造各科原始分之间不能直接比较,造成分数解释上的困难。成分数解释上的困难。?各科原始分相加不合理。各科原始分相加不合理。采用标准分数,有如下特点:采用标准分数,有如下特点:标准分的大小,既表明考生水平的高低,也表明标准分的大小,既表明考生水平的高低,也表明该生在考生团体中的位置的高低。该生在考生团体中的位置的高低。各科标准分都表示考生各科在同一团体中的位置,各科标准分都表示考生各科在同一团体中的位置,可根据标准分大小直接比较考生的各科成绩水平。可根据标准分大小直接比较考
38、生的各科成绩水平。各科标准分的参照点(平均分为各科标准分的参照点(平均分为 500分)和单位分)和单位(1个标准差为个标准差为100分)都一样,具有可加性分)都一样,具有可加性,克服了克服了原始分的缺陷。原始分的缺陷。?目前我国一些省在高考中采用标准目前我国一些省在高考中采用标准分数表示考生的成绩,为了使分数分数表示考生的成绩,为了使分数更适合一般习惯,对标准分数进一更适合一般习惯,对标准分数进一步做转换:步做转换:T?500?100 Z2确定等级评定的人数?如要将某种能力的分数分成等距的如要将某种能力的分数分成等距的几个等级,在确定各等级人数时,几个等级,在确定各等级人数时,可将正态分布基线
39、上可将正态分布基线上Z3至至Z3之间之间6个标准差的距离分成相等的个标准差的距离分成相等的几份,然后查表求出各段几份,然后查表求出各段Z值之间的值之间的面积,再乘以总人数,即为各等级面积,再乘以总人数,即为各等级人数。人数。3品质评定数量化在(心理与)教育研究中在(心理与)教育研究中,常常遇到等级常常遇到等级评定的结果。但是不同评定者的评定评定的结果。但是不同评定者的评定结果往往不一致,无法综合他们的评结果往往不一致,无法综合他们的评定结果,而且等级分数不是等距数据,定结果,而且等级分数不是等距数据,不同事物的评定结果不能直接比较。不同事物的评定结果不能直接比较。将品质评定的结果转化为数量结果
40、,将品质评定的结果转化为数量结果,就可解决这些问题。就可解决这些问题。具体方法?根据各等级被评者的数目求各等级的人数比根据各等级被评者的数目求各等级的人数比率;率;?求各等级比率值的中间值;求各等级比率值的中间值;?求各等级中点以上(或以下)的累积比率;求各等级中点以上(或以下)的累积比率;?用累积比率查正态分布表;用累积比率查正态分布表;?求被评者所得评定等级的数量化值的平均值。求被评者所得评定等级的数量化值的平均值。四、正态曲线下面积的应用四、正态曲线下面积的应用?(一)推求考试成绩中特定区间的人数(一)推求考试成绩中特定区间的人数?例例8 已知某年级已知某年级200名学生考试成绩呈正态分
41、名学生考试成绩呈正态分布,平均分为布,平均分为85分,标准差为分,标准差为10分,学生甲的分,学生甲的成绩为成绩为70分,问全年级成绩比学生甲低的学生人分,问全年级成绩比学生甲低的学生人数是多少?数是多少??解:属于已知解:属于已知Z值求值求P值问题。值问题。一般分一般分3步完成:步完成:a)计算甲生成绩的计算甲生成绩的标准分数标准分数;b)根据根据Z值查表求得值查表求得对称轴与过对称轴与过Z值纵线所夹值纵线所夹的面积的面积;再计算出;再计算出Z值左侧的曲线面积值左侧的曲线面积;c)将将面积比率乘以总人数面积比率乘以总人数,即可得,即可得比甲生分比甲生分数低数低的学生的实际人数。的学生的实际人
42、数。Z解:甲的解:甲的标准分数标准分数:/10=-1.5?X?X?=(70-85)查表,查表,Z=1.5时,时,P=0.43319,故故Z=-1.5左侧左侧的面积为:的面积为:0.5-0.43319=0.06681。200*0.06681=13(人),所以全年级成绩(人),所以全年级成绩比学生甲低的学生人数是比学生甲低的学生人数是13人。人。例例9 某次升学考试,学生成绩符合正态分布,某次升学考试,学生成绩符合正态分布,1000名考生英语平均名考生英语平均60分,标准差分,标准差15分,试求:(分,试求:(1)70-80分之间有多少人?(分之间有多少人?(2)90分以上有多少人?分以上有多少人
43、?解:已知学生的分数,求某分数区间的实际人数。解:已知学生的分数,求某分数区间的实际人数。属于属于Z-P问题问题。X?X(1)Z1=(70-60)/15=0.67?Z2=(80-60)/15=1.33X?X根据根据Z1,Z1查表,得查表,得P1=0.24857,P2=0.40824,P=P2-P1=0.15967,即分数在,即分数在70-80之间的人数占总人数的之间的人数占总人数的 15.967%,即,即1000*0.15967=160 人。人。(2)Z3=(90-60)/15=2?查表得查表得P=0.47725,90分以上人数比率为:分以上人数比率为:X?X0.5-0.47725=0.022
44、75。1000*0.02275=23(人)。人)。(二)推求考试成绩中某一特定人数比率的分数界限(二)推求考试成绩中某一特定人数比率的分数界限例例10 某次招生考试,学生成绩符号正态分布,学生成某次招生考试,学生成绩符号正态分布,学生成绩的平均分为绩的平均分为80分,标准差为分,标准差为10分,要择优录取分,要择优录取25%学学生进入高一级学校学习,问最低分数线是多少分?生进入高一级学校学习,问最低分数线是多少分?解:它属于解:它属于P-Z问题。根据问题。根据录取率录取率可可算出曲线下对应算出曲线下对应的面积的面积,查正态分布表查正态分布表,可得,可得录取分数线对应的录取分数线对应的 Z值值,
45、再根据再根据平均分,标准差平均分,标准差,算出录取分数线的,算出录取分数线的 原始分数原始分数X值值。由于由于录取率为录取率为25%,则正态曲线下对称轴与过最低录取,则正态曲线下对称轴与过最低录取线分数的纵线所夹面积为线分数的纵线所夹面积为 0.5-0.25=0.25,查表,最近的,查表,最近的P=0.24857,对应的,对应的Z=0.67。因为。因为Z?X?X?,将它变为X?X?Z?得得X=80+0.67*10=86.7,因此这次考试的最低录取分,因此这次考试的最低录取分数线为数线为86.7分。分。例例11 某次数学竞赛,学生成绩呈正态分布,参赛学生某次数学竞赛,学生成绩呈正态分布,参赛学生
46、200人,平均分人,平均分66.78分,标准差为分,标准差为9.19分,(分,(1)若表)若表扬前扬前20名竞赛优胜者,其最低分应是多少?(名竞赛优胜者,其最低分应是多少?(2)某生)某生得得80分,他在参赛中排第几名?分,他在参赛中排第几名?解:(解:(1)已知优胜者人数为)已知优胜者人数为 20人,总人数为人,总人数为200人,人,可求出优胜者人数比率:可求出优胜者人数比率:20/200=0.1,下面属于,下面属于P-Z问题。问题。正态曲线下正态曲线下右侧面积比率为右侧面积比率为0.10,表中表中P值应为值应为0.5-0.1=0.4,查表,最近的查表,最近的P值为值为P=0.39973,对
47、应的,对应的Z值值为为1.28,所以,所以X?X?Z?66.78?1.28*9.19=78.54,所以优胜者最低分数应是,所以优胜者最低分数应是 78.54 分分。(2)求某生在参赛中排列的名次,就是求成绩等于)求某生在参赛中排列的名次,就是求成绩等于和高于他的人数占总人数的比率,进而求实际人数。和高于他的人数占总人数的比率,进而求实际人数。属于属于Z-P问题。问题。先求该生成绩的标准分数先求该生成绩的标准分数Z?X?X?80?66.78?1.449.19查正态分布表得,查正态分布表得,P1=0.42507,成绩等于和高于该生,成绩等于和高于该生的人数比率即曲线下的人数比率即曲线下 右侧面积右
48、侧面积,P2=0.5-P1=0.07493。即即200*0.07493=15(人)所以该生在参赛者中应排在(人)所以该生在参赛者中应排在第第15名。名。(三)确定按能力或成绩等级分组的各组人数三)确定按能力或成绩等级分组的各组人数?假设学生假设学生成绩成绩呈呈正态分布正态分布,学生,学生能力能力也也呈呈正态分布正态分布,按,按成绩等级或能力进行分组成绩等级或能力进行分组,各组的人数各组的人数不应是均等不应是均等的,而应是的,而应是中等能力、中等能力、中等等级中等等级的人数的人数多多,高能力与低能力组高能力与低能力组,高成高成绩与低成绩等级组绩与低成绩等级组的人数的人数少少。可以利用。可以利用正
49、态正态分布理论分布理论解决此类问题。解决此类问题。例例12 某年级进行数学能力测验后,拟按数学能力将学某年级进行数学能力测验后,拟按数学能力将学生分成五个组。该次测验参加人数为生分成五个组。该次测验参加人数为 300人,平均分为人,平均分为60分,标准差为分,标准差为13.2分,问各组人数及原始分数区间分,问各组人数及原始分数区间都是怎样的?都是怎样的?解:在解:在正态分布正态分布下,下,99.73%的数据在的数据在3之间,之间,全距为全距为6 6。若分成。若分成五五个等级组,按各组距相等,应为个等级组,按各组距相等,应为6 6/5=1.2/5=1.2,两端组可延至正负无穷,因此各组测,两端组
50、可延至正负无穷,因此各组测验成绩的标准分数区间界限依次为:验成绩的标准分数区间界限依次为:-1.8-1.8以下以下(第一(第一组),组),-1.8-1.80.60.6(第二组),(第二组),-0.6-0.6-0.6-0.6(第三组),(第三组),0.6-1.80.6-1.8(第四组),(第四组),1.81.8以上(第五组)。以上(第五组)。由标准分数查表得各等级对应的正态曲线下面积比由标准分数查表得各等级对应的正态曲线下面积比率分别为:率分别为:0.03593,0.23832,0.4515,0.23832,0.03593。根据正态分布的轴对称性,第一组与第五组人数根据正态分布的轴对称性,第一组