1、概率分布推断统计的基础随机事件确定性现象确定性现象1在一定条件下必然在一定条件下必然发生的现象,如氧发生的现象,如氧气燃烧产生热量。气燃烧产生热量。随机现象随机现象在个别试验中其结果呈在个别试验中其结果呈现出不确定性,但是在现出不确定性,但是在大量重复试验中,其结大量重复试验中,其结果又具有统计规律性的果又具有统计规律性的现象,如掷硬币的结果。现象,如掷硬币的结果。日常生活中存在各种各样的现象日常生活中存在各种各样的现象确定性现象确定性现象2在一定条件下必然在一定条件下必然不发生的现象,如不发生的现象,如月球表面出现植物。月球表面出现植物。概率等于1概率介于(0,1)之间概率等于0概率:事件出
2、现可能性大小的数字描述,在概率:事件出现可能性大小的数字描述,在0,1之间取值之间取值 设随机事件A在相同的条件下进行的n次试验中发生了 次,则称 /n是事件A在这n次试验中发生的频数,记成 。当n趋于无穷大时该数值将稳定在一个常数上,这一常数称为事件A在该条件下发生的概率。即:如下表是多位学者掷硬币的结果概率定义后验(经验)概率nnAfAn)(AnAnnnAPAn lim)(概率定义先验(古典)概率满足以下两个条件 每次试验中所有可能出现的结果的个数是有限的;每种结果出现的可能性是相同的,如掷骰子游戏。如果试验结果(基本事件)的总数为n,事件A包含m个基本事件,则事件A的概率为 ,以掷两个骰
3、子为例,P(至少有一个1)=11/36;P(点数之和大于10)=3/36.nmAP)(或或概率性质 可列可加性:两个不相容事件A、B之和的概率,等于两个事件概率之和,即P(A+B)=P(A)+P(B)乘法定理:两个独立事件同时发生的概率等于该两事件概率的成绩,即:P(AB)=P(A)P(B)例:掷一个骰子,点数大于4的概率多大?同时掷两个骰子,一个点数大于4,一个点数小于4的 概率多大?解:1,点数为5 的概率是1/6,点数为6的概率是1/6,点数大于4的概率是1/6+1/6=2/6 2,其中一个大于4的概率是2/6,一个小于4的概率是 3/6,同时出现的概率是两者乘积1/6.概率分布 定义:
4、随机变量取值的函数描述 类型:离散分布(二项、泊松)与连续分布(正态、t、F)经验分布(由实验数据编制的次数分布)与 理论分布(数学模型)总体分布(所有数据组成的分布)与 抽样分布(从总体中抽取的样本的统计量,含平均 数、标准差、相关系数、回归系数等,的分布)总体分布与抽样分布举例:总体平均数只有一个,标准差只有一个,总体是一个分布,它的个体是观测数据;样本可以有多个,所以样本平均数有多个,标准差有多个,多个样本平均数(标准差)组成的分布称为样本平均数(标准差)的分布,它的个体是多个观测数据的平均数(标准差)。二项分布 二项分布:实验结果只有两种的概率分布,如抛硬币,选择题判断题的正误等。分布
5、函数:离散型xnxxnnnnnnnnnnnnqpCpnxBqCpqCqpCpCqp),(.)(11110n表示试验总次数(抛骰子总次数),x表示试验成功总次数(如点数为6的次数),p表示成功的概率(如点数为6的概率)二项分布 图像:n=10,x=3,p=1/6,B(3,10,1/6)=0.155;n=10,x=2,p=1/6,B=(2,10,1/6)=0.291;n=10,x=1,p=1/6,B=(1,10,1/6)=0.070;n=10,x=4,p=1/6,B=(4,10,1/6)=0.054;性质:npqnp,正态分布 正态分布曲线函数 图像euxxf2)(21)(22平均数不同,标准差相
6、同平均数相同,标准差不同N(2,1)N(0,1)N(-2,1)N(,1)N(,0.25)N(,2.25)记作XN(,2)正态分布应用 假定500个学生某科成绩分布接近于正态分布N(70,100),问:75分以下有多少人?85分以上有多少人?介于65和80分之间有多少人?解:1 求这两个分数的Z值:2 根据正态分布表求对应的曲线下面积在 z=0.5时,正态分布表第三列中对应的值是0.1915,在 z=1.5 时,正态分布表第四列中对应的数值是0.06681 3 根据相应的曲线下面积求低于75分和高于85分的人数低于75分的实际人数为 500 x0.6915=346 人。高于85分的实际人数为 5
7、00 x0.06681=33 人。答:这500个学生某科成绩在75分以下的有346人,85分以上的有33人。5.01070751Z5.11070852Z正态分布 性质:对称,平均数,众数和中位数相等 平均数左右1个标准差范围包含了68.27%的样例,平均数左右1.96个标准差范围包含了95%的样例,平均数左右2.58个标准差范围包含了99%的样例,(发生概率在5%或1%以下的事件被称为小概率事件,小概率事件被假定为在一次观测中几乎不可能发生)正态分布曲线从中央点向两边下降,先凸后凹,拐点在一个标准差处,无限接近X轴但永不相交 解:4:求65分和80分的z值 用Z值找到对应的概率,相减 P-0.
8、5=0.30854,P1=0.84134,0.84134-0.30854=0.5328 用概率差求介于65分与80分之间的人数 500 x0.5328=266.4266人正态分布应用 假定500个学生某科成绩分布接近于正态分布N(70,100),问:75分以下有多少人?85分以上有多少人?介于65和80分之间有多少人?5.010706565Z110708080Z 某县对初一年级1000名学生进行能力测验,结果75,10,现拟根据此结果选取25名学生作为“尖子班”重点培养,假定测验成绩近似正态分布,问多少分以上才能被选到“尖子班”学习?解 求25名学生比例:25/1000=0.025=2.5%查
9、表求P=0.025对应的Z值:Z=1.96 求入选分数:X=94.6正态分布应用107596.1Xt分布 分布函数:图像1/nsXt性质:=0,左右对称在-+之间取值;受df=n-1影响,n-1趋于时t分布就是正态分布;n-130时t分布接近正态分布,方差大于1;n-10,呈正偏态分布df=n-1,df2时2的均值为df,方差为2dfdf趋于时2分布就是正态分布;2服从一个df=dfi的2分布学习使用2分布表查df=10时20.05;20.025 F分布222121/dfdfF 分布函数:图像:性质:F0,呈正偏态分布,随df1,df2的增大而趋于正态分布学习使用F分布表查F0.05(30,3
10、5);F0.01(35,30)样本平均数 总体正态,方差已知,服从正态分布 总体正态,方差未知,服从t分布 总体非正态,方差未知,趋于t分布(n30)样本方差S2 趋于正态分布(n30)样本标准差 S 趋于正态分布(n30)积差相关系数 服从t分布 等级相关系数 近似于t分布(9n20)或正态分布(n20)样本分布性质X 样本平均数 的分布的平均数等于总体分布平均数:样本平均数 的分布的标准差与总体分布平标准差的关系:样本分布性质XXXnX作业 某班60名同学进行智力测验成绩符合N(=100,=15),问该班智力测验分数115分以上的同学大概有几名。抽样理论中样本容量n30有什么重要意义?总体分布正态,方差未知时的样本均数服从何种分布?总体分布未知,方差未知时的样本均数服从何种分布?
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。