1、a1第四章第四章随机变量、概率和概率分布随机变量、概率和概率分布a2本章内容本章内容第一节第一节 概率的有关概念概率的有关概念第二节第二节 随机变量及其概率分布概述随机变量及其概率分布概述第三节第三节 常用的概率分布常用的概率分布 二项分布、泊松分布、二项分布、泊松分布、正态分布正态分布 第四节第四节 常用的抽样分布常用的抽样分布 卡方分布、卡方分布、t t分布、分布、F F分布分布a3第一节第一节 概率的有关概念概率的有关概念 a4 样本的实际发生率样本的实际发生率称为称为频率频率。设在相同。设在相同条件下,独立重复进行条件下,独立重复进行n n次试验,事件次试验,事件A A出现出现f f
2、次,则事件次,则事件A A出现的频率为出现的频率为f f/n n。概率概率:随机事件发生的可能性大小随机事件发生的可能性大小,用,用大写的大写的P P 表示;取值表示;取值00,11。一、频率与概率一、频率与概率 frequency and probabilityfrequency and probabilitya5必然事件必然事件 P P=1=1随机事件随机事件 0 0 P P 1 1不可能事件不可能事件 P P=0=0 P P 0.05 0.05(5 5)或)或P P 0.01 0.01(1 1)称为称为小概率事件小概率事件(习惯习惯),统计学上认为不大可能发生。,统计学上认为不大可能发生
3、。二、随机事件二、随机事件 Random eventsRandom events样本空间(样本空间(sampling space):sampling space):随机试随机试验的所有可能的结果称为样本空间。验的所有可能的结果称为样本空间。a6频率与概率间的关系:频率与概率间的关系:1.样本频率总是围绕概率上下波动样本频率总是围绕概率上下波动 2.样本含量样本含量n越大,波动幅度越小,频越大,波动幅度越小,频率越接近概率。率越接近概率。a7第二节第二节 随机变量及其概率分布概述随机变量及其概率分布概述a8一、随机变量一、随机变量 每次抛两个硬币,记录正、反面结果;结果可记每次抛两个硬币,记录正
4、、反面结果;结果可记录为:录为:硬币硬币1正面朝上,硬币正面朝上,硬币2正面朝上;正面朝上;2个正面个正面 硬币硬币1正面朝上,硬币正面朝上,硬币2反面朝上;反面朝上;1个正面个正面 硬币硬币1反面朝上,硬币反面朝上,硬币2正面朝上;正面朝上;1个正面个正面 硬币硬币1反面朝上,硬币反面朝上,硬币2反面朝上反面朝上 0个正面个正面 正面数就是一个随机变量,记为正面数就是一个随机变量,记为x,我们通常对,我们通常对x的每个取值的概率感兴趣。的每个取值的概率感兴趣。对于本例,对于本例,x的取值为的取值为0、1、2。a9二、离散型随机变量与连续型随机变量二、离散型随机变量与连续型随机变量 离散型随机
5、变量离散型随机变量(discrete random variable):):数据间有缝隙,其数据间有缝隙,其取值可以列举取值可以列举。例如抛硬币例如抛硬币10次,正面的可能取值次,正面的可能取值x为为0、1、2、3、4、5、6、7、8、9、10 连续型随机变量连续型随机变量(continous random variable)数)数据间无缝隙,其据间无缝隙,其取值充满整个区间,无法一一列举取值充满整个区间,无法一一列举每每一可能值一可能值 例如身高、体重、血清胆固醇含量例如身高、体重、血清胆固醇含量a10三、概率分布(三、概率分布(probability distribution)概率分布概率
6、分布:描述随机变量值:描述随机变量值xi及这些值对应概率及这些值对应概率P(X=xi)的表格、公式或图形。的表格、公式或图形。离散型随机变量离散型随机变量概率分布概率分布 连续型随机变量连续型随机变量概率分布概率分布a111.离散型随机变量的概率分布离散型随机变量的概率分布a12离散型随机变量的概率分布举例离散型随机变量的概率分布举例a132.连续型随机变量的概率分布连续型随机变量的概率分布 变量的取值变量的取值充满整个数值区间充满整个数值区间,无,无法一一列出其每一个可能值。法一一列出其每一个可能值。一般将连续型随机变量整理成频数一般将连续型随机变量整理成频数表,对频数作表,对频数作直方图直
7、方图,直方图的每个,直方图的每个矩形顶端连接的阶梯形曲线来描述连矩形顶端连接的阶梯形曲线来描述连续型变量的频数分布。续型变量的频数分布。a14图图 2 2-1 1 表表 2 2-4 4 数数 据据 的的 直直 方方 图图051015202530352.73.13.53.94.34.75.15.55.96.3血 清 总 胆 固 醇(mmol/L)人数a15 如果样本量很大,组段很多,矩形顶端组成如果样本量很大,组段很多,矩形顶端组成的的阶梯型曲线阶梯型曲线可变成可变成光滑的分布曲线光滑的分布曲线。大多数大多数情况下,可采用一个函数拟合这一光滑曲线。情况下,可采用一个函数拟合这一光滑曲线。这种函数
8、称为这种函数称为概率密度函数概率密度函数(probability probability density functiondensity function)a16如果连续型随机变量如果连续型随机变量X X的的概率概率密度函数密度函数记为:记为:则在区间则在区间 x x1 1,x x2 2 范围内的概率可由微积分函范围内的概率可由微积分函数定义数定义 211212()()(,)(,)xxF XP xXxf x dxx x ()()1F XPxf x dx )(xfa17第三节第三节 常用的概率分布常用的概率分布离散型随机变量分布离散型随机变量分布一、二项分布一、二项分布二、泊松分布二、泊松分布连
9、续型随机变量分布连续型随机变量分布三、正态分布三、正态分布a18一、二项分布一、二项分布毒性试验:白鼠 死亡生存临床试验:病人 治愈未愈临床化验:血清 阳性阴性事件 成功(A)失败(非A)这类“成功失败型”试验称为Bernoulli试验。a19Bernoulli试验序列试验序列n次Bernoulli试验构成了Bernoulli试验序列。其特点(如抛硬币)如下:(1)每次试验结果,只能是两个互斥的结果之一(A或非A)。(2)每次试验的条件不变。即每次试验中,结果A发生的概率不变,均为 。(3)各次试验独立。即一次试验出现什么样的结果与前面已出现的结果无关。a20成功次数的概率分布成功次数的概率分
10、布二项分布二项分布 例 设某毒理试验采用白鼠共3只,它们有相同的死亡概率,相应不死亡概率为1。记试验后白鼠死亡的例数为X,分别求X0、1、2和3的概率()()(1)()(1)(1)nkn kknkn knkP Xk右侧为二项式展开式的各项a21 330331232133001233330(1)(1)(1)(1)(1)(1)kkkk a22a23二项分布的概率计算二项分布的概率计算=BINOMDIST(1,3,0.4,0)=CRITBINOM(3,0.4,0.217)a24二项分布的性质二项分布的性质a25a26a27a28a29(二)样本率与总体率的比较二项分布的应用二项分布的应用a30a31
11、二、二、泊松分布泊松分布 当二项分布中当二项分布中n很大,很大,很小时很小时,二项分布就二项分布就变成为变成为Poisson分布,所以分布,所以Poisson分布实际分布实际上是二项分布的极限分布。上是二项分布的极限分布。由二项分布的概率函数可得到泊松分布的由二项分布的概率函数可得到泊松分布的概率函数为:概率函数为:0,1,2,!0XPoisson()xeP XxxxXP为大于 的常数,服从以 为参数的分布 a32在在 处的概率最大处的概率最大a33在在 处的概率最大处的概率最大a34Poisson分布主要用于描述在单位分布主要用于描述在单位时间时间(空间空间)中稀有事件的发生数中稀有事件的发
12、生数例如:例如:1.放射性物质在单位时间内的放射次数;放射性物质在单位时间内的放射次数;2.在单位容积充分摇匀的水中的细菌数;在单位容积充分摇匀的水中的细菌数;3.野外单位空间中的某种昆虫数等。野外单位空间中的某种昆虫数等。a35PoissonPoisson分布概率的计算分布概率的计算a36PoissonPoisson分布的性质(分布的性质(1 1)一、一、Poisson分布的均数与方差相等分布的均数与方差相等 即即2=二、二、Poisson分布的可加性分布的可加性 a37第五节第五节 Poisson Poisson分布的性质(分布的性质(2 2)三、三、Poisson分布的正态近似分布的正态近似 相当大(相当大(20)时,近似服从正态分)时,近似服从正态分布:布:N N(,)四、二项分布的四、二项分布的Poisson分布近似分布近似 a38