1、资料仅供参考,不当之处,请联系改正。正态分布正态分布资料仅供参考,不当之处,请联系改正。n正态分布的通俗概念: 如果把数值变量资料编制频数表后绘制频数分布图(又称直方图,它用矩形面积表示数值变量资料的频数分布,每条直条的宽表示组距,直条的面积表示频数(或频率)大小,直条与直条之间不留空隙。),若频数分布呈现中间为最多,左右两侧基本对称,越靠近中间频数越多,离中间越远,频数越少,形成一个中间频数多,两侧频数逐渐减少且基本对称的分布,那我们一般认为该数值变量服从或近似服从数学上的正态分布。正态分布的概念资料仅供参考,不当之处,请联系改正。 下面我们以第一节某地13岁女孩118人的身高(cm)资料,
2、来说明身高变量服从正态分布。n频数分布表:某地 13 岁女孩 118 人的身高(cm)资料频数分布 身高组段 频数 组中值 (1) (2) (3) 129 2 130.5 132 2 133.5 135 8 136.5 138 20 139.5 141 26 142.5 144 25 145.5 147 20 148.5 150 9 151.5 153 3 154.5 156 2 157.5 159162 1 160.5 合计 118 资料仅供参考,不当之处,请联系改正。频数分布图一(又称直方图) 身高(cm)160.5157.5154.5151.5148.5145.5142.5139.513
3、6.5133.5130.5 某地13岁女孩118人身高(cm)频数分布图频数3020100从频数表及频数分布图上可得知: 该数值变量资料频数分布呈现中间频数多,左右两侧基本对称的分布。所以我们通俗地认为该资料服从正态分布。 资料仅供参考,不当之处,请联系改正。身高(cm) 某地13岁女孩118人身高(cm)频数分布图频数20100频数分布图二资料仅供参考,不当之处,请联系改正。频数分布图三身高(cm) 某地13岁女孩118人身高(cm)频数分布图频数14121086420资料仅供参考,不当之处,请联系改正。正态分布图四身高(cm) 频数分布逐渐接近正态分布示意图资料仅供参考,不当之处,请联系改
4、正。n正态分布的数理统计学概念:正态分布的数理统计学概念: 如果随机变量(X)的概率密度函数为: -x+ 则该随机变量服从正态分布。 式中为总体标准差;为总体均数;为圆周率,即3.14159;e为自然对数的底,即2.71828。 22221xexf资料仅供参考,不当之处,请联系改正。 若某一随机变量的概率密度函数(频率曲线方程)为上式,则称该变量X服从参数为和的正态分布,记为:XN(,2)。 函数方程中为位置参数,为形状参数。 在不变的情况下,函数曲线形状不变,若变大时,曲线位置向右移;若变小时,曲线位置向左移。 在不变的情况下,函数曲线位置不变,若变大时,曲线形状变的越来越“胖”和“矮”;若
5、变小时,曲线形状变的越来越“瘦”和“高”。 资料仅供参考,不当之处,请联系改正。若某一随机变量X,其总体均数=0,总体标准差=1,即XN(0,1),则称变量X服从标准正态分布。习惯把服从标准正态分布的变量用字母U或Z表示,此时,我们把U或Z称为标准正态变量。标准正态分布是正态分布中的一个典型分布,数理统计上证明:对一服从正态分布的随机变量(X),若进行特定的变量变换,可将任何一服从正态分布的随机变量(X)转变成服从标准正态分布的随机变量(U或Z),这种变量变换过程称为变量的标准化,也称为U或Z变换。 式中符号意义如前述。XU资料仅供参考,不当之处,请联系改正。正态分布的特征及其面积规律正态分布
6、的特征及其面积规律 正态分布曲线位于横轴上方,呈钟形。 正态分布曲线以均数所在处最高,且以均数为中心左右对称。 0 f(x) max 资料仅供参考,不当之处,请联系改正。 =0.5 0 f(x) =1 =2 0 f(x) max 1 2 正态分布曲线由两个参数决定,即总体均数和总体标准差。在不变的情况下,函数曲线形状不变,若变大时,曲线位置向右移;若变小时,曲线位置向左移,故称为位置参数。在不变的情况下,函数曲线位置不变,若变大时,曲线形状变的越来越“胖”和“矮”;若变小时,曲线形状变的越来越“瘦”和“高”,故称为形态参数或变异度参数。N(,0.52)、N(,12)、N(,22) N(1 ,2
7、)、N(2 ,2) 资料仅供参考,不当之处,请联系改正。正态曲线下面积分布有一定的规律性。 对于服从正态分布的随机变量(X),随机变量值出现在某一区间(x1,x2)的概率与正态分布概率密度曲线与横轴在该区间所围成的区域的面积大小相对应(相等)。 正态分布概率密度曲线与横轴围成的区域的总面积恒等于1。 正态分布概率密度曲线下横轴上一定区间的面积可应用数学知识求出。 在实际应用中,由于所有正态分布都可以通过变量变换转变为标准正态分,为了省去积分计算不同正态分布曲线下横轴上一定区间面积的繁琐过程,所以数理统计学家专门编制了标准正态分布曲线下横轴上一定区间面积分布表,供查表求标准正态分布曲线下一定区间
8、面积。资料仅供参考,不当之处,请联系改正。标准正态分布标准正态分布q标准正态分布曲线下对称于0的区间,面积相等,各占50%,即左右各为0.5。q标准正态分布曲线的纵坐标与面积关系图q即纵坐标从移到u所对应区域的面积为上图红色区域面积的大小,这样一个区域的面积我们用(u)表示,可通过查标准正态分布曲线面积分布表得到(u)的大小。 qu值查表所对应的面积是区间(-,u)所对应的面积,即(u)。q若u=-1.96,那么(-1.96)则表示从移到1.96所对应区域的面积,通过查标准正态分布曲线面积分布表得到(-1.96)=0.025。 资料仅供参考,不当之处,请联系改正。u u u指单侧U界值,也称随
9、机变量U的上侧分位数。其意义为:从到+这一侧的面积为,也即在随机变量U的所有取值中,有100的值比大,有100(1-)的值比小。 资料仅供参考,不当之处,请联系改正。u u /2/22U指双侧U 界值,也称 U的双侧分位数。其 意 义 为 : 从2U到+这一侧的面积为/2, 从-2U到-这一侧的面积也为/2,两侧面积之和为。 即在随机变量 U 的所有取值中,有 100的值比U大, 有100(1-)的值比U小。 资料仅供参考,不当之处,请联系改正。正态分布曲线及其面积分布: 在正态曲线下,1、1.96和2.58所对应的面积分别为 0.6827、0.9500 和0.9900。 图一: 资料仅供参考
10、,不当之处,请联系改正。图二: 图三: 资料仅供参考,不当之处,请联系改正。图四: 资料仅供参考,不当之处,请联系改正。 当有一随机变量X服从正态分布N(,2),若要求某一区间(x1,x2)的曲线与横轴围成的面积时,无须运用积分学知识求从x1移到x2所对应区域的面积大小来得到这一区间所对应的面积。此时,我们可以通过变量变换,把X转变成u,即把一般的正态分布变换为标准正态分布,通过求标准正态分布区间(u1,u2)所对应的面积来间接求得一般正态分布区间(x1,x2)所对应的面积。 当随机变量的参数和未知时,若来自该总体的样本含量n很大时,可分别用样本均数和样本标准差作为和的估计值来计算u值。资料仅
11、供参考,不当之处,请联系改正。 其基本步骤如下: 已知 XN(,2) , 求随机变量 X 出现在 区间(x1,x2)的概率 即求服从一般正态分布 N(,2)的随机变量X在区间(x1,x2)所对应的面积 进 行 标 准 化 变 换 :xU 求服从标准正态分布 N(,)的随机变量U在区间(u1,u2)所对应的面积。 资料仅供参考,不当之处,请联系改正。 (u) (u)即为该随机变量U在区间(u1,u2)所对应的面积。 (u) (u)即为该随机变量U在区间(u1,u2)所对应的面积。 通过查标准正态分布面积分布表,分别求 (u) 、(u)的大小。 随机变量U在区间(u1,u2) 所对应的面积即为随机
12、变量X在区间(x1,x2)所对应的面积 资料仅供参考,不当之处,请联系改正。 举 例 说 明 通 过 正 态 分 布 求 随 机 变 量 的频 数 分 布 范 围 。 例 :某 地 13 岁 女 孩 118 人 的 身 高 (cm )资 料 , 估 计 该 地 13 岁 正 常 女 孩 身 高 在 135厘 米 以 下 及155 厘 米 以 上 者 各 占 正 常 女 孩总 人 数 的 百 分 比 。 身 高( X ) N ( ,2),但 和 未知 , 只 知 来 自 该 总 体 的 样 本 的 身 高 均 数x=144.29(cm)和 标 准 差s=5.41(cm), 由于 样 本 含 量
13、n=118 很 大 , 所 以 可 以 用x和s 估 计 和 来 计 算 u 值 。 资料仅供参考,不当之处,请联系改正。身高(X)小于 135(cm)的概率为:11135uUPxXP 72. 141. 529.14413511sxxu 04272. 072. 172. 1135111uUPuUPxXP 身高(X)大于 155(cm)的概率为:22155uUPxXP 98. 141. 529.14415522sxxu 02385. 097615. 0198. 1198. 1155222uUPuUPxXP该地 13 岁正常女孩身高在 135 厘米以下者占正常女孩总人数的 4.272%,身高在 1
14、55 厘米以上者占正常女孩总人数的 2.385%。 资料仅供参考,不当之处,请联系改正。正态分布的应用正态分布的应用 估 计 医 学 正 常 值 范 围 。 医 学 正 常 值 范 围 又 称 医 学 参 考 值 范 围 ,医 学 正 常 值 范围 是 指 包 括 绝 大 多 数 正 常 人 的 各 种 生 理 及 生 化 指 标的 范 围 。 一 般 常 用 95%或 99%的 医 学 参 考 值 范 围 。 某 指 标 的95%或99%的 医 学 参 考 值 范 围 只 包 括95%或99%的 正 常 人 该 指 标 的 变 量 值 分 布 范 围 ,还 有 5%或 1%的 正 常 人 该 指 标 的 变 量 值 不 在 此 范 围 内 。所 以 ,在 诊断 时 参 考 值 范 围 只 能 起“ 参 考 ”作 用 , 不 在 此 范 围 并不 一 定 异 常 ( 患 病 ) , 在 此 范 围 内 也 不 一 定 正 常 ( 不患 病 ) 。 资料仅供参考,不当之处,请联系改正。 制定医学参考值范围时,应从正常人群中抽样,且样本含量应较大(n100) ,根据资料的分布类型采用正态分布法或百分位数法。 正态分布法: 适用于资料服从正态分布或近似正态分布时。 公式; 双侧 1-参考值范围:SUX2 单侧 1-参考值范围:SUXSUX或 例题参见教科书。