1、第三章正态分布与医学参考值范围第一节正态分布正态分布正态分布 正态分布正态分布(normal distributionnormal distribution)也叫高斯分布()也叫高斯分布(Gaussian distributionGaussian distribution),是最常见、最重要的一种连),是最常见、最重要的一种连续型分布续型分布 一、正态分布的数学形式和正态曲线下面积的规律一、正态分布的数学形式和正态曲线下面积的规律 二、正态分布的特征二、正态分布的特征 三、标准正态分布三、标准正态分布 频数分布图频数分布逐渐接近正态分布示意图频数分布逐渐接近正态分布示意图(一)、正态分布的概率
2、密度函数(一)、正态分布的概率密度函数)正态曲线(就是为横坐标,绘制的曲线为纵坐标,以)称为概率密度函数(为总体标准差的总体均数,为为底的自然对数指数是以,curve normal)(functiondensity y probabilit)(),(72818.2exp14159.3,2)(exp21)(222XXfXfXNXXXXf正态分布的概率分布函数正态分布的概率分布函数(二)、正态曲线(二)、正态曲线(normal curve)正态曲线的定义 正态曲线是一条高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟形曲线正态分布的特征 正态分布是单峰分布,曲线以均数为中心,左右
3、完全对称,正态曲线以X轴为渐近线,曲线两端无线接近X轴,但不相交;正态曲线在均数处取得该概率密度函数的最大值,X越远离均数,f(X)值越小,在x=处有拐点,表现为钟形曲线;X取值范围理论上没有边界,应为:-+,X离离越远,函数f(X)值越接近0,但不会等于0。正态分布的特征 正态分布有两个参数,决定曲线在横轴上的位置,增大,曲线沿横轴向右移;反之,减小,曲线沿横轴向左移;决定曲线的形状,当 恒定时,越大,数据越分散,曲线越“矮胖”;反之,越小,数据越集中,曲线越“瘦高”;习惯上用N(,2);表示均数为、标准差为的正态分布;正态分布的特殊形式:标准正态分布N(0,1);正态分布的特征正态曲线下的
4、面积分布有一定的规律:1.曲线下的面积即为概率,可以通过式3-2求得。2.曲线下的总面积为1或100%,以为中心左右两侧面积各占50%,越靠近处,曲线下面积越大,两边逐渐减少,超过一定范围以外的面积(概率)可以忽略。3.所有正态曲线,在左右的任意个标准差范围内面积相同。正态分布曲线下面积规律图图2-+-1.96+1.96-2.58+2.5868.27%95.00%99.00%96.196.196.196.1xsxxsx或)1,0(2N)8.0,1(2N)2.1,1(2N正态分布数列中的每个个体加上一个不为零的常数K后,均数的变化 均数改变为原均数+K()iinxxKxKK xnn标准差的变化
5、标准差不变,等于原数列的标准差snxxnkxkxSiin11)()(22正态分布数列中的每个个体乘以一个不为零或一的常数K后,均数的变化 均数改变为原均数 K()iinxxKxKK xnn标准差的变化 标准差改变,等于原数列标准差的K倍ksnxxknkxkxSiin11)()(22 三三 标准正态分布标准正态分布标准正态分布标准正态分布(standard normal distribution)的两个参数为:的两个参数为:=0,=1 记为记为 N(0,12)任意一个服从任意一个服从N(,2)分布的随机变量)分布的随机变量X经过经过标准化变换,也叫标准化变换,也叫z变换(变换(u变换),均可转换
6、为变换),均可转换为=0,=1的标准正态分布。的标准正态分布。sxxzxz或标准正态分布的概率密度函数标准正态分布的概率密度函数)(21)(22zezz标准正态分布的分布函数标准正态分布的分布函数 经常会用到正态分布曲线下一定范围的面积占总面积的百分数,用以估计落在该范围内的频数占总频数的百分比。可通过对式(3-1)积分求得,表示从-到x或z的面积F(x)或(z)(总面积为1)。见图3-5。)(21)(22zdzezzzdXeXFXX)2()(2221)(曲线下面积曲线下面积0.00.10.20.30.40.5-4-3-2-101234Xf(X)u-附表1(P213)就是根据标准正态分布的分布
7、函数制定的标准正态曲线下的面积特点 附表1 为标准正态分布曲线下的面积,表上所查到的面积为从-到z的面积;假设横轴上曲线下的面积为1,即100 曲线下,横轴上对称于0的面积相等 实际工作中经常要用的面积分布规律有以下三点,68.27%,95%,99%的面积公式见表1和下图。标准正态分布曲线下面积规律标准正态分布曲线下面积规律0-11-1.961.96-2.582.5868.27%95.00%99.00%正态曲线下的面积特点 ,已知时,进行标准正态变换再查表 ,未知时,用样本均数 和样本标准差s代替总体参数进行标准正态变换后再查表 95%,99%的面积公式见表1x xx正态分布曲线下面积规律的推
8、导正态分布曲线下面积规律的推导双侧双侧95%的面积的公式的面积的公式96.196.1sxxx或96.196.1u正态分布曲线下面积规律图图2-+-1.96+1.96-2.58+2.5868.27%95.00%99.00%96.196.196.196.1xsxxsx或表表1 正态分布曲线下面积规律正态分布曲线下面积规律标标准准正正态态分分布布 正正态态分分布布 面面积积或或概概率率-11 68.27%-1.961.96 1.96 95.00%-2.582.58 2.58 99.00%szxz或计算正态曲线下面积实例计算正态曲线下面积实例例例1 试估计该地正常女子血清甘油三脂在1.10 mmol/
9、L以下者占正常女子血清甘油三脂总人数的百分比。将X=1.10代入标准正态变量变换公式,得:14.029.014.110.1zLmmolsLmmolx/298.0,/14.1计算正态曲线下面积实例计算正态曲线下面积实例 查附表1,在表的左侧找到0.1,在表的上方找到0.04,两者的相交处为0.4443=44.43%。即该地正常女子血清甘油三脂在1.10mmol/L以下者,估计占总人数的44.43%。例3-1和3-2见P22。实例图示实例图示0.00.30.60.91.21.51.800.511.52X44.43 概率密度函数与累积分布函数概率密度函数与累积分布函数三、正态分布的应用 一种最常见、
10、最重要的连续分布 很多正常人的生理、生化指标的理论分布 数理统计中发展得最为完善的一种分布 很多统计推断都是在正态分布条件下进行 很多非正态分布的资料,当观察例数足够多时,可以用正态分布作为它的极限分布 有时,也将非正态分布资料转化为正态分布来处理正态分布的应用 深入统计描述和推断的基础 计算参考值范围的基础 计算可信区间的基础 进行假设检验的基础 质量控制图 二项分布、Poisson分布的正态分布近似第二节医学参考值范围 由于存在个体变异,来自正常人群的由于存在个体变异,来自正常人群的生理、生化指标在不同个体之间存在生理、生化指标在不同个体之间存在着差异,即使是同一个个体,某些指着差异,即使
11、是同一个个体,某些指标也会因时间、空间的改变而有一定标也会因时间、空间的改变而有一定程度的波动。程度的波动。因此,很有必要制定一个正常人群的因此,很有必要制定一个正常人群的参考值范围以判断某个个体某项指标参考值范围以判断某个个体某项指标正常与否。正常与否。一、医学参考值范围的概念 又称参考值范围又称参考值范围(reference range)(reference range),是指是指“正常正常”人的解剖,生理、生人的解剖,生理、生化等数据大多数个体值的波动范围。化等数据大多数个体值的波动范围。常用常用9595的参考值范围的参考值范围The Purpose of the Reference R
12、angeJudge the index value of someone is normal or not?因为参考值范围覆盖了绝大多数个体,所以因为参考值范围覆盖了绝大多数个体,所以 如果某个个体的测量值超出此范围,我们可以如果某个个体的测量值超出此范围,我们可以据此推断他的这项指标存在着异常。据此推断他的这项指标存在着异常。基于临床实践,从个体角度,作为临床上判定正基于临床实践,从个体角度,作为临床上判定正常与异常的参考标准常与异常的参考标准基于预防医学实践,从人群角度,可用来评价儿基于预防医学实践,从人群角度,可用来评价儿童的发育水平童的发育水平正常人的手指血流正常人的手指血流呈黃藍色呈
13、黃藍色 (perfusion unitperfusion unit約約215215)參考值:參考值:PU150PU150手指潰爛之病人血流手指潰爛之病人血流呈紫灰藍色呈紫灰藍色(PUPU約为約为1919)Index abnormalsick or unhealthiness?Help us to judge whether someone is sick.?姚明:2.26米,身高高于正常 人参考值范围的上限,属于身高指标异常。但是他很健康,并 没有相关的疾病。Two、How to Make Reference Range First stepSampling from Normal Popul
14、ation确定同质的参照总体The choice of sample 首先,正常人不是指完全健康的首先,正常人不是指完全健康的人,而是指符合特定健康水平的人,而是指符合特定健康水平的人。在使用或指定临床参考值范人。在使用或指定临床参考值范围时,围时,“正常人正常人”是指相对于我是指相对于我们所研究的指标正常的人,即排们所研究的指标正常的人,即排除了对研究指标有影响的疾病或除了对研究指标有影响的疾病或有关因素的同质人群。有关因素的同质人群。例如:例如:制定血清谷丙转氨酶的参考值范围,你认为正常人的条件是什么呢?无肝肾心脑肌肉等疾病无肝肾心脑肌肉等疾病近期未服用对肝脏有损伤的药物如氯丙嗪,异烟近期
15、未服用对肝脏有损伤的药物如氯丙嗪,异烟肼等肼等检测前未作剧烈运动检测前未作剧烈运动例如:如果我们想制定某市成人居民中血铅例如:如果我们想制定某市成人居民中血铅的参考值范围,我们规定凡是满足下列条的参考值范围,我们规定凡是满足下列条件的个体均可进入我们的研究:件的个体均可进入我们的研究:1:adult people wuho have stayed in the city for more than one year 2:without obvious liver or kidney diseases 3:without the history of obvious lead contact o
16、r lead-related occupationSecond stepSelect enough sample选择足够例数的参照样本选择足够例数的参照样本The choice of sample 随机选取样本 Random 样本含量(n)Sample size:the bigger the better,but in common sense the sample should involve at least 100 individuals.Third stepMinimize Measure Error 控制检测误差Minimize Measure Error Standardize 标
17、准化 统一测量方法 统一仪器 统一试剂 统一精密度 统一操作熟练度 Fourth stepGrouping or not?分组的原则:如果组间差异有统计学意义,而且分组具有实际意义,则一定应分组。例如:如果我们想制定身高的参考值范围,不仅应考虑性别,年龄的差异,而且还应将地区之间的差异考虑在内。For example,we we want to make a reference range of height.Not only gender,age,but also geographic factors should be considered.婴儿身体发育的参考值婴儿身体发育的参考值(均值均
18、值)男孩男孩女孩女孩头围头围(cm)体重体重kgkg身长身长cmcm头围头围(cm)cm)体重体重(kg)kg)身长身长(cm)(cm)第一周第一周34.0034.003.003.0050.050.034.034.03.003.0050.050.0第一个月第一个月35.8135.813.823.8253.153.135.0835.083.643.6451.951.9第二个月第二个月 37.70 37.70 5.005.0056.256.236.7036.704.604.6054.954.9第三个月第三个月39.5039.505.835.8359.659.638.2038.205.205.205
19、7.757.7第四个月第四个月40.6040.606.436.4361.861.839.6039.606.056.0560.960.9第五个月第五个月41.7041.707.017.0164.264.240.7040.706.586.5863.163.1第六个月第六个月42.7342.737.687.6866.466.441.3841.386.926.9264.564.5第七个月第七个月43.2943.298.048.0468.168.142.2242.227.497.4967.167.1第八个月第八个月43.8543.858.378.3769.969.942.7542.757.697.696
20、8.168.1第九个月第九个月44.3544.358.778.7771.371.343.2343.238.058.0569.869.8第十个月第十个月44.9544.959.039.0372.972.943.6643.668.368.3670.870.8第十一个月第十一个月45.4845.489.279.2773.773.743.8643.868.538.5372.172.1Fifth stepA One-Side Range or A Two-Sides Range One side or two sides?决定选用单侧范围还是双侧范围要根据我们的科研设计、积累的经验及指标的实际用途而定。
21、The choice of a one-or two-sides range is determined by your scientific research design or your experience.如果某个指标(如身高)过高和过低均为异常,我们就应该制定它的双侧范围,即找到正常人群的上限和下限。If an index is thought to be abnormal when it is too high or too low,we must find the lower and upper limits of normal population,that means two
22、 sides range.血清蛋白电泳扫描血清蛋白电泳扫描结果结果 正常参考值范围:正常参考值范围:Alb(Alb(白蛋白):57%-68%:57%-68%1:11:1.0%-5.7%0%-5.7%2 :4.9%-11.2%2 :4.9%-11.2%:7.0%-13%:7.0%-13%:9.8%-18.2%:9.8%-18.2%双白蛋白血症先天性白蛋白缺陷症Two-sides rangeThese indexes include:height,weight,blood pressure,pulse,hb,et al.但是如果这个指标仅在过高或过低但是如果这个指标仅在过高或过低时异常,那我们就应
23、找到正常人群时异常,那我们就应找到正常人群的上限或下限,即制定单侧范围。的上限或下限,即制定单侧范围。But if an index is abnormal only when it is too high(or too low),we then should make a one-side range with upper(lower)limit.One side range(one)Take blood lead(血铅)(血铅)for example,it is abnormal only when it is too high.The content of mercury(发汞发汞)in
24、 the hair is the same kind.One side range(another)Vital capacity(肺活量)is another kind of one-side range.It is abnormal only when it is too low,so we must find the lower limit of normal populationSixth step Choose an Appropriate Confidence(%)Level选择适当的百分数范围Determining the confidence level 原则:根据科学常规,选择
25、合适的百分界限,最常用的范围为95。当然,我们也可以根据特定的研究目的做适当的调整。Principal:According scientific regulations,choose an appropriate confidence level.95%is used most frequently.It also can be adjusted according to your specific aim.Determining the confidence level 如果我们想降低漏诊率(the rate of missed diagnosis),也就是希望发现更多的病人,我们可以通过缩
26、窄正常人群的范围,从具有较高的测量值的个体中找到潜在的病人,所以可以选择一个比较低的百分界值,90%或 80%都可以95%,normal value5%,abnormal value(latent patient)90%,normal value10%,abnormal value(latent patient)Determining the confidence level 另一方面,如果我们希望降低误诊率(the rate of misdiagnosis),也就是希望诊断更精确,我们应该扩大参考值的范围。这样,具有更高的测量值的个体患相关疾病的概率就增加了,降低了误诊的概率。所以我们可以选
27、择一个更高的百分界限,如99。95%,normal value5%,abnormal value(latent patient)99%,normal value1%,abnormal value(latent patient)Seventh stepDecide the Distribution Type 正态性检验是决定这个资料是否满足正态分布的金标准。但是正态性检验必须通过统计软件在计算机上运算才可以实现。我们可以通过经验公式大致判断资料的分布类型:正常人的各种生理、生化、解剖值数据分布比较均匀,而且算术平均数是标准差的3倍以上。算术平均数和中位数比较接近,中位数和算术平均数的比值在(0.
28、95-1.05)之间。Last step Choose a Best Method to Compute It 计算方法:正态分布法、对数正态分布法和百分位数法。选择何种方法依据我们的资料的类型,由第6步决定。计算方法如下,以95参考值范围为例正态分布法sx96.11.64xs1.64xs对数正态分布法1lglglg(1.96)xxxs1lglglg(1.64)xxxs1lglglg(1.64)xxxs百分位数法 应用条件:偏态分布资料 计算公式:95参考值范围:双侧界值:P 2.5 P 97.5 单侧 上界:P 95 单侧 下界:P 5 95%参考值范围的估计方法 方法方法 适用资料类型适用
29、资料类型 双侧界限值双侧界限值 单侧上限单侧上限 单侧下限单侧下限 正态法正态法 正态正态对数正态 对数正态分布法 百分位数法百分位数法 偏态偏态 P2.5 P97.5 P95 P5 sx96.1sx64.1sx64.11lglglg(1.96)xxxs1lglglg(1.64)xxxs1lglglg(1.64)xxxs例3-3 利用表3-1 某地140名正常男子红细胞数的频数表,求95的参考值范围。要点总结:红细胞数过高或过低都是异常的,因此应该选择双侧范围。95%是最常用和最好的百分界限。根据我们的经验,这个指标呈正态分布。当然,最好通过正态性检验证实。正态性检验证实资料呈正态分布正态性检
30、验证实资料呈正态分布(P0.200),因此我,因此我们选择正态分布法计算双侧们选择正态分布法计算双侧95%的参考值范围。的参考值范围。下限为下限为4.78-1.960.38=4.04(1012/L)上限为上限为4.78+1.960.38=5.52(1012/L)所以该地成年男子红细胞数的所以该地成年男子红细胞数的95%参考值范围是参考值范围是4.045.52(1012/L)例题3-5 根据表2-4资料,估计该地区5060岁女性血清甘油三酯含量的95参考值范围?要点总结:甘油三酯只在过高是异常的,因此应该选择单侧上限范围。95%是最常用和最好的百分界限。根据我们的经验,这个指标呈偏态分布。当然,最好通过正态性检验证实。正态性检验证实资料呈正态分布正态性检验证实资料呈正态分布(P0.01),因此我们,因此我们选择百分位数法计算单侧上限的选择百分位数法计算单侧上限的95%正常值范围。正常值范围。上限为LmmolfnfiLP/098.2)580%95630(283.09.1%959595959595所以所以该地区5060岁女性血清甘油三酯的甘油三酯的95%参考值范围是参考值范围是小于小于2.098mmol/L。总结 正态分布的特征,正态曲线面积的分布规律,标准正态变换 医学参考值范围的概念,制定步骤,计算公式
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。