SAS软件应用之Logistic回归分析课件.ppt

上传人(卖家):三亚风情 文档编号:2869825 上传时间:2022-06-06 格式:PPT 页数:68 大小:937.50KB
下载 相关 举报
SAS软件应用之Logistic回归分析课件.ppt_第1页
第1页 / 共68页
SAS软件应用之Logistic回归分析课件.ppt_第2页
第2页 / 共68页
SAS软件应用之Logistic回归分析课件.ppt_第3页
第3页 / 共68页
SAS软件应用之Logistic回归分析课件.ppt_第4页
第4页 / 共68页
SAS软件应用之Logistic回归分析课件.ppt_第5页
第5页 / 共68页
点击查看更多>>
资源描述

1、不同年龄组内服用避孕药的比例不同年龄组内服用避孕药的比例 年龄年龄 服服OC 不服不服OC 合计合计40 38(0.31) 8512340 25(0.12)183208 合计合计 632683312 = 17. 88P0. 01 40岁以上服用岁以上服用OC的比例远小于的比例远小于40岁以下组。岁以下组。ORMH = (ai*di/ni) / (bi *ci/ni) ORMH =2.79二、二、Logistic 回归原理回归原理经过数理统计学家证明:把疾病概率 P 转换成 pp1ln,会使该回归方程的统计性能更好一些。而且,在经过转换以后, pp1ln的值域为-到+,而且这些 pp1ln值都可

2、以和在大于0小于1范围内的P值相对应。统计学中,常把 pp1ln称为Logit 变换。 yy = logy = log2 2x x01Logistic 回归方程:回归方程: pp1ln = nnxx 110 , 而且有:而且有: )()(1101101nnnnxxxxeep Logistic 模型中系数的意义:模型中系数的意义: 回归系数的流行病学意义是:在其它自变量都回归系数的流行病学意义是:在其它自变量都不变的条件下,当因素不变的条件下,当因素X X变化一个测量单位时所引起的变化一个测量单位时所引起的OROR值自然对数的改变量。值自然对数的改变量。 pp1ln = 11x 111xepp

3、1XOR= 00111111 XXXXqpqp=001111111.1.xxxxpppp =1111xxee=0111ee = 1e 三、三、Logistic 回归回归和和OR值间的关系值间的关系 对以上似然函数分别求对对以上似然函数分别求对 和和 的一阶偏导数,再令两个偏导数为的一阶偏导数,再令两个偏导数为零,就可以解得零,就可以解得 和和 的估计值。的估计值。第第12章章 相对数相对数学习目标理解相对数的含义熟悉几种常用的相对数熟悉应用相对数时应注意的问题掌握率标准化的两种方法(直接法和间接法)以及SAS程序掌握率假设检验方法和SAS程序概述分类资料的变量值是定性的,对其观察结果的分析与比

4、较常用率、构成比、相对比等统计指标描述。这些指标都是由两个有联系的指标之比组成,又称相对数。 相对数 调查或实验搜集来的原始资料,经过汇总之后得到的小计或总计数值称为绝对数(即总量指标)。如发病人次数、医院收容人数、治愈人数等。总量指标反映一定条件下某种事物的规模或水平,是计划或总结工作的依据,同时,又是计算相对数与平均数的基础,但是绝对数往往不便于比较,因此在实际工作中还必须计算相对数与平均数。相对数相对数是两个有关的绝对数之比,通常用百分比、千分比或万分比等表示,是医学研究中最常用的统计指标之一。计算相对数的意义是把基数化做相等,便于相互比较。如:每千人中的发病数,每百名某病患者的死亡人数

5、等。例题例如:某时期内,甲部队患感冒者17人,乙部队10人,我们不能因为17人多于10人,而得出甲部队感冒发病率高的结论,如果甲部队有1068人,乙部队为313人,那么甲乙部队感冒率分别为:甲部队:17/10681000=15.9乙部队:10/3131000=31.9根据这两个感冒发病率可以看出,甲部队感冒的发病强度是乙部队的1/2左右。率 又称频率指标,表示在一定范围内,某现象的发生数与可能发生某现象的总数之比,说明某现象出现的强度或频度(即频繁的程度)。计算公式为: 100%单位总数可能发生某现象的观察数发生某现象的观察单位率率在医学上常用的强度相对数有患病率、发病率、感染率、病死率、死亡

6、率及人口自然增长率等。计算公式如下: 某病患病率=某病患病人数/调查人数100% 某病发病率=某期间内某病新病例数/同期间内平均人口数100% 某病感染率=带有某种病原体人数/检查人数100% 某病病死率=死于某病人数/某病患病人数1000 某病死亡率=某年某地某病死亡人数/同年该地平均人口数100% 出生率=某地某年活产数/该地同年年平均人口数1000 死亡率=某地某年死亡率/该地同年年平均人口数1000 自然增长率=(某地某年活产数-死亡数)/该地同年年平均人口数1000=出生率-死亡率表示每年每1000人口增加的人数。构成比 表示某部分在全部分中所占比重,以100作为基数,计算公式为:

7、全体内各组结构相对数的总和应为100%。观察单位总数同一事物各组成部分的位数某一组成部分的观察单构成比100例题例如:某年某地区各种疟疾发病例数为:恶性疟68名,间日疟12名,三日疟17名。则三种疟疾分别占疟疾患者总数的百分比为: 恶性疟=68/(68+12+17)100%=70.1% 间日疟=12/(68+12+17)100%=12.4% 三日疟=17/(68+12+17)=17.5%各部分百分比之和为100%,即70.1%+12.4%+17.5%=100%比 是两个有关指标之比。通常以某种现象的数量为1或100作基数,看另一种现象的数量是多少。计算公式为:两个比较指标可以性质相同,也可以性

8、质不同。如相对危险度、变异系数等;A、B两个指标可以是绝对数、相对数或平均数等。BA比比常用的指标有三种: 对比指标:指两个同类事物某种指标(绝对数、两个率或其它同类指标)的比。例如某地区流脑发病率1975年为4.48/10万,1998年为0.49/10万,得,表示1975年为1998年的9.14倍。 关系指标:指两个有关的、但非同类事物的数量的比。如某医院医护人员与病床数之比。 计划完成指标:说明计划完成的程度,常用实际数达到计划数的百分之几或几倍。应用相对数注意事项分母必须够大。习惯上,分母大于100时,所得相对数代表性最强,分母略小于100时,相对数仍有一定意义。如果分母太小,如20例甚

9、至3例5例,则求得的相对数就不太可靠。在实际工作中,遇到这种情况时,还是用绝对数表达较为妥当。如:某病住院患者四人中死亡一人等。分母必须选择恰当。例如:调查某部队人员的蛔虫感染情况时,收集的资料有部队人数、被检查人数、阳性人数。计算蛔虫阳性率时,应以被检查人数为分母,不应以部队人数为分母。此例所说的恰当,是指分母中每一个体都有可能进入分子。应用相对数注意事项用相对数进行比较时,就注意是否具备可比性例如:某部队对老战士计算三年累计的痢疾发病率,而对新战士只计算本年度痢疾发病率,结果得出“新战士的痢疾发病率低于老战士”的结论,这显然是不正确的。因为计算的时期,不具备可比性,如果都计算本年度的发病率

10、就可以比较了。影响率或构成比变化的因素很多,除了研究因素(即比较的因素)外,其余的影响因素应尽可能相同或相近,即在相同条件下比较才有意义。应用相对数注意事项分析时不能以构成比代替率。构成比只能说明事物个组成部分的比重或分布,并不说明某现象发生的频率或强度。二者概念和计算方法都不同,所得结论也应不同。对观察单位数不同的几个率,不能直接相加求其总率。对样本率(或构成比)的比较应随机抽样,并做假设检验。遵循随机抽样的原则才能以该“样本”来推断总体。由于样本率和构成比也有抽样误差,所以不能仅凭数字表面相差的大小作结论,而须进行样本率差别的假设检验。率的标准化 在工作中,比较几个强度相对数(率)时,应注

11、意它们的内部构成是否有差异,当几个率的内部构成不同时,就要先进行率的标准化,而后再作比较,否则容易导致错误的结论。 解决这个矛盾的方法是进行率的标准化(简称标化)。进行标化时,首先要选定一个“标准构成”,如标准人口构成。一般选数量较大的,有代表性的、稳定的作标准构成。在实际工作中,对出生、死亡、发病率等进行标化时,选用标准人口构成。有时也用两个或几个比较组的合计数作标准构成。率的标准化率的标准化法,就是在一个指定的标准构成条件下进行率的对比的方法。当我们对两个频率指标进行比较时,应该注意这两组(或两组以上)对象内部构成是否存在差别足以影响分析结果,如果存在的话,可应用标准化法加以校正。这种经标

12、准化校正后的率,称为标准化率,简称标化率。率的标准化法有直接法的间接法。 直接法如果观察人群中各组年龄别发病(或死亡)率已知,计算时就利用一组标准人口构成比来调整,求出标化率。 将标准人口构成的各年龄组人数乘上原来相应年龄组的发病率,得出各年龄组按标准人口计算的预期发病数 分别把各年龄组按标准人口计算的预期发病数相加,得出按标准人口计算的预期总发病人数,再除以标准总人口数,即得标化发病率。间接法如果在观察人群中,不知道各年龄组的发病(或死亡)率,而是利用标准人口的年龄别率与观察人群中相对年龄组人数相乘,求出年龄组预期发病(或死亡)人数的总的预期数,再与实际数相比,得出标化发病(或死亡)比;最后

13、乘以标准人口总发病(或总死亡)率,得出该人群的标化发病(或死亡)率。该计算法就称间接法。其计算式为:标化发病比实际观察发病人数/预期发病人数或 标化死亡比=实际观察死亡人数/预期死亡人数标化发病率=标准人口发病率标化发病比标化死亡率=标准人口死亡率标化死亡比率的假设检验 一般地,从一个阳性率为的总体中,随机抽取含量为n的样本,则样本中的阳性数X服用二项分布 ,样本阳性率p的概率分布为:其中, 样本率p的总体均数样本率p的总体标准差 ),(nBxnxxnXPpP)1()()()(n,n1n0nnxp)(11nnnXpnnXp)1 (1率的假设检验样本均数的标准差称为均数的标准误,同理,样本率的标

14、准差称为率的标准误。因样本率的均数为总体率,故样本率的标准差,也就是率的标准误描述了样本率相对于总体率分布的离散程度。当样本含量n较大,总体阳性率不接近于0也不接近于1时,样本中的阳性数近似正态分布 ,样本阳性率也近似正态分布 ,故95%的样本率满足: ) )1 (,(nnN),(pNpp96. 1样本率与总体率的比较观察样本数较大时,样本率的频数分布近似正态分布,可应用正态分布的规律性检验率的差异显著性。其公式为:式中p为样本率, 为总体率, 为根据总体率计算的标准误。由于 服从正态分布,故可根据正态分布作判断,进行统计推断。 ppp两个样本率差异的意义检验 当n较大,p与(1p)均不太小时

15、,样本率的分布近似正态分布。根据独立的两个正态变量的差也服从正态分布的性质,当两个样本的含量你n1与n2较大,且p1、(1p1)p2、(1p2)均不太小,例如n1p1、n1(1p1)、n2p2、n2(1p2)均大于5时,可用下面介绍的检验,由两个样本率对应的两个总体率作出统计推断。两个样本率差异的意义检验统计量的计算公式为:其中,以上公式中:P1,P2为两个样本率;pc为合并样本率;X1和X2分别为两样本阳性例数; 2121ppSpp)11)(1 (2121nnppSccpp2121nnXXpc本章小节 相对数是两个有关的绝对数之比,通常用百分比、千分比或万分比等表示,是医学研究中最常用的统计

16、指标之一。计算相对数的意义是把基数化做相等,便于相互比较。如:每千人中的发病数,每百名某病患者的死亡人数等。几种常用的相对数包括率(表示在一定范围内,某现象的发生数与可能发生某现象的总数之比,说明某现象出现的强度或频度)、构成比(表示某部分在全部分中所占比重,以100作为基数)和比(是两个有关指标之比)。本章小节 在工作中,比较几个强度相对数(率)时,应注意它们的内部构成是否有差异,当几个率的内部构成不同时,就要先进行率的标准化,而后再作比较,否则容易导致错误的结论。率的标准化法,就是在一个指定的标准构成条件下进行率的对比的方法。当我们对两个频率指标进行比较时,应该注意这两组(或两组以上)对象内部构成是否存在差别足以影响分析结果,如果存在的话,可应用标准化法加以校正。这种经标准化校正后的率,称为标准化率,简称标化率。率的标准化法有直接法的间接法。文中具体说明了直接法和间接法计算标准化率,并编写SAS程序进行运算。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(SAS软件应用之Logistic回归分析课件.ppt)为本站会员(三亚风情)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|