1、趋势性分析趋势性分析 公共卫生学院卫生统计教研室公共卫生学院卫生统计教研室 易易 静静医学英语写作英文教程1一、涵义一、涵义 一个变量随同另一个变量数量协同变化关系的密切程一个变量随同另一个变量数量协同变化关系的密切程度、数量规律及方向的统计分析称为趋势分析。度、数量规律及方向的统计分析称为趋势分析。两变量间的关系可以是因果关系,也可为等位伴随关两变量间的关系可以是因果关系,也可为等位伴随关系。系。多对一(复相关和多重线性回归、非线性回归)和多多对一(复相关和多重线性回归、非线性回归)和多对多(典型相关)。对多(典型相关)。多变量构造结果变量或构造多原因变量(主成份分析、多变量构造结果变量或构
2、造多原因变量(主成份分析、因子分析)。因子分析)。医学英语写作英文教程2二、趋势性分析的分类及适用条件二、趋势性分析的分类及适用条件类别类别变量分布的要求变量分布的要求资料类型资料类型变量设定形式变量设定形式直线相关直线相关正态双变量正态双变量定量定量实测值实测值直线回归直线回归y或者或者y-正态变量正态变量定量定量实测值实测值曲线回归曲线回归 x或或y x与与y转换值为正态转换值为正态定量定量实测或转换值实测或转换值秩相关秩相关 x或或y x与与y非正态非正态定量或等级定量或等级秩转换值秩转换值定性相关定性相关单向有序行列表单向有序行列表x为等级为等级y非正态非正态(二值或等级二值或等级)x
3、为等级为等级y为计数或百分率为计数或百分率或分两组或分两组x转换为记分转换为记分(-,+)y为二值为二值(0,1)双向有序行列表双向有序行列表x、y均为等级均为等级双向有序列联表双向有序列联表均秩差转换值均秩差转换值医学英语写作英文教程3三、直线相关三、直线相关1.研究和解释两个等位正态随机变量数量协同变研究和解释两个等位正态随机变量数量协同变化关系的密切程度和方向的线性统计分析方法。化关系的密切程度和方向的线性统计分析方法。医学英语写作英文教程4例例1 1 测得某地测得某地15名正常成年人的血铅名正常成年人的血铅X(mmol/L)和和24小时的尿铅小时的尿铅Y(mmol/L)如下表,试分析血
4、铅与如下表,试分析血铅与24小时尿铅之间是否有直线关系?小时尿铅之间是否有直线关系?表表 1515例自愿者的血铅和例自愿者的血铅和2424小时尿铅测量值(小时尿铅测量值(mmol/Lmmol/L)编号编号血铅血铅(X)尿铅尿铅(Y)10.110.1420.250.2530.230.2840.240.2550.260.2860.090.170.250.2780.060.0990.230.24100.330.3110.150.16120.040.05130.20.2140.340.32150.220.24医学英语写作英文教程5(0.2,0.2)医学英语写作英文教程6(0.2,0.2)positiv
5、e association医学英语写作英文教程72.样本直线相关系数样本直线相关系数(Pearson):总体直线相关系数:总体直线相关系数:nyynxxnyxxyYYXXYYXXlllryyxxxy222222)()()()()()(医学英语写作英文教程8 表表 1515例自愿者的血铅和例自愿者的血铅和2424小时尿铅测量值(小时尿铅测量值(mmol/Lmmol/L)编号编号血铅血铅(X)尿铅尿铅(Y)XYX2Y210.110.140.01540.01210.019620.250.250.06250.06250.062530.230.280.06440.05290.078440.240.250
6、.06000.05760.062550.260.280.07280.06760.078460.090.10.00900.00810.010070.250.270.06750.06250.072980.060.090.00540.00360.008190.230.240.05520.05290.0576100.330.30.09900.10890.0900110.150.160.02400.02250.0256120.040.050.00200.00160.0025130.20.20.04000.04000.0400140.340.320.10880.11560.1024150.220.240.
7、05240.04840.0576合计合计 3.03.170.73880.71680.76819787.0)1517.37681.0()1537168.0(1517.337388.0)()()(222222nyynxxnyxxyr医学英语写作英文教程9=0r0医学英语写作英文教程103.t test(1)H0:=0 H1:0 =0.05(2)计算计算t 统计量统计量(3)确定确定P值,做出统计推断值,做出统计推断 =15-2=13,tr=17.189,p0.05212nrrtr189.172159787.019787.02122nrrtr160.2)13(05.0t医学英语写作英文教程114.总
8、体直线相关系数的区间估计总体直线相关系数的区间估计rrz11ln21266.29787.019787.01ln21z)31,11ln21(nrrNz3/2/nuzZU832.2315/96.1266.2UZ3/2/nuzZL700.1315/96.1266.2LZ1122LLZZLee935.011700.12700.12eeL1122UUZZUee993.011832.22832.22eeU医学英语写作英文教程12四、直线回归四、直线回归1.研究自变量研究自变量X与应变量与应变量Y数量协同变化的比数量协同变化的比例关系和方向的统计分析方法。通过拟合有例关系和方向的统计分析方法。通过拟合有统计
9、学意义的直线回归方程实现统计预测与统计学意义的直线回归方程实现统计预测与控制。控制。医学英语写作英文教程13例例2 在某地一项膳食调查中,随机抽取了在某地一项膳食调查中,随机抽取了14名名4060岁的健康妇女,测定岁的健康妇女,测定每人的基础代谢每人的基础代谢(kJ/d)与体重与体重(kg)数据,见下表。数据,见下表。表表 1414名中年健康妇女基础代谢与体重测量值名中年健康妇女基础代谢与体重测量值编号编号基础代谢基础代谢(kJ/d)体重体重(kg)14175.650.724435.053.733460.237.144020.851.753987.447.864970.662.875359.7
10、67.383970.648.693983.244.6105050.158.6115355.571.0124560.659.7134874.462.1145029.261.5医学英语写作英文教程14医学英语写作英文教程15医学英语写作英文教程16医学英语写作英文教程17y=a+bxbxay医学英语写作英文教程182.样本直线回归系数样本直线回归系数 总体直线回归系数:总体直线回归系数:nxxnyxxyxxyyxxllbxxxy222)()()(xbya医学英语写作英文教程197864.1106xbyaXY42.6179.1106.4229.61xxxyllb医学英语写作英文教程20XY42.61
11、79.1106医学英语写作英文教程213.t test2222)()()()(xxyyxxyybllyyxyyybbSbSbt02)()(22nyyyySxy2)(XXSlSSxyxxxybH0:=0 H1:0=0.05医学英语写作英文教程22 tb=12.584 =14-2=12,P0时,如时,如YlnX,Y随随X上升,先快后慢;上升,先快后慢;b0时时,如如Y1lnX,Y随随X下降,先快后慢下降,先快后慢.(见下图)(见下图)YablnX(b0)2.对数函数对数函数医学英语写作英文教程31 当以当以Y和和lnX绘制的散点图呈直线趋势时,可考虑采用绘制的散点图呈直线趋势时,可考虑采用对数函数
12、描述对数函数描述Y和和X间的非线性关系,并且该直线的斜率就间的非线性关系,并且该直线的斜率就是是b,截距就是,截距就是a。Y lnX 对数函数直线化对数函数直线化更一般的对数函数形如更一般的对数函数形如 Yabln(Xc)c往往是未知的,绘图时需试用不同数值。往往是未知的,绘图时需试用不同数值。XbaYln医学英语写作英文教程32 或或Ya exp(bX),(a0)b0时,如时,如 ,Y随随X上升,称正指数函数;上升,称正指数函数;X时,时,Y0,故以,故以X 轴的负侧为渐近线;轴的负侧为渐近线;b0时,如时,如 Y随随X下降,称负指数函数;下降,称负指数函数;X时,时,Y0,故以,故以X轴的
13、正侧为渐近线。轴的正侧为渐近线。指数函数曲线指数函数曲线 bXaeY XeY23XeY233.指数函数指数函数医学英语写作英文教程33对公式两边取对数,得对公式两边取对数,得 lnYlnabX 当以当以lnY和和X绘制的散点图呈直线趋势时,可考虑采用指数绘制的散点图呈直线趋势时,可考虑采用指数函数描述函数描述Y和和X间的非线性关系,并且该直线的斜率就是间的非线性关系,并且该直线的斜率就是b,截,截距就是距就是lna。lnY lna X X 指数函数直线化指数函数直线化bXaY lnln医学英语写作英文教程34更一般的指数函数形如更一般的指数函数形如 (a0)实践中,需以实践中,需以1n(Y-c
14、)和和X的散点图是否呈直线趋势来识别。的散点图是否呈直线趋势来识别。c也常是未知的,也常是未知的,绘图时需试用不同数值。有的问题中,单个绘图时需试用不同数值。有的问题中,单个指数项犹嫌不足,需采用多个指数项之和,如指数项犹嫌不足,需采用多个指数项之和,如 这在药物代谢动力学中尤为多见。这在药物代谢动力学中尤为多见。caeYbXXbXbeaeaY2121医学英语写作英文教程35nnXbXbXbaY221二次多项式二次多项式:b0时,开口向上,有极小值;时,开口向上,有极小值;b0 b0 Logistic 曲线曲线bXaekY15.Logistic函数函数(logistic function)医学
15、英语写作英文教程37特别,当特别,当k=1时,时,当以当以lnY/(1Y)和和X绘制的散点图呈直线趋势时,绘制的散点图呈直线趋势时,可考虑采用可考虑采用logistic 函数描述函数描述Y和和X间的非线性关系,并且,间的非线性关系,并且,该直线的斜率就是该直线的斜率就是b,截距就是截距就是lna -lna X Logistic 函数直线化函数直线化bXaYYln)1ln()1ln(YY医学英语写作英文教程3822211)()(总剩余YYYYSSSSR 决定系数:决定系数:一般来说,决定系数一般来说,决定系数R2较大时拟合效果较好;较大时拟合效果较好;注意,为了单纯地得到较大的决定系数注意,为了
16、单纯地得到较大的决定系数R2,模型,模型的形式可能会很复杂,甚至使其中的参数无法解的形式可能会很复杂,甚至使其中的参数无法解释实际意义,这是不可取的。要充分结合专业知释实际意义,这是不可取的。要充分结合专业知识、实际情况和应用效果来确定最终的曲线。识、实际情况和应用效果来确定最终的曲线。曲线拟合效果曲线拟合效果医学英语写作英文教程39判断何种曲线拟合效果好,且有统计学意义:判断何种曲线拟合效果好,且有统计学意义:MSMSF剩余(相对优法)剩余(劣法)医学英语写作英文教程40六、秩相关六、秩相关(等级相关等级相关)资料不满足双变量正态分布条件或等级资料资料不满足双变量正态分布条件或等级资料 Sp
17、earman秩(等级)相关系数秩(等级)相关系数医学英语写作英文教程411.双定量资料秩相关双定量资料秩相关例例3:某医生欲了解人群中氟骨症患病率(:某医生欲了解人群中氟骨症患病率(%)与饮水中氟含量(与饮水中氟含量(mg/L)之间的关系。随机)之间的关系。随机观察观察8个地区氟骨症患病率与饮水中氟含量,个地区氟骨症患病率与饮水中氟含量,数据如下表,计算等级相关系数数据如下表,计算等级相关系数。医学英语写作英文教程42表表 不同地区饮水中氟含量不同地区饮水中氟含量(mg/L)(mg/L)与氟骨症患病率与氟骨症患病率(%)(%)饮水中氟含量饮水中氟含量X氟骨症患病率氟骨症患病率Y0.4822.3
18、70.6423.311.0025.321.4722.291.6035.002.8635.003.2146.074.7148.31医学英语写作英文教程43表表 不同地区饮水中氟含量不同地区饮水中氟含量(mg/L)(mg/L)与氟骨症患病率与氟骨症患病率(%)(%)饮水中氟含量饮水中氟含量氟骨症患病率氟骨症患病率dd2X秩次秩次Y秩次秩次0.48122.372-110.64223.313-111.00325.324-111.47422.291391.60535.005.5-0.50.252.86635.005.50.50.253.21746.077004.71848.31800合计合计12.5医学
19、英语写作英文教程44Spearman秩相关系数秩相关系数:85.0)18(85.1261)1(61222nndrs医学英语写作英文教程452.列联表(双向有序变量)秩相关列联表(双向有序变量)秩相关级级/度度轻轻中中重重合合计计秩范围秩范围平均平均秩次秩次轻轻中中重重I35(8.5)12(74.5)6(121)531-53272528.756660387846II15(48)40(18)5(64.5)6054-11383.5345601296020801.25III20(103)10(37)20(9.5)50114-163138.5212180136901805合计合计706231163249
20、268.7593253110452.25秩范围秩范围1-7071-132133-163平均秩次平均秩次35.5101.51484529746276.0)1163(16345297461)1(61222nnfdrs例例4 肺结核肺结核X片肺门密度与病情的相关分析片肺门密度与病情的相关分析医学英语写作英文教程46七、定性资料七、定性资料(率、构成比率、构成比)的相关的相关1.临床观察慢性病(肿瘤)不同年龄(病情)术后年数死亡情况,临床观察慢性病(肿瘤)不同年龄(病情)术后年数死亡情况,问预后与年龄是否有关?问预后与年龄是否有关?(1)差异性检验差异性检验(2)相关性检验相关性检验术后术后年数年数2
21、04060合计合计校正观校正观察人数察人数Nij实际死实际死亡人数亡人数Oij期望死期望死亡人数亡人数Eij校正观校正观察人数察人数Nij实际死实际死亡人数亡人数Oij期望死期望死亡人数亡人数Eij校正观校正观察人数察人数Nij实际死实际死亡人数亡人数Oij期望死期望死亡人数亡人数Eij校正观校正观察人数察人数实际死实际死亡人数亡人数0.1.11.合计合计111iiO111iiE31jjO31jjN111iiO111iiE111iiO111iiEjijijjijijNNOEji)()()(期望死亡数观察组术后不同年例例5医学英语写作英文教程47(1)差异性检验)差异性检验术后术后年数年数204
22、060合计合计校正观察校正观察人数人数Nij实际死实际死亡人数亡人数Oij期望死期望死亡人数亡人数Eij校正观校正观察人数察人数Nij实际死实际死亡人数亡人数Oij期望死期望死亡人数亡人数Eij校正观校正观察人数察人数Nij实际死实际死亡人数亡人数Oij期望死期望死亡人数亡人数Eij校正观校正观察人数察人数实际死实际死亡人数亡人数0.1.11.合计合计31jjO31jjN111iiO111iiE111iiO111iiE111iiO111iiE)年龄组(j22)(iiiEEO医学英语写作英文教程48(2)相关性检验)相关性检验年龄年龄组号组号(i)OEi(O-E)iEi2E2016948.022
23、20.97848.02248.0224026783.890-33.780167.780325.5606031721.088-12.26463.264189.792合计合计153153-25.066279.066573.374EiEEiEOi2222)()(1,761.9)()(2222EiEEiEOiP0.05年龄越小,死亡率越高,预后越差。年龄越小,死亡率越高,预后越差。医学英语写作英文教程492.2XC表的相关表的相关(1)按数量(工龄)分组资料按数量(工龄)分组资料 例例6工龄(年)工龄(年)合计合计工人数(工人数(n)5210022419156113737(N)患病数(患病数(t)05
24、23351623102(T)患病率(患病率(%)0510.318.328.320.213.84组中值组中值0.51.535710Z=组中值组中值-5-4.5-3.5-2027tZ0-17.5-4603211583.5nZ-234-350-4480112570-350nZ2105312258960224285062481,04.243506248737)102737(102)350(1025.83737737)()(222222nZnZNTNTnZTtZNNP0.051,2921.0)597160)(116160(116)51166160(160)()(222222nZnZNTNTnZTtZNN
25、)5(21),3(21),1(21321CZCZCZ计分:计分:,其中,其中c是百分数个数是百分数个数医学英语写作英文教程51(3)百分率很小(大)时,使用简化式:百分率很小(大)时,使用简化式:NTneTeZeZetZ,1,/)()(2222医学英语写作英文教程52八、升降趋势检验八、升降趋势检验(1)将时间序列某指标值分两段(奇数舍中间数值)形)将时间序列某指标值分两段(奇数舍中间数值)形 成配对(成配对(),对子相减后得(),对子相减后得(+).0.(-)。)。(2)将()将(+)个数与()个数与(-)个数做)个数做n,以,以 min(+)个数,()个数,(-)个数)个数作作k,查,查k值表(旧统值表(旧统 计百科全书计百科全书P131)决定趋势。)决定趋势。医学英语写作英文教程53 End!医学英语写作英文教程54