1、t-t-检验和回归统计检验和回归统计t-t-检验检验t-t-均数间,均数间,统计上统计上,有无显著性差异有无显著性差异。(倾向)(倾向)正态分布正态分布X XS S为为11511586 86 mg/Lmg/LX X2S2S为为115115172 172 mg/Lmg/L (-57-57292 mg/L292 mg/L)t-t-检验检验t-t-检验检验(例例1 1)X Yd=X-Y X Yd=X-Y 4.0 4.2 -0.2 16.4 16.4 0 5.5 5.2+0.3 18.9 18.2+0.7 7.2 7.3 -0.1 21.7 21.8-0.1 9.0 8.8+0.2 25.2 24.4
2、+0.8 11.3 11.8 -0.5 X 13.27 Y 13.12 d+0.15 13.5 13.1+0.4 d=+0.15,d=+0.15,SdSd=0.409,=0.409,SdSd=0.129=0.129 t=1.16,tt=1.16,tt t0.050.05 结论是:结论是:X X和和Y Y方法对方法对1010例标本检测的例标本检测的结结果均值间,在统计上差异是不显著的。果均值间,在统计上差异是不显著的。直线回归为:直线回归为:r r=0.999 =0.999 t-t-检验(例检验(例1 1))/(22.097.0LmmolXYt-t-检验检验(例例2 2)X Yd=X-Y X Y
3、d=X-Y 4.0 4.2 -0.2 16.4 16.6 -0.2 5.5 5.7 -0.2 18.9 19.1 -0.2 7.2 7.4 -0.2 21.7 21.9 -0.2 9.0 9.2 -0.2 25.2 25.3 -0.2 11.3 11.5 -0.2 X 13.27 Y 13.47 d -0.2 13.5 13.7 -0.2 d=-0.2,d=-0.2,SdSd=0,=0,SdSd=0=0 t=,tt=,tt t0.0010.001 结论是:结论是:X X和和Y Y方法对方法对1010例标本检测的例标本检测的结结果均值间,在统计上差异是极其显著的。果均值间,在统计上差异是极其显著
4、的。直线回归为:直线回归为:r r=1.000 =1.000 t-t-检验(例检验(例2 2))/(2.0LmmolXYt-t-检验(例检验(例3 3)X Yd=X-Y X Yd=X-Y 4.0 6.0 -2.0 16.4 20.0 -3.6 5.5 4.0+1.5 18.9 15.0+3.9 7.2 10.0 -2.8 21.7 26.0 -4.7 9.0 7.0 -2.0 25.2 20.0+5.2 11.3 14.0 -2.7 X 13.27 Y 13.30 d -0.03 13.5 11.0+2.5t-t-检验(例检验(例3 3)d=-0.03,d=-0.03,SdSd=3.387,=
5、3.387,SdSd=1.071=1.071 t=0.028,tt=0.028,tt t0.050.05 结论是:结论是:X X和和Y Y方法对方法对1010例标本检测的例标本检测的结结果均值间,在统计上差异是不显著的。果均值间,在统计上差异是不显著的。直线回归为:直线回归为:r r=0.884 =0.884)/(69.187.0LmmolXY t t检验的计算如下:检验的计算如下:在方法学比较中,假设比较的在方法学比较中,假设比较的2 2个方法个方法无差异。即无差异。即2 2个方法对每份标本检测结个方法对每份标本检测结果的差为果的差为0 0。所以。所以m m为为2 2个方法结果差的个方法结果
6、差的总体均数为总体均数为0 0。t-t-检验在方法学比较中的意义检验在方法学比较中的意义XSXtm 在方法学比较时,在方法学比较时,t t检验中的检验中的X X为方为方法比较结果均值间的差(法比较结果均值间的差(X-YX-Y)。)。所以,所以,t t 检验写成:检验写成:t-t-检验在方法学比较中的意义检验在方法学比较中的意义dXSdSXtm t-t-检验还可以写成:检验还可以写成:t-t-检验在方法学比较中的意义检验在方法学比较中的意义ddSYXSdt随机误差系统误差t t-t-值的分子部分是方法学比较时,各个值的分子部分是方法学比较时,各个方法病人检验结果以均值为代表,以可方法病人检验结果
7、以均值为代表,以可靠方法均值为准,新方法均值与之比较靠方法均值为准,新方法均值与之比较的差异为偏倚(系统误差);分母部分的差异为偏倚(系统误差);分母部分是方法学比较时检验的随机误差。所以是方法学比较时检验的随机误差。所以 t-t-值为方法学比较中系统误差和随机值为方法学比较中系统误差和随机误差的比值。误差的比值。t-t-检验在方法学比较中的意义检验在方法学比较中的意义 t tt t0.050.05,说明方法学比较中的系统误差说明方法学比较中的系统误差显著大于随机误差。确实存在系统误差。显著大于随机误差。确实存在系统误差。所以:在统计上,均值间差异是显著所以:在统计上,均值间差异是显著的。的。
8、t t t t0.050.05,说明方法学比较中系统误差说明方法学比较中系统误差和随机误差差异不大,不一定存在系统和随机误差差异不大,不一定存在系统误差。所以:在统计上,均值间差异是误差。所以:在统计上,均值间差异是不显著的。不显著的。t-t-检验在方法学比较中的意义检验在方法学比较中的意义 注意:无论差异是否显著,和差异大小注意:无论差异是否显著,和差异大小无关,关键是差异的趋势。无关,关键是差异的趋势。临床只关心:方法间的差异有多大。不临床只关心:方法间的差异有多大。不是差异的趋势。因此,是差异的趋势。因此,t-t-检验不是方法检验不是方法学比较结果可否接受的指标。确定可否学比较结果可否接
9、受的指标。确定可否接受的有用统计是回归分析。接受的有用统计是回归分析。t-t-检验在方法学比较中的意义检验在方法学比较中的意义 t-t-检验数据受实验涉及和操作精密度的检验数据受实验涉及和操作精密度的严重影响。严重影响。T T和和SdSd呈反比,和呈反比,和n n呈反比。使呈反比。使t t值不值不可靠。可靠。t-t-检验在方法学比较中的意义检验在方法学比较中的意义nSdnSdSdtddd回归和相关的回顾回归和相关的回顾 欲了解两组有关联的实验数据间的数学欲了解两组有关联的实验数据间的数学关系,可以作回归统计。关系,可以作回归统计。必须先作图,看趋势,再统计。具有直必须先作图,看趋势,再统计。具
10、有直线趋势的,再作直线回归统计。线趋势的,再作直线回归统计。Yiiiyx,iiyx,abXYYX最小二乘法最小二乘法22iiiYYY22iiiiiiyyyyyy最小二乘法的统计意义最小二乘法的统计意义 直线回归统计的目的是对于具直线趋势直线回归统计的目的是对于具直线趋势的点,配合一条直线的点,配合一条直线 。回归统计的前提是假设回归统计的前提是假设X X和和Y Y间具依赖关间具依赖关系;系;Y Y随随X X而变异。而变异。当配合线确定后,每个当配合线确定后,每个XiXi下的原下的原YiYi和回和回归线上相应估计值归线上相应估计值 间的统计误差间的统计误差YiYi,是由是由 引入后所致。引入后所
11、致。abXYabXYiY 回归统计是使回归统计是使 为最小的方法。平方即二乘。最小二为最小的方法。平方即二乘。最小二乘法也即使平方和为最小。乘法也即使平方和为最小。最小二乘法的统计意义最小二乘法的统计意义22iiiYYY直线回归统计简要直线回归统计简要 收集收集n n对数据。对数据。列表归纳。列表归纳。ix2ixiy2iyiiyxix2ixiy2iyiiyx 求求3 3个基本统计量:个基本统计量:直线回归统计简要直线回归统计简要nxxxx222nyyyy222nyxxyyyxx 求直线回归的斜率和截距:求直线回归的斜率和截距:斜率:斜率:截距:截距:得回归式:得回归式:回归线的回归线的 标准(
12、误)差:标准(误)差:直线回归统计简要直线回归统计简要2xxyyxxbXbYa22/nyysxyabXY均值和回归线比较n n个检测值:个检测值:均值:均值:标准差:标准差:n n对检测数据:对检测数据:(归纳)(归纳)nxxx,21nxx12nxxs%)95(96.1sx abXY22/nyysxyxyxysabxsy/96.1)(%)95(96.1正态分布示意图 95%95%可能性:可能性:%)95(96.1sx 1xnxxsx96.1sx96.1回归线及其标准误差意义 回归线和数据点的关系:是n对数据点归纳的集中趋势。Sy/x是所有点对于回归线的离散程度指标。abXYxyiixyiisy
13、ysysxxsx/96.196.196.196.1xyisabx/96.1)(xyisabx/96.1)(在方法学比较使用回归统计 进行方法学比较时,关键是了解两比较进行方法学比较时,关键是了解两比较方法间具有的系统误差,即偏倚。方法方法间具有的系统误差,即偏倚。方法间无误差,间无误差,中中b b1 1,a a0 0。即即 b1b1,a0a0表示方法间具有偏倚。表示方法间具有偏倚。abXYxy 例例 (r r0.990.99)(x x范围范围3030460460)令:令:在方法学比较使用回归统计2082.0 xy偏倚偏倚 100 62 38 150 103 47 200 144 56 300
14、223 77 400 308 92xy yx关于相关系数 相关系数:是以X为准,求 的b。是以Y为准,求 的b。22yyxxyyxxr222yyyyxxxxyyxxrabxyaybxyxbxybyxbabxyxybaybx 若ybXa是二元一次代数式。如y3X1,b3 以Y为自变量,则 ,必有 即:1 有 因为组成线的点全部在线上因为组成线的点全部在线上。关于相关系数3131yx31 b1bbyxbxyb1,12rr 回归统计中,组成回归线的实验点很少回归统计中,组成回归线的实验点很少在线上。同一组数据,在线上。同一组数据,求:求:时,使时,使 为最小,为最小,时,使时,使 为最小。为最小。关
15、于相关系数abxyaybx2iy2ixyxxybb11yxxybb1 当当实验点和回归线越紧密,实验点和回归线越紧密,当当 为完全相关。(所有点都在线上)为完全相关。(所有点都在线上)r r反映方法比较中的操作精密度。反映方法比较中的操作精密度。和方法学比较系统误差无关。和方法学比较系统误差无关。关于相关系数1yxxybb1yxxybb1,12rr关于相关系数 如:如:y y3x3x1 1,r r1 1,说明说明x x和和y y间关系间关系及其密切(密切及其密切(密切相等),但相等),但y y至少是至少是x x的的3 3倍。倍。另外,方法比较实验中,比较样品实验另外,方法比较实验中,比较样品实验范围亦影响范围亦影响r r。r r0.9750.975表示实验浓度表示实验浓度分布适当,可以使用回归式进行误差分分布适当,可以使用回归式进行误差分析。析。