1、复习复习统计描述统计描述集中趋势:算术均数、几何均数、中位数集中趋势:算术均数、几何均数、中位数离散趋势:极差、四分位间距、方差、标准差、变离散趋势:极差、四分位间距、方差、标准差、变异系数异系数统计推断统计推断参数估计参数估计假设检验假设检验点估计点估计区间估计:区间估计:注意与参考值范围的区别和各自注意与参考值范围的区别和各自的应用的应用单个资料的单个资料的t检验检验 配对资料的配对资料的t检验检验成组资料的成组资料的t检验检验多组资料多组资料方差分析方差分析注意假设检验的基本注意假设检验的基本思想和注意事项思想和注意事项计量资料计量资料统计描述统计描述相对数:率、构成比、相对比相对数:率
2、、构成比、相对比统计推断统计推断计数资料计数资料参数估计:点估计和区间估计参数估计:点估计和区间估计假设检验:假设检验: 检验检验2第一节第一节 相对数相对数(Relative number)相对数的概念:相对数的概念: 两个有联系的(数值)指标之比。相对数的种类相对数的种类:比比: 1.构成比 2.相对比3.率率1. 率率 (Rate)概念概念:也称频率指标,全体观察单位中某种现象发生的频率或强度。计算公式计算公式: 发生某种现象的观察单位数 可能发生某种现象的观察单位数 K:100%(1000)例如:发病率、患病率、死亡率、病死率等。注意注意:不受其它指标的影响;各率相互独立,其之和不为1
3、(如是则属巧合); K病名平均人口数人数死亡率(1/10万)高血压172665 40 23.2冠心病172665 11 6.4恼卒中172665253146.5风心病172665 38 22.0某地某年四种常见心血管病死亡率某地某年四种常见心血管病死亡率2.构成比构成比(Proportion)概念概念:也叫构成指标,是指某一事物内部各组成部分所占的比重或分布。计算公式计算公式:某一组成部分的观察单位数 同一事物各组成部分的观察单位总数例如:疾病和死亡顺位等注意:各组成部分的构成比之和为100% 某一部分比重增大,则其它部分相应减少。100% 学历 人数构成比(%)本科 99 0.14大专 12
4、48 1.74中专53521 72.65无学历18763 25.47合计73667100.00某地某地1992年护理人员学历构成年护理人员学历构成构成比与率的区别构成比与率的区别 构成比各构成部分比重之和应为100%,某已构成部分的增减会影响其他部分构成比相应减少或增加 而某一部分率的变化并不影响其他部分的率,且其平均率不能简单地将其各率相加后平均求得 P=(x1+x2+x3)/(n1+n2+n3) 正确 P=(P1+P2+P3)/3 错误3.相对比相对比(Ratio)概念概念:是指两个有联系的指标之比,描述二者的相对水平,是对比的最简单形式。计算公式计算公式:A、B两个指标,A/B(或100
5、%) 若干倍或百分之几。例如:性别比、CV、相对危险度(RR)等。注意:A、B性质可以相同,也可以不同 第二节第二节 应用相对数时的注意事项应用相对数时的注意事项1、分析时不能以(构成)比代(替)率、分析时不能以(构成)比代(替)率2、计算相对数时分母不能太小、计算相对数时分母不能太小3、总率(平均率)的计算、总率(平均率)的计算:不能直接相加求和不能直接相加求和4、资料的可比性:两个率要在相同的条件下进行、资料的可比性:两个率要在相同的条件下进行. 研究研究方法相同、研究对象同质、观察时间相等、地区、民族、方法相同、研究对象同质、观察时间相等、地区、民族、年龄、性别等。年龄、性别等。5、样本
6、资料的比较应作假设检验样本资料的比较应作假设检验第三节第三节 标准化法标准化法什么是标准化?为什么要进行标(准)化? 内部结构不同的两组对象进行比较:例如A组病情严重者多,B组病情较轻的多,但要比较两种不同方法的治疗效果,结果会怎样?治 疗分 组旧疗法新疗法治疗人数痊愈人数治 愈 率%治疗人数痊愈人数治 愈 率%成人组1005050.020010050.0儿童组2002010.01001010.0合计3007023.330011036.7两种疗法疗效比较 从表中的合计看,新疗法的治愈率比旧疗法高。但分别观察成人组和儿童组的治愈率相同。其合计的差别之所以大,是由于两种疗法的选择的样本人群年龄构成
7、不同。新疗法成人所占比例高,而成人的治愈率高,造成总率较旧法高。要正确比较两法的疗效,需按照统一标准进行校正,然后进行比较。标准化的原因标准化的原因: 当两组资料进行比较时,如果其内部不同小组率有明显差别,而且各小组内部构成也明显不同 ,直接比较不合理,需要进行标准化后再进行比较。标准化的标准化的思想思想:按照统一标准进行校正,以消除由于构成不同对总率的影响,使算得的标化率有可比性。标准化法(Standardization method)标准化率的标准化率的计算计算1.选择标准选择标准:任意一组、两组之和、有代表性的人口2.计算标准化率计算标准化率p :直接法直接法: 已知标准组年龄别人口数时
8、:p = Ni pi /N 已知标准组年龄别人口构成时: p =(Ni / N) pi 间接法间接法: p = P r / ni pi = P SMRSMR:标准化死亡比,是对原总死亡率的校正 治疗分组标准治疗人 数旧疗法新疗法 原治预率%预期治预人数原治预率%预期治预人数成人组10050.05050.050儿童组20010.02010.020合计30023.37036.770新旧两种疗法的标准化治预率注意事项注意事项1.标准不同得到的标化值不同标准不同得到的标化值不同2.内部各小组比较时,可不标化内部各小组比较时,可不标化3.标化后的数值不再反映实际水平标化后的数值不再反映实际水平小小 结结
9、 构成比 相对比 率标准化:标准化法的目的是消除混杂因素对结果的影响 两地总死亡率比较两地总死亡率比较 结合专业知识考虑有混杂因素(如年龄)结合专业知识考虑有混杂因素(如年龄) 无无 同同 年龄与死亡率有关?年龄与死亡率有关? 两地人口年龄构成相同?两地人口年龄构成相同? 有有 不同不同 已知条件已知条件 (1)两地各年龄组死亡率)两地各年龄组死亡率pi(无(无明显交叉)明显交叉) (1)两地各年龄组人数)两地各年龄组人数ni及死亡总数及死亡总数r (2)标准组各年龄组人数标准组各年龄组人数Ni或构成比或构成比Ni /N (2)标准组各年龄组死亡率标准组各年龄组死亡率pi 及及总死亡率总死亡率
10、P 直接法:标化率直接法:标化率p = 间接法:间接法:SMR= ,标化率标化率p 标准化思路图标准化思路图第四节第四节 二项分布及其应用二项分布及其应用 二项分布是一种离散型的概率分布 是指在只能产生两种可能结果之一如阳性、阴性的n次独立重复实验中,当每次实验的阳性概率保持不变时,出现阳性的次数,x=0,1,2n的一种概率分布 B(n , )概率函数:概率函数:二项分布的条件二项分布的条件 每次实验结果只能是两个互斥结果之一每次实验结果只能是两个互斥结果之一 相同的实验条件下,每次实验中事件相同的实验条件下,每次实验中事件A的发生的发生具有相同的概率具有相同的概率(非(非A概率为概率为1-
11、) 各次实验独立,实验结果互不影响各次实验独立,实验结果互不影响二项分布图形与正态近似性二项分布图形与正态近似性 二项分布图取决于二项分布图取决于n和和,高峰在,高峰在=n 处处 当接近当接近0.5时,图形呈对称分布,当越远离时,图形呈对称分布,当越远离0.5时,时,越不对称越不对称 当当n ,只要,只要不太靠近不太靠近0或或1,(特别是当,(特别是当nP和和n(1-P)都大于都大于5时),二项分布近似于正态时),二项分布近似于正态分布分布二项分布图形二项分布图形第五节第五节 率的抽样误差与可信区间率的抽样误差与可信区间 一、率的抽样误差与标准误一、率的抽样误差与标准误 二、总体率的可信区间二
12、、总体率的可信区间一、一、 率的抽样误差与标准误率的抽样误差与标准误 从总体率为从总体率为的二项分布总体中随机抽取样本的二项分布总体中随机抽取样本含量为含量为n的样本,其阳性观察结果的样本,其阳性观察结果x以以p =x/n表示,表示,抽样误差大小为:抽样误差大小为:np)1 (如果总体率如果总体率未知,用样本率未知,用样本率p估计估计nppsp)1( 标准误的计算标准误的计算二、二、 总体率的可信区间总体率的可信区间 1. 正态分布法;正态分布法;当当n足够大,且足够大,且n p 和和n(1- p)均大于)均大于5时,时,p的抽样分布逼近正态分布。其可信区间为:的抽样分布逼近正态分布。其可信区
13、间为:双侧:双侧: (p - Z/2 Sp, p + Z/2 Sp) (Z0.05/2=1.96)单侧:单侧: p- Z Sp 或或 p + Z Sp (Z0.05=1.645) 如例6-1的p=0.1410,Sp =0.0125,该例的总体率双侧95%可信区间为(0.1410-1.960.0125,0.1410 +1.960.0125)=(0.1165,0.1655)即该地4060岁成年男子高血压总体患病率的95%可信区间为11.65%16.55%。注意:如果计算获得的可信区间下限小于0%,上限大于100%,则将下限直接定为0%,上限直接定为100%。2. 查表法查表法n 50,且,且p接近接近0或或1的资料时采用的资料时采用例例6-26-2某新药的毒理研究中,用某新药的毒理研究中,用2020只小白鼠作急性毒只小白鼠作急性毒性实验,死亡性实验,死亡3 3只,估计该药急性致死率的只,估计该药急性致死率的95%95%可信可信区间。区间。从附表从附表7 7(根据二项分布原理制成)查得,在(根据二项分布原理制成)查得,在n n=20=20与与X X=3=3纵列交叉处的数值为纵列交叉处的数值为3 3 3838,即该药急性致死率,即该药急性致死率的的95%95%可信区间为可信区间为3%3% 38%38%。