1、卫生统计学小结张建端公共卫生学院一、统计学的几个基本概念变量及其类型 同质及其变异总体与样本参数与统计量抽样误差概率、小概率事件、小概率原理变量(variable)在进行医学科学研究时,需根据研究目的确定观察单位(observation unit),即研究中的个体(individual)。变量(variable):系指观察单位的某项特征,如身高、体重、血型、各种诊断指标、疗效等。变量值(value of variable):系指变量的观察结果。同质(homogeneity)同质是指性质相同的事物,即能影响观察指标的主要因素相同的事物。如某年某地同年龄同性别的儿童身高即为同质;又如同一疾病的患者
2、,如果性别相同、年龄、病程、病情等均相当,也属同质。变异(variation)变异是指同质事物之间的差异。遗传与环境因素的千差万别是变异的根本原因。例如同地区、同民族、同时期、同年龄、同性别的人的身高有高有矮,各不相同,这便是身高的变异;用相同的药物治疗患相同疾病的病人的疗效有好有差,这便是疗效的变异。总体(population)总体是根据研究目的所确定的同质观察单位的全体。准确的说,是同质观察单位某项观察指标的集合。根据总体中所包含个体的个数,又分为有限总体与无限总体。个体和样本个体(individual)是构成总体的最基本的观察单位。样本(sample)是从总体中随机抽取的一部分个体或个体
3、值。样本含量(sample size) 指样本中所包含的个体或个体值的个数。参数与统计量参数即指总体参数(parameter),是根据总体中每一个个体值计算出来的描述总体的特征量。统计量是指样本统计量(statistic),和总体参数相对应,根据组成样本的各个体值计算出来的描述样本的特征量称作统计量。抽样误差由于个体变异的客观存在,使得样本统计量常常不恰好等于相应的总体参数。这种因抽样所致的总体参数与相应的样本统计量之间的差异称抽样误差(sampling error)。概率概率(probability)是描述某事件发生的可能性大小的数值,用P表示。随机事件:指某事件发生的可能性介于01间,也即
4、0P1。不可能事件:指某事件发生的概率为0必然事件:指某事件发生的概率为1(100%)小概率事件与小概率原理小概率事件:指某随机事件的发生概率很小,统计上习惯将概率小于0.05的事件称之为小概率事件。小概率原理:小概率事件虽不是不可能事件,但在一次随机试验中难于发生,可以认为实际上不会发生。统统计计描描述述(descriptive statistics)点点估估计计(point estimation)区区间间估估计计(interval estimation)参参数数估估计计(parameter esitimation)假假设设检检验验(hypothesis testing)统统计计推推断断(i
5、nferential statistics)统统计计分分析析(statistical analysis)比较性方法比较性方法关联性方法关联性方法二、定量资料的统计描述描述集中趋势的指标 算术均数 几何均数 中位数 百分位数描述离散趋势的指标 极差 四分位数间距 方差标准差 变异系数正态分布及其作用 医学参考值范围 90,95,99 1.64 1.96 2.58三、计数资料的统计描述构成比 率 比应用相对数的注意事项u率 构成比u各组观察例数不同,总率u小样本 绝对数u比较相对数 可比性 标准化法的基本思想四、正态分布与t分布正态分布标准正态分布t分布xxXuxSXt区区别别点点 总总体体均均数
6、数可可信信区区间间 参参考考值值范范围围 含含 义义 按按预预先先给给定定的的概概率率,确确定定的的未未知知参参数数 的的可可能能范范围围。实实际际上上一一次次抽抽样样算算得得的的可可信信区区间间要要么么包包含含了了总总体体均均数数, 要要么么不不包包含含。但但可可以以说说: 当当 =0.05时时, 95%CI估估计计正正确确的的概概率率为为0.95, 估估计计错错误误的的概概率率小小于于或或等等于于0.05, 即即有有95%的的可可能能性性包包含含了了总总体体均均数数。 “正正常常人人”的的解解剖剖,生生理理,生生化化某某项项指指标标的的波波动动范范围围。 总总体体均均数数的的波波动动范范围
7、围 个个体体值值的的波波动动范范围围 计计算算 公公式式 n60: XXu或或XXu S* 正正态态分分布布:Xu S * 偏偏态态分分布布:PXP100 X 用用途途 总总体体均均数数的的区区间间估估计计 绝绝大大多多数数(如如 95%)观观察察对对象象某某项项指指标标的的分分布布范范围围 表表1 总体均数可信区间与参考值范围的区别总体均数可信区间与参考值范围的区别五、假设检验类错误和类错误不同资料类型的统计学方法资料类型统计方法计量资料t检验,u检验,方差分析,直线相关与回归计数资料卡方检验,u检验等级资料秩合检验00界值界值比较性统计方法T检验F检验 检验秩和检验2六、两个均数的比较六、
8、两个均数的比较ddSdzSdtztztnnXXznSXtnXz大样本小样本自正态总体)配对设计(配对差值来大样本小样本大样本小样本未知,、已知,、成组样本设计未知、未知,已知,单组样本设计已知2221222122212221212122212121012121012101/)(05. 0:211210HH七、方差分析单因素多均数的比较 完全随机设计的方差分析两因素多均数的比较 随机区组设计的方差分析多因素多均数的比较 拉丁方设计的方差分析八、卡方检验卡方检验的基本思想22()A TxTA 实际频数 T 理论频数四格表资料的X2检验(p95) 222()()()()nadbcnxab cdac bd列联表资料的2检验22(1)RCAxnn n配对资料的2检验22(1)bcxbc九、秩和检验参数检验 总体分布 非参数检验 参数 分布配对设计差值的符号秩和检验假设求差值编秩 绝对值, 小到大 ; 零不计;差值等,符号不同,平均秩次。求秩和,确定统计量确定P值,推断结论。 完全随机两样本比较秩和检验十、直线相关与回归重要概念 直线相关系数 完全负相关 正相关 等级相关 相关与回归区别和联系 u 区别 意义不同 直线相关 线性依存关系;u 回归 自变量 因变量u 联系 符号相同 ; 显著性检验 等价