1、医学统计学 :复习 统计描述(Statistical Description) 统计推断(Statistical Interference) 正偏态正偏态 负偏态负偏态 对称对称 定量资料:频数表和频数图定量资料:频数表和频数图 离散程度离散程度 ( (分散性或变异度分散性或变异度 ) ) 统计描述的目的:统计描述的目的:揭示样本资料的分布特征揭示样本资料的分布特征 集中趋势集中趋势 ( (位置位置) ) 正态数据 非正态数据 n x n XXX X n 21 0X i21 n n XXXG M M 50%50% 50%50% P25 M P75 25% 25% 25% 25% 1 )( 2
2、2 n xx S 定性资料描述:相对数 K 同时期实际发生某现象的观察单位数 频率 某时期可能发生某现象的观察单位总数 K 观察时段内某现象的发生数 速率 可能发生某现象的观察人时数 %100 观察单位总数同一事物各组成部分的 位数某一组成部分的观察单 构成比 %)100(或 乙指标 甲指标 相对比 发病率、患病率发病率、患病率 年发病率年发病率 死因构成、门诊病人构成死因构成、门诊病人构成 RR 、OR、SMR、CV、出生性别比、出生性别比、 病床病床/护工比护工比 动态数列描述 累计增长量报告期指标值某固定期指标值 0 aan 逐年增长量报告期指标值相邻前期指标值 1 nn aa 定基比发
3、展速度: 环比发展速度: 定基比增长速度: 环比增长速度: 0 / n aa 1 / nn aa 0 / n aa1 1 / nn aa 1 被标化组被标化组 标准组标准组 年龄组年龄组 人口数人口数 死亡数死亡数 死亡率死亡率 人口数人口数 死亡数死亡数 死亡率死亡率 1 n1 r1 p1 N1 R1 P1 2 n2 r2 P2 N2 R2 P2 3 n3 r3 p3 N3 R3 P3 I ni ri Pi Ni Ri Pi k nk rk pk Nk Rk Pk 合计合计 n r p N R P 率的标准化 N pN p ii i i p N N p)( SMRP Pn r Pp ii 直
4、接法直接法 间接间接法法 标题 心理 分值 例 数 吸烟率(%) 饮酒率(%) 体育锻炼率(%) 1 252 70.8 52.3 31.2 2 253 69.4 55.5 30.8 3 252 70.7 53.1 30.1 4 253 71.7 52.8 29.8 P值 0.41 0.13 0.37 表21.5 某年某地居民不同心理分值的冠心病危险因素水平比较 纵标目 横标目 线 条 数字 图21.1 东北三省1990年、2000年、2010年人口数比较 标题 纵标目 刻度 图例 统计表统计表 统计图统计图 统计图的选择统计图的选择 统计图掌握什么情况下用什么图:统计图掌握什么情况下用什么图:
5、 1 1. .相互独立资料间的某个或多个指标的比较相互独立资料间的某个或多个指标的比较-条图条图 2 2. .连续变量的频数分布连续变量的频数分布-直方图直方图 3 3. .构成比构成比-圆图或百分条图圆图或百分条图 4 4. .描述指标的变化趋势描述指标的变化趋势-线图线图 5 5. .比较指标的变化速度比较指标的变化速度-半对数线图半对数线图 6 6. .两种现象的相关关系两种现象的相关关系-散点图散点图 统计描述(Statistical Description) 统计推断(Statistical Interference) 4.804.604.404.20 0.2 0.1 0.0 4.8
6、4.64.44.2 0.2 0.1 0.0 4.804.604.404.20 0.2 0.1 0.0 4.804.604.404.20 0.2 0.1 0.0 n=5 n=10 n=20 n=50 统计推断的原理:寻找样本统计量的分布规律 标准差和均数的标准误的区别和联系 标准差标准差 均数的标准误均数的标准误 计算计算 公式公式 2 () 1 XX S n X S S n 统计学统计学 意义意义 标准差越小, 个体值相对 越集中, 均数对数据的代 表性越好。 标准误越小, 样本均数的分 布越集中, 样本均数与总体 均数的差别越小, 抽样误差 越小, 由样本均数估计总体 均数的可靠性越大。 用
7、途用途 描述个体值的变异程度 描述均数的抽样误差大小 联联 系系 n S S X 构建样本统计量概率分布的前提:变量变换 1 n nS X S X t X x Z T TA 2 2 )( 1 n F=S12/S22 v1=n1-1、 v2=n2-1 概率概率曲线曲线下面积分布下面积分布规律:正态分布规律:正态分布 标准正态分布标准正态分布 正态分布正态分布 面积或概率面积或概率 -11 -1.645-1.645 1.645 68.27% 90% -1.961.96 1.96 95% -2.582.58 2.58 99% 双侧t0.05/2,92.262单侧t0.025.9 单侧t0.05,91
8、.833 双侧t0.05/2,1.96单侧t0.025, 单侧t0.05, 1.64 t分布曲线下面积 卡方分布、卡方分布、F F分布分布 统计推断:统计推断:1 1) )总体均数的估计总体均数的估计 2) 2)假设检验假设检验 pSX、 参数的估计 点估计:由样本统计量 直接估计总体参数 缺点: 没有考虑抽样误差。 区间估计:在一定可信度下,同时 考虑抽样误差。 、 A 已知的 样本均数 B , 1)( , 2/2/ tttP X s X t -t, t, 2.5% 2.5% 0 1)( , 2/2/ t S X tP X 由于由于: 则:则: (1 1) 未知未知,且且n n小:小:按按
9、t 分布原理计算置信区间。分布原理计算置信区间。 (2 2) 未知,但未知,但n n足够大时足够大时(n100),t 分布逼近分布逼近 z 分布。按分布。按 z 分布原理计算置信区间。分布原理计算置信区间。 , 1)( 2/2/ zzzP z -z X s X z 1)( 2/2/ z S X zP X 由于: 则: 建立假设,确定检验水准建立假设,确定检验水准 确定确定P值值 计算检验统计量计算检验统计量 作推断结论作推断结论 拒绝拒绝H0,接受,接受H1, , 认为差异有统计学意义认为差异有统计学意义 P P P P 不拒绝不拒绝H0, 认为差异无统计学意义认为差异无统计学意义 21 12
10、 /2,10 /2,1 12 /2,2 12 / /0 11 0 是是否否包包含含 是是 样样本本均均数数与与总总体体均均数数比比较较的的 检检验验 配配对对 检检验验 成成组组 检检验验 否否包包含含 是是否否包包含含 d n ndd nnc xtSn dtSn xxS nn t t t t 22 A:不拒绝不拒绝H0假设,前后差值的假设,前后差值的CI包含包含0 B:拒绝拒绝H0假设,血压有变化,但差值假设,血压有变化,但差值 的的CI提示没有临床意义提示没有临床意义 H0: d=0 C:拒绝拒绝H0假设,血压有变化,差值的假设,血压有变化,差值的CI提示提示 可能有临床意义可能有临床意义
11、 D:拒绝拒绝H0,血压有变化,差值的,血压有变化,差值的CI提示有临床意义提示有临床意义 d5mmHg 23 置信区间的解释置信区间的解释 区别区别 总体均数置信区间总体均数置信区间 医学参考值范围医学参考值范围 意义意义 按一定的置信度按一定的置信度( (1) )估计总体均数所估计总体均数所 在的范围在的范围 绝大多数 “正常人” 的某项解剖、 生理、绝大多数 “正常人” 的某项解剖、 生理、 生化指标的波动范围生化指标的波动范围 计算计算 公式公式 未知:未知:( ( XX StXStX , 2/, 2/ , ) ) 未知而未知而n n较大:较大: ( ( XX SZXSZX 2/2/
12、, ) ) 已知:已知:( ( XX ZXZX 2/2/ ,) ) 正态分布:正态分布: 双侧,双侧, ( ( SXSX 2/2/ , ) ) 单侧,单侧,( ( ,XS ) )或 或( ( SX , ) ) 偏态分布:偏态分布: 双侧,双侧, x P x P 100 单侧,单侧,( (, x P ) )或或( (- -, , x P 100 ) ) 用途用途 估计总体均数所在的范围估计总体均数所在的范围 判断观察对象的某项指标正常与否, 为判断观察对象的某项指标正常与否, 为 临床诊断提供参考临床诊断提供参考 表表6.5 总体均数置信区间与医学参考值范围的区别总体均数置信区间与医学参考值范围
13、的区别 置信区间与医学参考值置信区间与医学参考值 H H0 0: : 0 H H1 1: : 0 I类错误,类错误, 判断正确,判断正确,1-b b II类错误,类错误,b b 判断正确,判断正确,1- 25 假设检验的两类错误假设检验的两类错误 统计学中的两类错误 假设检验的两类错误表 实际实际 情况情况 检验结果检验结果 拒绝拒绝H0 不拒绝不拒绝H0 H0正确正确 I类错误类错误( ) 结论正确结论正确(1- ) H1正确正确 结论正确结论正确(1-b b) I类错误类错误(b b) 26 假设检验的选用原则 27 变量变换或秩和检验变量变换或秩和检验 1 n nS X t / 0 t
14、检验检验 变量变换或秩和检验变量变换或秩和检验 例数例数 n 50 正态正态 偏态偏态 两两 独独 立立 样样 本本 假假 设设 检检 验验 单单 样样 本本 配配 对对 资资 料料 差值差值 正态正态 偏态偏态 1, / 0 n ns d t d 对子数对子数 t 检验检验 n 50 例数例数 正态正态 偏态偏态 n 50 方差齐方差齐 t 检验检验 ) 11 ( 21 21 nn S XX t c 2 21 nn 方差不齐方差不齐 方差齐方差齐 变量变换或秩和检验变量变换或秩和检验 t检验检验 2 2 2 1 2 1 21 n S n S XX t 11 )( 2 4 1 4 222 21
15、 2 1 n S n S SS xx xx 28 1.对于两组二分类对于两组二分类22四格表四格表: n 40且所有且所有T5 n 40但有但有1T5 n 40或有或有T1 四格表资料假设方法的选择四格表资料假设方法的选择1 : T TA 2 2 )( )()()( )( 2 2 dbcadcba nbcad )()()( )2/( 2 2 dbcadcba nnbcad ! )!()!()!()!( ndcba dbcadcba p 29 T TA 2 2 ) 2 1 ( 2. 对于配对四格表资料:对于配对四格表资料: 1. b+c 40 2. b+c 40 c b c b 2 2 ) (
16、) ( c b c b 2 2 1 四格表资料假设方法的选择四格表资料假设方法的选择2 : 30 3. RC列联表资料的2检验: 行行列表资料列表资料假设方法的选择假设方法的选择3 : R ij ji ij mn A n 1 2 2 2 2 1 k i i ii T TA 1 2 2 无序资料无序资料 有序资料有序资料 秩和检验秩和检验 31 考试说明 题型:选择题 内容:仅限于书本上过课的章节(二项分布及应用、拟合优度检验不考) 假设检验公式(t检验、卡方检验)需要看懂,但不需要会默写 复习以书本为准,课件供参考 课件、习题答疑及SPSS软件/教程已上传至公共邮箱: medstat2014 密码:med123456 联系方式:陶韬 48141967 谢谢!预祝考试成功!