1、医学统计学医学统计学复习提纲复习提纲临床临床5年制年制医学统计学(李琳琳)8 总复习1医学统计学(李琳琳)8 总复习2统计资料的分型原则:根据变量的类型统计统计资料资料计量资料:计数资料:等级资料对每个观察单位用定量方法测定某项指标的大小,所得的资料叫计量资料,有度量衡单位,变量为数值变量。将观察单位按某一属性来分类计数所得的资料。变量为分类变量中的无序分类。将观察单位按某一属性的不同程度来分类计数的资料。变量为分类变量中的有序分类。医学统计学(李琳琳)8 总复习3医学统计学(李琳琳)8 总复习4 定义定义通过测量得到数据资料通过测量得到数据资料数值变量分布类型分布类型离散离散程度程度指标指标
2、集中集中趋势趋势指标指标医学统计学(李琳琳)8 总复习5集中趋集中趋势指标势指标算术均数:用于正态分布资料算术均数:用于正态分布资料几何均数:用于等比数列和等级资料几何均数:用于等比数列和等级资料公式:小样本(直接法)公式:小样本(直接法)大样本(频数表法)大样本(频数表法)百分位数法:百分位数法:特例:中位数:适用偏态资料特例:中位数:适用偏态资料 )%(LxfnxfiLP1.直接法:小样本(奇数和偶数)直接法:小样本(奇数和偶数)2.频数表法:大样本公式同百分位数法频数表法:大样本公式同百分位数法 M=P50医学统计学(李琳琳)8 总复习6离散程离散程度指标度指标变量变量之间之间均数均数之
3、间之间全距:全距:简单明了,但不够全面简单明了,但不够全面方差:方差:变异系数:变异系数:适用不同单位和均数相差较大资料适用不同单位和均数相差较大资料标准差:标准差:直接法和频数表法直接法和频数表法应用:应用:计算计算CV;估计正常估计正常值范围;值范围;描述变量值的离散描述变量值的离散程度;程度;计算标准误计算标准误1/)(1222nnXXnXXSXS%100/XSCV 标标 准准 误误1.公式:公式:2.应用:应用:描述样本均数间的离散描述样本均数间的离散程度;程度;估计总体均数的置信区间;估计总体均数的置信区间;用来进行两个均数差异的检验;用来进行两个均数差异的检验;描述样本均数的可靠程
4、度。描述样本均数的可靠程度。nSSnXXX/;/2医学统计学(李琳琳)8 总复习7医学统计学(李琳琳)8 总复习8分类变量 定义定义通过计数得到数据资料通过计数得到数据资料相相对对数数动动态态数数列列2检验检验医学统计学(李琳琳)8 总复习9相对数相对数率率比例基数单位总数可能发生某现象的观察数发生某现象的观察单位构成比构成比%100观察单位总数同一事物各组成部分的位数某一组成部分的观察单相对比相对比BA医学统计学(李琳琳)8 总复习10医学统计学(李琳琳)8 总复习11图4.某地5岁以下儿童死因分布0%10%20%30%40%50%60%70%80%90%100%呼吸系疾病传染病先天缺陷其它
5、百分条图百分条图Percent bar 条图条图 bar graph直方图直方图 Histogram图5.某地5岁以下儿童死亡原因分布43%30%18%9%呼吸系疾病传染病先天性疾病其它圆图圆图/饼图饼图 Pie chart线图线图 Line graph半对数线图半对数线图 semi-logarithmic Line graph箱图箱图 Box plot散点图散点图 Scatter 统计地图统计地图 Map常用的常用的统计图统计图医学统计学(李琳琳)8 总复习12类型适用条件意 义1条图相互独立的资料,横轴为间断独相互独立的资料,横轴为间断独立的分组立的分组直条长短表示统计指标的大小,及直条长
6、短表示统计指标的大小,及相互的对比关系相互的对比关系2圆图百分构成比资料百分构成比资料用圆的扇形面积表达各部分的百分用圆的扇形面积表达各部分的百分构成构成3 百分条图用长条各段长度(面积)表达各部用长条各段长度(面积)表达各部分的百分构成分的百分构成4线图连续性连续性资料,资料,分类资分类资料料横轴为年龄、时间等动横轴为年龄、时间等动态性变量态性变量用线段的升降表示事物动态变化用线段的升降表示事物动态变化(绝对差值)(绝对差值)5半对数线图用线段的升降表示事物的发展速度用线段的升降表示事物的发展速度(相对比)(相对比)6散点图双变量资料,双变量资料,横轴代表自变量纵横轴代表自变量纵轴则代表与其
7、有依存关系因变量轴则代表与其有依存关系因变量用点的密集程度或趋势反映两变量用点的密集程度或趋势反映两变量的相关关系,用于相关回归分析的相关关系,用于相关回归分析7直方图连续性资料,横轴为年龄、时间连续性资料,横轴为年龄、时间等动态性变量或分组等动态性变量或分组用直条长度(面积)表达各组段的用直条长度(面积)表达各组段的大小或频数大小或频数8 统计地图地域性资料地域性资料用点的疏密或颜色的深浅表示某现用点的疏密或颜色的深浅表示某现象的数量在地域上的分布象的数量在地域上的分布9箱式图连续型变量连续型变量用用“箱箱”和和“触须触须”等的位置表示等的位置表示变量的分布特征。变量的分布特征。各种类型统计
8、图的适用条件及意义各种类型统计图的适用条件及意义医学统计学(李琳琳)8 总复习13医学统计学(李琳琳)8 总复习14正态分布密度曲线的特征正态分布密度曲线的特征 1.始终位于横轴上方 2.集中性:正态曲线在横轴上方均数处最高。3.对称性:关于x=对称,即以均数为中心,左右对称。4.在x=处取得该概率密度函数的最大值5.正态分布的图形由均数和标准差两个参数决定。位置参数;变异度参数医学统计学(李琳琳)8 总复习15是位置参数,当固定不变时,越大,曲线沿横轴越向右移动;反之,越小,则曲线沿横轴越向左移动。是形状参数,当固定不变时,越大,曲线越平阔;越小,曲线越尖峭。医学统计学(李琳琳)8 总复习1
9、6医学统计学(李琳琳)8 总复习17 1.t分布是一簇曲线。t分布有一个参数,即自由度,与标准差的自由度一致。2.t分布曲线以0为中心,左右对称;越小,t变量值的离散程度越大,曲线越扁平。3.t分布曲线较标准正态曲线要扁平些(高峰低些,两尾部翘得高些),逐渐增大,t分布曲线逐渐的逼近于标准正态曲线,若,则t分布曲线和标准正态曲线完全吻合。医学统计学(李琳琳)8 总复习18 分分 布布 类类 型型正态分布正态分布t分布分布1.特点:较集中而有对称性特点:较集中而有对称性2.应用:应用:正常值估计正常值估计、置信限置信限、总体总体均数估计均数估计。XXSXSXSXSX58.2;58.2:%9996
10、.1;96.1:%95u检验检验(样本与总体和两样本均数样本与总体和两样本均数)1.条件:正态或近似正态分布条件:正态或近似正态分布2.判断结果:判断结果:u1.96;P0.05无无 u1.96;P0.05有有1.特点:自由度较小时,曲线峰低尾长,特点:自由度较小时,曲线峰低尾长,自由度较大时,接近正态分布。自由度较大时,接近正态分布。2.应用:以样本估计总体均数的范围。应用:以样本估计总体均数的范围。XXStXStX,置信限:置信限:01.005.0%99%95 t检验检验 1.两均数间的比较两均数间的比较。2.判断标准:判断标准:查查t界值表;界值表;tt0.05,;P0.05无无 tt0
11、.05,;P0.05有有F分布分布医学统计学(李琳琳)8 总复习19医学统计学(李琳琳)8 总复习20医学统计学(李琳琳)8 总复习21医学统计学(李琳琳)8 总复习22医学统计学(李琳琳)8 总复习23两均数间的比较两均数间的比较样本均数与总样本均数与总 体均数比较体均数比较两样本均数两样本均数 的比较的比较 配对资料配对资料 的比较的比较条件:方差条件:方差齐性检验齐性检验医学统计学(李琳琳)8 总复习24t检验检验 小结小结 完全随机设计两组间定量资料的比较完全随机设计两组间定量资料的比较各样本是否来自正态总体?各样本是否来自正态总体?两样本总体方差是否齐性?两样本总体方差是否齐性?t检
12、验检验变量变换变量变换是是是否秩和检验秩和检验否否t检验检验否变量变换变量变换是医学统计学(李琳琳)8 总复习25变量变换或秩和检验变量变换或秩和检验t 检验检验方差不齐方差不齐方差齐方差齐t 检验检验221nn)11(2121nnSXXtc22212121nSnSXXt11)(24142222121nSnSSSxxxx变量变换或秩和检验变量变换或秩和检验1nnSXt/0t 检验检验正态正态偏态偏态两独立样本假设检验单样本方差齐性检验:方差齐性检验:(较小)(较大)2221SSF 1=n1-1,2=n2-1 正态正态偏态偏态医学统计学(李琳琳)8 总复习26医学统计学(李琳琳)8 总复习27列
13、联表列联表2检验检验用于两个率(两个构成比)或用于两个率(两个构成比)或多个率(多个构成比)比较多个率(多个构成比)比较1.基本方法:基本方法:2.每种方法的使用条件:每种方法的使用条件:3.判断结果:判断结果:=(R-1)()(C-1)有无,05.0;05.0;2,05.022,05.02PP4.四格表法:四格表法:5.行乘列表法:行乘列表法:医学统计学(李琳琳)8 总复习28对于成组分类数据的 22 表:a n 40且所有T 5 b n 40但有 1 T5 c n 40或有T1 对于配对分类数据的 22 表 a)b+c 40 b)b+c 40 四格表资料的方法选择四格表资料的方法选择cbc
14、bcbcb2222)1()()()()()(22dbcadcbanbcad)()()()2/(22dbcadcbannbcad!)!()!()!()!(ndcbadbcadcbapTTA22)(TTA22)21(医学统计学(李琳琳)8 总复习29行列表资料的行列表资料的2 2检验检验)1(22CRnnAn医学统计学(李琳琳)8 总复习30医学统计学(李琳琳)8 总复习31非参数统计非参数统计秩和检验:秩和检验:用于分布不清和等级资料。用于分布不清和等级资料。方法:方法:配对、两样本秩和检验。配对、两样本秩和检验。重点:重点:掌握原理,与掌握原理,与参数统计参数统计相比的区别?相比的区别?该法既
15、能分析定量变量资料,又能分析有序变该法既能分析定量变量资料,又能分析有序变量或等级变量资料,在不符合参数统计方法量或等级变量资料,在不符合参数统计方法条件时,用秩和检验;对有序变量或等级变条件时,用秩和检验;对有序变量或等级变量资料,如果是量资料,如果是疗效检验疗效检验,用秩和检验,不,用秩和检验,不用用2检验,这种情况实际中容易误用。检验,这种情况实际中容易误用。22医学统计学(李琳琳)8 总复习32医学统计学(李琳琳)8 总复习33相关、回归分析相关、回归分析直线相关:直线相关:用于用于正态双变量资料正态双变量资料yyxxlllxyYYXXYYXXr22)()()(1.求相关系数公式:求相
16、关系数公式:pearson2.判断标准:判断标准:=n-2 r0.05;P0.05 无相关无相关 r0.05;P0.05 有相关有相关3.r=01 正相关,正相关,r=-10 负相负相关关,r1关系不密切关系不密切4.检验方法检验方法:t检验和检验和F检验检验直线回归:直线回归:bXaY求回归方程和回归线求回归方程和回归线1.求回归系数求回归系数b和截距和截距a2.列方程列方程3.检验方程检验方程 方法同相关方法同相关4.注意问题注意问题医学统计学(李琳琳)8 总复习34试分析慢性气管炎与否与吸烟试分析慢性气管炎与否与吸烟 方式的关系两种属性方式的关系两种属性的关联性。的关联性。医学统计学(李
17、琳琳)8 总复习35【资料特点】【资料特点】是关于是关于两个变量两个变量的的一份随机样本一份随机样本。或说:一份随机样本,同时按两种属性分类,形成一个或说:一份随机样本,同时按两种属性分类,形成一个22交叉分类表,也称的交叉分类表,也称的22列联表列联表。目的:目的:慢性气管炎的有无慢性气管炎的有无和和吸烟方式吸烟方式两个变量之间的相关两个变量之间的相关性,即讨论两个属性概率分布的关系。性,即讨论两个属性概率分布的关系。如果一种属性的概率分布与另一种属性的概率分布无关,如果一种属性的概率分布与另一种属性的概率分布无关,则称这则称这两种属性相互独立两种属性相互独立(independence),)
18、,否则称这两种属否则称这两种属性之间性之间存在关联性存在关联性(association)。医学统计学(李琳琳)8 总复习361.假设检验证实两变量是否存在关联:假设检验证实两变量是否存在关联:医学统计学(李琳琳)8 总复习37 22配对资料的关联分析配对资料的关联分析例例11-7 有有132份食品标本,把每份标本一分为二,分别用两种检验份食品标本,把每份标本一分为二,分别用两种检验方法作沙门菌检验,结果如表方法作沙门菌检验,结果如表11-5,试问两种检验方法的结果是否,试问两种检验方法的结果是否存在关联?存在关联?医学统计学(李琳琳)8 总复习38【资料特点】【资料特点】是关于一份随机样本,同时按两种属性分类 是22配对资料。目的:了解两种方法的结果之间是否有关联。方法:两种属性的关联性分析。)()()()(22dbcadcbanbcad检验统计量:检验统计量:医学统计学(李琳琳)8 总复习394.3.相关分析相关分析回归分析回归分析医学统计学(李琳琳)8 总复习40考考 试试期末和流行病学期末和流行病学一起考试一起考试笔试题型笔试题型满分满分50分分名词解释名词解释 选择选择单选单选 简答题简答题 综合应用题综合应用题医学统计学(李琳琳)8 总复习41医学统计学(李琳琳)8 总复习42