1、医学统计工作的基本步骤医学统计工作的基本步骤n设计(设计(design)n收集资料收集资料(collection of data)n整理资料整理资料(sorting data)n分析资料分析资料(analysis of data) 1. 1. 对照的原则对照的原则 2. 2. 随机的原则随机的原则 3. 3. 重复的原则重复的原则 4. 4. 均衡的原则均衡的原则 抵消比较组间疾病自然史不同的影响;抵消比较组间疾病自然史不同的影响; 抵消安慰剂效应;抵消安慰剂效应; 抵消除治疗措施以外其它因素的干扰。抵消除治疗措施以外其它因素的干扰。设立对照组的方法设立对照组的方法 把研究对象随机地分入对照组
2、和试验把研究对象随机地分入对照组和试验组进行比较,并要求它们之间具有可组进行比较,并要求它们之间具有可比性;比性; 各组应同时进行试验;各组应同时进行试验; 各组的例数应尽可能相等。各组的例数应尽可能相等。对照的形式对照的形式 1.1.空白对照空白对照 2. 2.实验对照实验对照 3. 3.标准对照标准对照 4. 4.自身对照自身对照 5. 5.相互对照相互对照 空白对照空白对照(blank control):对照组不加任何处理因素。对照组不加任何处理因素。 例如:实验组儿童接种疫苗,对照组儿童不接种疫苗。例如:实验组儿童接种疫苗,对照组儿童不接种疫苗。 试剂空白、血样空白、无酶解空白、底物空
3、白等。试剂空白、血样空白、无酶解空白、底物空白等。特点:特点: 简单易行,但容易引起心理差异,从而影响实简单易行,但容易引起心理差异,从而影响实验效应的测定。验效应的测定。 安慰剂对照安慰剂对照(placebo control) 实验对照实验对照(experimental control):施加基础施加基础实验条件(非处理因素)实验条件(非处理因素)。含赖氨酸面包含赖氨酸面包+非处理因素非处理因素赖氨酸赖氨酸效应效应 + 面包效应面包效应+非处理因素效应非处理因素效应 面包面包+非处理因素非处理因素 面包效应面包效应+非处理因素效应非处理因素效应赖氨酸赖氨酸 赖氨酸赖氨酸效应效应 非处理因素非
4、处理因素 +非处理因素效应非处理因素效应 标准标准对照对照(standard control):以现有的标准以现有的标准或正常值作对照。或正常值作对照。 例某种新的方法能否代替传统方法的研究;例某种新的方法能否代替传统方法的研究; 某病患者与正常人的某生理、生化指标是否相同。某病患者与正常人的某生理、生化指标是否相同。 实验室应用较多实验室应用较多 自身自身对照对照:实验:实验在同一受试对象上进行在同一受试对象上进行特点:特点: 简单易行,使用广泛。但若试验前后某些简单易行,使用广泛。但若试验前后某些环境或自身因素发生改变,并且会影响试验结环境或自身因素发生改变,并且会影响试验结果,就难以说明
5、问题。果,就难以说明问题。 相互相互对照对照 :几个实验组互相对照几个实验组互相对照例如:比较例如:比较几种药物几种药物治疗同一疾病的疗效治疗同一疾病的疗效 历史历史对照对照:以过去的研究结果作对照。以过去的研究结果作对照。 与本人或他人过去的研究结果作比较与本人或他人过去的研究结果作比较 不好!不好! 对照存在的问题对照存在的问题 未设对照组未设对照组 对照例数过少对照例数过少 对照不合理对照不合理2. 2. 均衡的原则均衡的原则 实验与对照必须遵守均衡的原则,亦称齐同实验与对照必须遵守均衡的原则,亦称齐同原则。即实验中要求实验对象除了要观察的某种原则。即实验中要求实验对象除了要观察的某种实
6、验因素外,其他一切条件应该尽可能相同。要实验因素外,其他一切条件应该尽可能相同。要求各处理组非实验因素的条件均衡一致,以消除求各处理组非实验因素的条件均衡一致,以消除非实验因素对实验的影响。非实验因素对实验的影响。随机化的意义随机化的意义 简单随机分组 随机化方法随机化方法 分层随机分组 顺序分配方法 3. 随机的原则随机的原则4. 4. 重复的原则重复的原则是消除非处理因素影响的重要手段是消除非处理因素影响的重要手段影响影响样本大小样本大小的因素的因素研究总体的变异程度研究总体的变异程度容许误差的大小容许误差的大小检验效能检验效能型错误的概率水准型错误的概率水准 重复重复(replicati
7、on)是指各处理组与对照组要有是指各处理组与对照组要有一定样本含量一定样本含量(sample sizes)。 无限地无限地增加样本含量,增加样本含量,将加大实验规模,延长实验将加大实验规模,延长实验时间,浪费人力物力,反而增加系统误差出现的可能性。时间,浪费人力物力,反而增加系统误差出现的可能性。 样本含量不足样本含量不足,检验效能(,检验效能(Power,1)偏低,)偏低,导致总体中本来具有的差异无法检验出来。导致总体中本来具有的差异无法检验出来。nX设设 计计n调查设计调查设计n实验设计(三要素)实验设计(三要素)n处理因素处理因素n受试对象受试对象n试验效应试验效应降压药降压药高血压病人
8、高血压病人血压值血压值处理因素处理因素受试对象受试对象实验效应实验效应三要素:三要素:1.处理因素;处理因素;2.受试对象;受试对象;3.实验效应实验效应其他因素其他因素其他效应其他效应文献文献收集收集设计设计提出课题提出课题调查调查设计设计实验实验设计设计普查普查抽样调查抽样调查典型调查典型调查病例对照调查病例对照调查定群调查定群调查基本形式基本形式明确目的、指标明确目的、指标 调查对象调查对象 调查人数调查人数 调查方法调查方法 收集资料方式收集资料方式 拟订调查表拟订调查表 整理分析计划整理分析计划 实施方案实施方案基本要求基本要求单纯随机单纯随机系统抽样系统抽样分层抽样分层抽样整群抽样
9、整群抽样完全随机完全随机 (两组、多组两组、多组)配对配对配伍配伍交叉交叉对对 照照均均 衡衡随随 机机重重 复复(样本大小样本大小) 基本形式基本形式基本原则基本原则写出写出综述综述盲法盲法整群抽样整群抽样单纯随机单纯随机系统抽样系统抽样分层抽样分层抽样收集收集资料资料资料资料整理整理核对核对分组分组质质量量分分组组数数量量分分组组资料资料陈述陈述统计表统计表统计图统计图图图 形形资料性质资料性质分分 析析 目目 的的 条图条图相互独立相互独立用直条的长短比较数值的大小用直条的长短比较数值的大小百分条图百分条图构成比构成比用长条各段的长度(面积)表达内部构成比用长条各段的长度(面积)表达内部
10、构成比圆图圆图构成比构成比用圆的扇形面积表达内部构成比用圆的扇形面积表达内部构成比线图线图连续性资料连续性资料用线段的升降表达事物的动态变化趋势用线段的升降表达事物的动态变化趋势直方图直方图数值变量的频数资料数值变量的频数资料用直方的面积来表达各组段的频数或频率用直方的面积来表达各组段的频数或频率散点图散点图双变量资料双变量资料用点的密集程度和趋势表达两个变量间的相关关系用点的密集程度和趋势表达两个变量间的相关关系统计图的选择适合图形统计图的选择适合图形统计学统计学分分 析析统计学统计学描描 述述统计学统计学推推 断断参数参数估计估计假设假设检验检验点估计点估计区间估计区间估计统计学描述统计学
11、描述计量资料计量资料n集中趋势集中趋势n (X X)nG GnM M、P Px xn离散趋势离散趋势nR RnQ Qn2 2 s s2 2n s snCVCV计数资料计数资料n相对数相对数n率率n构成比构成比n相对比相对比抽样误差抽样误差n数值变量资料数值变量资料n分类变量资料分类变量资料nx nSSx nP)1( nPPSP)1( 标准误标准误参数估计的方法参数估计的方法n点估计点估计n数值变量资料:数值变量资料:Xn分类变量资料:分类变量资料:P n区间估计区间估计参数估计的方法参数估计的方法(数值变量资料)(数值变量资料)n正常值范围正常值范围nXus 正态分布(注意单、双侧)正态分布(
12、注意单、双侧)nlg-1(xlgx uslgx) 对数正态分布对数正态分布nPX 偏态分布,不知分布类型偏态分布,不知分布类型n总体均数可信区间总体均数可信区间nx u x x 已知已知nx t ,v S Sx x 未知,且样本量较小未知,且样本量较小nx u S Sx x 未知,且样本量较大未知,且样本量较大参数估计的方法参数估计的方法(分类变量资料)(分类变量资料)n查表法:查表法: n50,特别是,特别是P接近接近0或或1时时n正态近似法:正态近似法: 样本样本n含量足够大,含量足够大,p或或1-p均不太小,均不太小,即:即:np和和n(1-p)均大于均大于5时时 P u S Sp p
13、x u S Sx xn建立假设:注意单侧还是双侧建立假设:注意单侧还是双侧n确定检验水准确定检验水准n选定检验方法,计算检验统计量选定检验方法,计算检验统计量n确定确定P P值,作出推断结论值,作出推断结论nt检验检验nu检验检验n方差分析方差分析nu检验检验n卡方检验卡方检验分类变量资料分类变量资料数值变量资料数值变量资料对资料性质的要求对资料性质的要求(数值变量资料)(数值变量资料)n各样本是相互独立的随机样本各样本是相互独立的随机样本n各样本都来自正态分布的总体各样本都来自正态分布的总体n各个总体方差齐各个总体方差齐样本均数与总体均数比较样本均数与总体均数比较XSxt0 XSxu0 1、
14、小样本均数与总体均数比较、小样本均数与总体均数比较2、大样本均数与总体均数比较、大样本均数与总体均数比较3、已知总体标准差时、已知总体标准差时nxu 0 V=n-1dSdt 4、配对资料、配对资料V=对子数对子数-12121XXSxxt 1、两小样本均数的比较、两小样本均数的比较V=n1+n2-22、两大样本均数的比较、两大样本均数的比较22212121nSnSxxu 1、样本率与总体率的比较、样本率与总体率的比较nppup)1( 2、两样本率的比较、两样本率的比较)11)(1(2121nnppppucc 卡方检验卡方检验基本思想?基本思想? TTAX22)(V=(行行-1)(列)(列-1)n
15、nnTCRRC 四格表四格表nT5T5,且且n40n40:直接使用不校正公式直接使用不校正公式n1T1T5 5,且且n40n40:用连续性校正用连续性校正X X2 2检验检验nT T1 1或或n n4040:用精确概率法用精确概率法 TTAX22)( TTAX22) 5 . 0()()()()(22dbcadcbanbcadX )()()()2(22dbcadcbannbcadX 处理处理有效有效无效无效1ab2cd配对设计配对设计cbcbX 22)(cbcbX 22) 1(b+c40 甲法甲法乙法乙法+-+ab-cdn要求:不能有要求:不能有1/5以上的格子理论频数以上的格子理论频数小于小于
16、5,或者不能有任意一个格子的理论,或者不能有任意一个格子的理论频数小于频数小于1。 122cRnnAnX单纯随机设计单纯随机设计: SS总总=SS组间组间+SS组内组内 V总总= V组间组间+ V组内组内 配伍设计配伍设计: SS总总 =SS处理组间处理组间+ SS区组间区组间+SS误差误差 V总总 =V处理组间处理组间+ V区组间区组间+V误误差差双变量的分析双变量的分析直线相关与回归直线相关与回归秩和检验秩和检验非参数检验非参数检验 非参数检验的适用范围非参数检验的适用范围: (1 1)有序分类资料(等级资料)有序分类资料(等级资料) (2 2)偏态分布资料)偏态分布资料 (3 3)有特大
17、特小值或数据的某一端有不)有特大特小值或数据的某一端有不 确定数值的资料(开口资料)确定数值的资料(开口资料) (4 4)分布不明的资料)分布不明的资料 适宜用参数检验的资料,若用非参数检验,常会损失适宜用参数检验的资料,若用非参数检验,常会损失信息,降低检验效能。故此时应首选参数检验。但若参信息,降低检验效能。故此时应首选参数检验。但若参数检验的条件得不到满足,则用非参数检验数检验的条件得不到满足,则用非参数检验.直线相关与回归直线相关与回归n直线相关:分析正态分布的两个随机变直线相关:分析正态分布的两个随机变量量x x与与y y是否有直线相关关系以及是否有直线相关关系以及相关的相关的性质和
18、相关的密切程度性质和相关的密切程度。n直线回归:探讨两个连续变量直线回归:探讨两个连续变量X X和和Y Y间间依依存关系存关系的一种统计学方法。的一种统计学方法。相关系数相关系数r的大小的大小 变量之间关联的密切程度变量之间关联的密切程度符号的正负符号的正负 关联的性质关联的性质回归系数回归系数b的大小的大小 斜率的大小斜率的大小符号的正负符号的正负 关联的性质关联的性质数值变量数值变量统计描述统计描述统计推断统计推断统计图表及描述集中统计图表及描述集中趋势和离散趋的指标趋势和离散趋的指标总体均数的估计,总体均数的估计,t t检验、检验、 u u检验、方差分析检验、方差分析无序分类无序分类有序
19、分类有序分类分类变量分类变量统计描述统计描述统计推断统计推断统计描述统计描述统计推断统计推断统计图表统计图表和相对数和相对数总体率的估计,率总体率的估计,率的的u u检验、检验、x x2 2检验检验统计图表统计图表和相对数和相对数秩和检验秩和检验1. 1. 随机将随机将2020只雌性大鼠均匀的分为甲、乙两组。甲组大鼠只雌性大鼠均匀的分为甲、乙两组。甲组大鼠不接受任何处理不接受任何处理( (即空白对照即空白对照) ),乙组中的每只大鼠接受,乙组中的每只大鼠接受3 3mg/kgmg/kg的内毒素,分别测得两组大鼠的肌酐的内毒素,分别测得两组大鼠的肌酐( (mol/L)mol/L)数据,请问内毒素对
20、肌酐水平有无影响?数据,请问内毒素对肌酐水平有无影响?甲组:甲组:5555,3333,5151,2424,3434,5454,5959,6969,3434,6161乙组:乙组:7575,6060,100100,8383,8282,6565,5050,7070,6464,72 72 分析用什么样的统计方法分析用什么样的统计方法2.2.某地抽样调查了某地抽样调查了280280名健康成年男性的血红蛋名健康成年男性的血红蛋白含量,其均数为白含量,其均数为136.0g/L136.0g/L,标准差为,标准差为6.0g/L6.0g/L。已知正常成年男性血红蛋白的均数为已知正常成年男性血红蛋白的均数为140.
21、0g/L140.0g/L。试问能否认为该地抽样调查的试问能否认为该地抽样调查的280280名成年男性的名成年男性的血红蛋白含量与正常成年男性的血红蛋白含量的血红蛋白含量与正常成年男性的血红蛋白含量的均数不同?均数不同?3. 某职业病防治所对某职业病防治所对31例石棉矿工中的石棉肺例石棉矿工中的石棉肺患者、可疑患者和非患者进行了用力肺活量患者、可疑患者和非患者进行了用力肺活量测定。问三组石棉矿工的用力肺活量有无差测定。问三组石棉矿工的用力肺活量有无差别?别?4.已知某样本中含已知某样本中含CaCO3的真值是的真值是20.7mg/L。现用某法重复测定该小样本现用某法重复测定该小样本15次,次,Ca
22、CO3含量含量(mg/L)分别为:)分别为:20.99,20.41,20.62, 20.75,20.10,20.00,20.80,20.91,22.60,22.30,20.99,20.41,20.50, 23.00,22.60。问该法测得的均数与真值有无。问该法测得的均数与真值有无差别?差别?5.5.应用某药治疗应用某药治疗8 8例高血压患者,观察患者治疗例高血压患者,观察患者治疗前后舒张压变化情况,如下表,问该药是否对高前后舒张压变化情况,如下表,问该药是否对高血压患者治疗前后舒张压变化有影响?血压患者治疗前后舒张压变化有影响?用某药治疗高血压患者前后舒张压变化情况用某药治疗高血压患者前后舒
23、张压变化情况病人编号病人编号治疗前治疗前治疗后治疗后1 96 882 112 1083 108 1024 102 985 98 1006 100 967 106 1028 100 926.根据全国儿童体质检测指标根据全国儿童体质检测指标2.5岁男童的岁男童的身高均数为身高均数为91.3cm,标准差,标准差2.6cm,今,今随机测得随机测得36名名2.5岁山区男童的平均身岁山区男童的平均身高为高为89.6cm。问山区。问山区2男童身高的均数男童身高的均数是否比一般男童低?是否比一般男童低?7.某厂医务室测定了某厂医务室测定了100名氟作业工人工名氟作业工人工前工后前工后4小时的尿氟浓度小时的尿氟
24、浓度(umol/L),问问氟作业工人在工作前后的尿氟浓度有无氟作业工人在工作前后的尿氟浓度有无差别?差别?n8.经长期临床观察,发现胃溃疡患者经长期临床观察,发现胃溃疡患者发生胃出血症状的占发生胃出血症状的占20%。现某医。现某医院观察了院观察了304例例65岁以上的老年胃岁以上的老年胃溃疡患者,有溃疡患者,有96例发生胃出血症状。例发生胃出血症状。问老年胃溃疡患者是否较一般患者问老年胃溃疡患者是否较一般患者更易发生胃出血?更易发生胃出血?9.通过以下治疗试比较使用含氟药膏与使用一般通过以下治疗试比较使用含氟药膏与使用一般牙膏者的龋齿患病率有何不同?牙膏者的龋齿患病率有何不同?牙膏类型牙膏类型
25、调查人数调查人数患龋齿人数患龋齿人数患龋率(患龋率(%)含氟牙膏含氟牙膏3009030一般牙膏一般牙膏20012060合计合计5002104210.某研究者用凝集试验和细菌培养两种方法,同某研究者用凝集试验和细菌培养两种方法,同时对时对65例慢性菌痢患者的粪便进行检查,结果如例慢性菌痢患者的粪便进行检查,结果如下表,问两种方法检出率是否有差别?下表,问两种方法检出率是否有差别?凝集法凝集法培养法培养法合计合计37(a)5(b)4210(c)13(d)23合计合计471865两种方法检出结果两种方法检出结果11.欲比较某市甲乙两院的治疗水平,得到下表,欲比较某市甲乙两院的治疗水平,得到下表,应采
26、用何方法?应采用何方法?某市甲乙两院各科出院和治愈人数某市甲乙两院各科出院和治愈人数科室科室甲甲 院院乙乙 院院出院人数出院人数治愈人数治愈人数治愈率治愈率(%)出院人数出院人数治愈人数治愈人数治愈率治愈率(%)内内 科科68721130.712186931.65妇妇 科科45639887.2848641284.77小儿科小儿科23921991.6325222890.48外外 科科20519895.5969866795.56合合 计计1587102664.651654137683.1912.在脑血管疾病的诊断治疗中,脑脊液白在脑血管疾病的诊断治疗中,脑脊液白细胞介素细胞介素-6(IL-6)水平是影响预后分水平是影响预后分析的一项重要指标,但临床上脑脊液不析的一项重要指标,但临床上脑脊液不容易采集,某医生欲通过容易测定的血容易采集,某医生欲通过容易测定的血清清IL-6估计脑脊液中估计脑脊液中IL-6水平。水平。判别下列公式各代表什么意义?判别下列公式各代表什么意义?样本中样本中95%正常值的范围正常值的范围总体均数总体均数95%的可信区间的可信区间总体中总体中95%样本均数的范围样本均数的范围总体率总体率95%的可信区间的可信区间