1、中医临床研究设计及统计分析中医临床研究设计及统计分析第一章第一章 制定中医证候宏观辩证量表制定中医证候宏观辩证量表:统一辩证标准统一辩证标准第一节第一节 现时中医证候宏观标准产生的背景现时中医证候宏观标准产生的背景1.古代医家论述、医案记载;古代医家论述、医案记载;2.现代教材描述现代教材描述;3.学术机构的制定学术机构的制定;4.政府有关部门组织专家制定政府有关部门组织专家制定;5.来源于一定范围的临床流行病学研究来源于一定范围的临床流行病学研究;就第就第2、3、4 项与第项与第 5 项结合项结合,阐述其制定方法阐述其制定方法.第二节第二节 中医证候宏观辩证量表制定方法中医证候宏观辩证量表制
2、定方法 1.利用现有四诊项目组合法利用现有四诊项目组合法+临床流行病学调查证候加临床流行病学调查证候加权积分法权积分法:国际或行标规定的主要症状都具备国际或行标规定的主要症状都具备(如果无主要症如果无主要症状状,则要求任意三项症状则要求任意三项症状)+舌苔舌苔+脉象脉象.合计至少合计至少5项阳项阳性才能辩为某证候性才能辩为某证候.根据此项规定可以计算出每个证根据此项规定可以计算出每个证候候 诊断的最低加权积分临界值诊断的最低加权积分临界值.优点优点:宏观辩证统一化宏观辩证统一化、规范化、量化。、规范化、量化。现场调查证候现场调查证候 加权积分步骤:加权积分步骤:每项症状按严重程度或频次制定每项
3、症状按严重程度或频次制定0、2、4、6分的得分的得分量表分量表.分别对应无分别对应无、轻、中、重症状;使用文字进、轻、中、重症状;使用文字进行描述得分具体内容行描述得分具体内容.是症状和体征是症状和体征(四诊四诊)的定量方法的定量方法.舌和脉象如果不容易打分舌和脉象如果不容易打分,也可按照无也可按照无=0分分,有有=1分分.证候加权积分证候加权积分(计量资料计量资料)=每项四诊得分每项四诊得分*每项四诊对每项四诊对证候的权重证候的权重.(=同一证候中每项四诊中出现频率的百分同一证候中每项四诊中出现频率的百分构成比构成比,可根据文献或现场调查计算可根据文献或现场调查计算)证候加权积分作为证候疗效
4、评价的定量依据证候加权积分作为证候疗效评价的定量依据.若再将证候加权积分转化为证候分级值,若再将证候加权积分转化为证候分级值,则可以把则可以把证候分级为证候分级为0、1、2、3级级,分别代表某证候的无、轻、分别代表某证候的无、轻、中、重中、重.2.利用古今传统文献统计法利用古今传统文献统计法:因为四诊资料和证候在原因为四诊资料和证候在原始文献始文献(医案医案)中没有定量值中没有定量值,只能查到有或无的记载只能查到有或无的记载.因此可以统计各种证候的每项四诊资料发生的频数因此可以统计各种证候的每项四诊资料发生的频数,换换算成为频率算成为频率(条件概率条件概率),再用对数转换为诊断概率指数再用对数
5、转换为诊断概率指数,从而制定出计量诊断与鉴别诊断表来从而制定出计量诊断与鉴别诊断表来.3.只按照现代流行病学调查和统计分析只按照现代流行病学调查和统计分析特点特点:不受现有证候诊断不受现有证候诊断(宏观辩证宏观辩证)标准的限制标准的限制,完全按完全按照无偏的自然人群样本调查收集到的四诊资料进行团照无偏的自然人群样本调查收集到的四诊资料进行团结分析结分析.优点优点:不仅可以筛选出某证主要四诊资料不仅可以筛选出某证主要四诊资料(指标指标),而且可而且可以得到每个指标对证候的权重以得到每个指标对证候的权重.例如主成分及因子分析例如主成分及因子分析和指标聚类分析和指标聚类分析.问题问题:对证候的重新分
6、类可能与现有辩证体系不全吻合对证候的重新分类可能与现有辩证体系不全吻合上述第上述第 1 种方法可做暂行种方法可做暂行“金金”标准标准,其最大优点是其最大优点是:1.辩证统一辩证统一;2.辩证结果可以重复辩证结果可以重复,即重测信度即重测信度(retest reliability)好好.3.症状和证候可定量症状和证候可定量,均可作为症状和证候疗效评价均可作为症状和证候疗效评价的依据的依据.第三节第三节 制定方法举例制定方法举例以中医内科学以中医内科学(张伯臾张伯臾)对胃痛的辩证分型和四诊对胃痛的辩证分型和四诊资料项目作为基础资料项目作为基础.再按照四诊资料的严重程度或发再按照四诊资料的严重程度或
7、发生频次评定得分生频次评定得分,拟定四诊资料表拟定四诊资料表,称为四诊资料得分称为四诊资料得分证候加权积分证候加权积分=各项四诊资料得分各项四诊资料得分*各项四诊项目权重的各项四诊项目权重的积和积和(代数和代数和).加权方法加权方法:某一证候中某一证候中,每一项四诊资料出现频率的百每一项四诊资料出现频率的百分构成比分构成比(根据临床流行病学调查数据计算根据临床流行病学调查数据计算).上述四诊资料得分为等级资料上述四诊资料得分为等级资料,证候加权积分是计量证候加权积分是计量资料资料.表表1 胃痛各证候的宏观辩证量表胃痛各证候的宏观辩证量表(金标准金标准)症状症状|得分得分 0 分分 2 分分 4
8、 分分 6 分分 权重权重 1.寒邪客胃寒邪客胃 1.1 胃脘疼痛胃脘疼痛 无无 轻微轻微 较痛能忍较痛能忍 不能忍不能忍 0.3 1.2 得温痛减得温痛减 从不从不 偶尔偶尔 经常经常 总是总是 0.3 遇寒痛增遇寒痛增1.3 口和不渴口和不渴 非常渴非常渴 很渴很渴 有点渴有点渴 不渴不渴 0.31.4 喜热饮喜热饮 从不从不 偶尔偶尔 经常经常 总是总是 0.11.5 舌苔白舌苔白 不是不是 是是 0.11.6 脉弦紧脉弦紧 不是不是 是是 0.12.饮食停滞饮食停滞.3.肝气犯胃肝气犯胃4.肝胃郁热肝胃郁热5.瘀血停滞瘀血停滞6.胃阴亏虚胃阴亏虚7.脾胃虚寒脾胃虚寒.参考文献参考文献:
9、中医内科学张伯臾主编中医内科学张伯臾主编,第第1版版 上海科上海科技出版社技出版社,1986年年临床流行病学王家良主编临床流行病学王家良主编,第第2版版,上海科技出版上海科技出版社社,2001,437页页 临床流行病学在中医药研究中的应临床流行病学在中医药研究中的应用用:赖世隆赖世隆第二章第二章 中医证候宏观辩证量表中医证候宏观辩证量表 的表面效度评价的表面效度评价第一节第一节 Kappa检验的原理检验的原理在诊断检验中在诊断检验中,对水平数对水平数3的配伍设计问题的配伍设计问题.通常进行通常进行一致性一致性(intraobserver aggrement)检验检验,可使用可使用McNemar
10、检验和检验和Kappa检验检验.1.Kappa检验的意义检验的意义 Kappa检验(检验(Kappa test)或称一)或称一致性致性(intraobserver agreement)检验,包括检验,包括 同一医药同一医药工作者对同一受试对象进行两次以上观察作出判断的工作者对同一受试对象进行两次以上观察作出判断的一致性。例如:同一临床医师对同一患者的两次胃镜一致性。例如:同一临床医师对同一患者的两次胃镜检查的结论、两次阅读同一检查的结论、两次阅读同一X光片的诊断结论,病理学光片的诊断结论,病理学医师两次阅读同一张切片的诊断结论,同一医药工作医师两次阅读同一张切片的诊断结论,同一医药工作者两次测
11、定同一药材某特征物含量的结论,都可能产者两次测定同一药材某特征物含量的结论,都可能产生不一致的情况。生不一致的情况。两个及两个以上的医药工作者对两个及两个以上的医药工作者对同一对象进行观察作出判断的一致性。同一对象进行观察作出判断的一致性。例如:两个或更多的医药工作者检查同一患者、阅读例如:两个或更多的医药工作者检查同一患者、阅读同一同一X光片、同一病理切片也可能发生判断的不一致。光片、同一病理切片也可能发生判断的不一致。因此在临床实际工作中,特别是临床试验研究中,有因此在临床实际工作中,特别是临床试验研究中,有必要对判断的一致性作出估计。例如,在利用胃镜检必要对判断的一致性作出估计。例如,在
12、利用胃镜检查结果作慢性胃炎的诊断之前,研究者很有必要了解查结果作慢性胃炎的诊断之前,研究者很有必要了解重复检查的一致程度,若一致性较差,说明诊断结果重复检查的一致程度,若一致性较差,说明诊断结果的可靠性受到重复检查结果判断不一致的影响;若一的可靠性受到重复检查结果判断不一致的影响;若一致性较好,说明重复检查结果是可信的。由于实际工致性较好,说明重复检查结果是可信的。由于实际工作中重复观察造成的判断不一致很难避免,只能尽量作中重复观察造成的判断不一致很难避免,只能尽量采取措施控制在最低限度,同时,选用适当的统计方采取措施控制在最低限度,同时,选用适当的统计方法评价其判断的一致性。法评价其判断的一
13、致性。2Kappa检验的统计量检验的统计量 为为Kappa值,简记为值,简记为K,计算,计算公式为:公式为:eeAPPPk 1式中式中PA为实际观察到的一致率;为实际观察到的一致率;Pe为期望一致率,简为期望一致率,简称期望率,即两次检查结果由于偶然机会所造成的一称期望率,即两次检查结果由于偶然机会所造成的一致率。致率。PA和和Pe的计算公式分别为:的计算公式分别为:NAPA 总总检检查查数数实实际际观观察察到到的的一一致致数数NEPe 总总检检查查数数期期望望的的一一致致数数可见,可见,K值实际为两个差值之比,分母为值实际为两个差值之比,分母为(1期望率期望率),即非偶然机会造成的一致率;分
14、子称为校正后的一致即非偶然机会造成的一致率;分子称为校正后的一致率,它是实际观察到的一致率和可能由于偶然机会造率,它是实际观察到的一致率和可能由于偶然机会造成的期望率之差值,差值越大,说明实际观察到的一成的期望率之差值,差值越大,说明实际观察到的一致率远比由于机会造成的期望一致率高。致率远比由于机会造成的期望一致率高。K值为经校正值为经校正后一致率与非机会造成一致率的比值。后一致率与非机会造成一致率的比值。配对四格表资料的期望率配对四格表资料的期望率Pe、实际观察一致率、实际观察一致率PA分别分别为:为:Pe=(a+b)(a+c)/n+(b+d)(c+d)/n/n =(a+b)(a+c)+(b
15、+d)(c+d)/n2 (10.15)PA=(a+d)/n (10.14)配对四格表资料的配对四格表资料的Kappa值可简化为式值可简化为式(10.16):K=2(adbc)/(a+b)(a+c)+(b+d)(c+d)(10.16 Kappa的取值范围在的取值范围在-1至至+1之间,之间,K值愈接近值愈接近+1,表明,表明一致程度愈好,一致程度愈好,K值值+1,说明两次判断的结果完全一,说明两次判断的结果完全一致;致;K值值1,表示二者完全相反,说明两次判断的结,表示二者完全相反,说明两次判断的结果完全不一致;若果完全不一致;若K值值0,表示一致率完全由机会引,表示一致率完全由机会引起,说明两
16、次检查结果很不一致。在实际运用中,只有起,说明两次检查结果很不一致。在实际运用中,只有K值在值在0到到+1区间时,对判断一致性才有意义。区间时,对判断一致性才有意义。K值越值越大说明二者的一致性越好。一般认为,若大说明二者的一致性越好。一般认为,若K值值0.75,可说明已经达到相当满意的一致程度;若小于可说明已经达到相当满意的一致程度;若小于0.4,则,则可说明一致程度不够理想。可说明一致程度不够理想。Landis和和Koch对四格表资对四格表资料提出判断一致性程度的料提出判断一致性程度的Kappa量判断表,见表量判断表,见表10-15。表表10-15 一致性程度的一致性程度的Kappa量判断
17、表量判断表*Kappa值值一致性程一致性程度度 Kappa值值一致性程一致性程度度0弱弱 0.410.60中度中度0.000.20轻轻 0.610.80高度高度0.210.40尚好尚好 0.811.00极强极强*Kappa值值0.4,Kappa值的标值的标准误准误=0.049,近似概率,近似概率P=0.000。说明样本。说明样本Kappa值来值来自总体自总体Kappa值为值为0的概率近似的概率近似0.000,故可认为两者,故可认为两者辩证结果的一致性较好。辩证结果的一致性较好。第三节第三节 定性观察定性观察(二分类变量二分类变量)的一致性评价方法的一致性评价方法如果将证候分度简化为二分类变量如
18、果将证候分度简化为二分类变量,则资料整理成表则资料整理成表 乙辩证例数乙辩证例数 是是 非非 合计合计甲辩证例数甲辩证例数 是是 a b a+b 非非 c d c+d 合计合计 a+c b+d n例例10.14 湖南中医学院研究的血吸虫病肝纤维化气虚血湖南中医学院研究的血吸虫病肝纤维化气虚血瘀证判别模型回代检验结果见表瘀证判别模型回代检验结果见表10-17,用,用Kappa值评值评价该判别模型诊断的吻合性与一致性。价该判别模型诊断的吻合性与一致性。乙辩证例数乙辩证例数 是是 非非 合计合计甲辩证例数甲辩证例数 是是 36 5 41 非非 3 40 43 合计合计 39 45 84H0:两者吻合
19、。:两者吻合。H1:两者不吻合。:两者不吻合。2(xji-xij)2/(xji+xij)=(5-3)2/(5+3)=0.5,自由度自由度df=k(k-1)/2=2(2-1)/21,查查 2界值表得界值表得P0.05K=2(adbc)/(a+b)(a+c)+(b+d)(c+d)2(3640-53)/(4145+3943)=0.81,按表,按表10-15的一致性程度的一致性程度的的Kappa量判断表,可认为该判别模型诊断的吻合性量判断表,可认为该判别模型诊断的吻合性极强。极强。第三章第三章 中医证候宏观辩证量表的重测信度评价中医证候宏观辩证量表的重测信度评价 (R值法值法)及反应度评价及反应度评价
20、 信度又称为可靠性信度又称为可靠性(reliability):指在相同条件下指在相同条件下,对同一客观事件重复测量若干次对同一客观事件重复测量若干次,测量结果相互符合测量结果相互符合的程度的程度;说明数据的可靠性说明数据的可靠性.常用信度评价的方法有四种常用信度评价的方法有四种:1.客观信度客观信度(objectivity reliability)2.精确程度精确程度(precision reliability)3.和谐程度和谐程度(congruence reliablity)4.重测信度重测信度(re-test reliability):用同样测量方法对同一用同样测量方法对同一批对象在不同时
21、间段进行重复测量批对象在不同时间段进行重复测量,目的是考核测量工目的是考核测量工具的可靠性具的可靠性.下面介绍使用组内相关可靠性系数下面介绍使用组内相关可靠性系数(intra-class correlation coeficient of reliability,R值值)对中医证候对中医证候宏观辩证量表进行重测信度评价的方法和反应度评价宏观辩证量表进行重测信度评价的方法和反应度评价的方法的方法.第一节第一节 R 的设计计算和统计分析的设计计算和统计分析一、例一、例1 某研究者使用中医证候宏观辩证量表对同一某研究者使用中医证候宏观辩证量表对同一批受测者批受测者(10例例)在上在上,下午两次盲法观
22、测证候的直接积下午两次盲法观测证候的直接积分分(四诊资料总得分四诊资料总得分),资料见下表资料见下表:受试编号受试编号 1 2 3 4 5 6 7 8 9 10第第1次积分次积分 5 4 5 3 12 7 9 15 8 6 第第2次积分次积分 6 4 4 4 10 5 8 18 7 8 二、计算组内相关可靠性系数二、计算组内相关可靠性系数:可使用可使用SPSS统计分析统计分析0.7R 0.4,可靠性较好可靠性较好,R0.7 可靠性甚佳可靠性甚佳.这这里里 R=0.92 可靠性好可靠性好.第二节第二节 量表反应度的评价量表反应度的评价 量表不但要评价其真实性量表不但要评价其真实性(效度效度)和可
23、靠度和可靠度,还要评还要评价反应度价反应度.一、反应度的概念一、反应度的概念 反应度反应度(responsibility to change):反应内外环境和受反应内外环境和受试者有一定变化试者有一定变化(例如中医四诊资料的严重度或频度有例如中医四诊资料的严重度或频度有所变化所变化)的情况下该量表的应变能力的情况下该量表的应变能力.二、二、反应度指标反应度指标1.实施干预措施后实施干预措施后,量表两次得分的差别有无统计学量表两次得分的差别有无统计学意义的假设检验意义的假设检验:既可以按照计量资料进行假设检验既可以按照计量资料进行假设检验,如如 t 检验检验(正态性正态性,方差齐性方差齐性)或或
24、 t 检验检验(方差不齐方差不齐).也可以进行非参数检验也可以进行非参数检验.2.效应尺度统计量效应尺度统计量(effect size statistics):除开假设检验除开假设检验外外,还可以把实施干预措施前后还可以把实施干预措施前后,量表两次得分转换量表两次得分转换为为“效应尺度效应尺度”统计量来评价量表的反应度统计量来评价量表的反应度.效应尺度效应尺度=(干预得分干预得分-干预后得分干预后得分)/干预前得分的标准差干预前得分的标准差一般认为一般认为,效应尺度小于效应尺度小于0.2,则反应度甚差则反应度甚差;0.20.50之间反应度较小之间反应度较小;0.510.80为反应度较大为反应度
25、较大.如果量表如果量表在干预前后两次得分的假设检验有统计学意义的差别在干预前后两次得分的假设检验有统计学意义的差别,而效应尺度却小于而效应尺度却小于0.20,则显示该量表的反应度甚差则显示该量表的反应度甚差.第四章病证结合的观察性描述研究:横断面调查分析第四章病证结合的观察性描述研究:横断面调查分析 观察性描述性研究主要包括横断面调查、诊断试观察性描述性研究主要包括横断面调查、诊断试验评价与筛查、生态学研究、临床医疗调查报告、病验评价与筛查、生态学研究、临床医疗调查报告、病例总结分析,专家述评等,属于观察性描述性研究。例总结分析,专家述评等,属于观察性描述性研究。其科学价值可参考加拿大其科学价
26、值可参考加拿大MCMaster大学的四级分类方大学的四级分类方法,属于第三级(较低一级)研究设计方案,论证强法,属于第三级(较低一级)研究设计方案,论证强度较弱。度较弱。第一节横断面调查的概念和特点第一节横断面调查的概念和特点 横断面调查又称现况调查(横断面调查又称现况调查(cross-sectional survey)或患病率(现患病,或患病率(现患病,prevalence rate)调查。是在某个)调查。是在某个时点或较短时段内(看成一个时点,一般在一个月内时点或较短时段内(看成一个时点,一般在一个月内完成调查),调查一个特定人群样本中医证候的分布完成调查),调查一个特定人群样本中医证候的
27、分布频率以及与某些因素的相关关系,可以得到证候的现频率以及与某些因素的相关关系,可以得到证候的现患率(患率(prevalence rate)和一些可疑的影响因素。)和一些可疑的影响因素。现况调查可以将证候按人群各种特征间、时间、地现况调查可以将证候按人群各种特征间、时间、地区间(合称区间(合称“三间三间”)的横断面分布频率显示出来,)的横断面分布频率显示出来,而且可以获得影响证候而且可以获得影响证候“三间三间”分布频率的相关因素分布频率的相关因素信息。信息。由于证候与相关因素是在同一次调查中得到的,即由于证候与相关因素是在同一次调查中得到的,即果与因同时存在,无法判断发生时间的先后顺序,除非果
28、与因同时存在,无法判断发生时间的先后顺序,除非一些持续不变的因素如家族史、性别、血型、基因型外,一些持续不变的因素如家族史、性别、血型、基因型外,不能推断证候与相关因素之间存在因果联系,即不能确不能推断证候与相关因素之间存在因果联系,即不能确定病因或危险因子。定病因或危险因子。尽管不能进行病因推断,但却是病因研究必须的第尽管不能进行病因推断,但却是病因研究必须的第一步,能为病或证候的病因(或危险因子)研究提供工一步,能为病或证候的病因(或危险因子)研究提供工作假设的线索,为第二步观察性分析性研究(包括回顾作假设的线索,为第二步观察性分析性研究(包括回顾性病例对照研究和前瞻性的队列研究)以及第三
29、步的干性病例对照研究和前瞻性的队列研究)以及第三步的干预研究(包括治疗性临床试验、预防性临床试验、以群预研究(包括治疗性临床试验、预防性临床试验、以群体为单位的社区试验)提供基础。体为单位的社区试验)提供基础。第二节第二节 横断面调查的目的和用途横断面调查的目的和用途 1.证候按人群各种特征的分布频率:年龄、性别、种证候按人群各种特征的分布频率:年龄、性别、种族、基因型、经济收入、职业、婚姻、家庭状况等一切族、基因型、经济收入、职业、婚姻、家庭状况等一切可能影响证候的分布频率。可能影响证候的分布频率。一、了解证候人群人中的现况和描述证候按一、了解证候人群人中的现况和描述证候按“三间三间”的分布
30、频率的分布频率 3.证候按地区的分布频率:不同地理区域可能影响证证候按地区的分布频率:不同地理区域可能影响证候的分布频率。候的分布频率。二、了解影响证候二、了解影响证候“三间三间”分布频率的相关因素分布频率的相关因素 2.证候按时间的分布频率:人群抽样调查时间的不同证候按时间的分布频率:人群抽样调查时间的不同(例如季节和年份)可能影响证候的分布频率。(例如季节和年份)可能影响证候的分布频率。1.证候按人群各种特征的分布频率:年龄、性别、种证候按人群各种特征的分布频率:年龄、性别、种族、基因型、经济收入、职业、婚姻、家庭状况等一族、基因型、经济收入、职业、婚姻、家庭状况等一切可能影响证候的分布频
31、率。切可能影响证候的分布频率。2.证候按时间的分布频率:人群抽样调查时间的不同证候按时间的分布频率:人群抽样调查时间的不同(例如季节和年份)可能影响证候的分布频率。(例如季节和年份)可能影响证候的分布频率。3.证候按地区的分布频率:不同地理区域可能影响证证候按地区的分布频率:不同地理区域可能影响证候的分布频率。候的分布频率。三、了解影响证候三、了解影响证候“三间三间”分布频率的相关因素分布频率的相关因素 如果是病证结合研究,影响病的患病率的相关因素,如果是病证结合研究,影响病的患病率的相关因素,也可能是证候影响因素。例如:软水质使冠心病高发,也可能是证候影响因素。例如:软水质使冠心病高发,硬水
32、质使龋齿高发,黄曲霉素硬水质使龋齿高发,黄曲霉素B在食品中的浓度与肝癌在食品中的浓度与肝癌患病率呈正相关,吸烟与支气管肺癌,某些地区的民患病率呈正相关,吸烟与支气管肺癌,某些地区的民族某种病低发和高发,即使移民到某国几代人后仍与族某种病低发和高发,即使移民到某国几代人后仍与该国居民的患病率(或发病率)水平有显著差别。所该国居民的患病率(或发病率)水平有显著差别。所有这些相关因素都可能影响证候的分布频率,因为证有这些相关因素都可能影响证候的分布频率,因为证候与病都是反映疾病和健康状况的概念。候与病都是反映疾病和健康状况的概念。四、了解证候分布频率的动态变化四、了解证候分布频率的动态变化 如果能像
33、全球疾病监测那样,在监测点同样可以做如果能像全球疾病监测那样,在监测点同样可以做到证候的监测,在同监测的相同人群样本中到证候的监测,在同监测的相同人群样本中2次以上的次以上的调查,就可以提供时间动态变化。调查,就可以提供时间动态变化。第三节第三节 人群抽样调查设计及随机抽样的人群抽样调查设计及随机抽样的SAS程序程序 一、目标明确一、目标明确1、主要了解某病的证候分布频率:使用医院确诊为某、主要了解某病的证候分布频率:使用医院确诊为某病的连续病例,直到满足样本含量为止。医院病例的病的连续病例,直到满足样本含量为止。医院病例的缺点:不能计算病或证候的患病率(时点患病率某缺点:不能计算病或证候的患
34、病率(时点患病率某时点新老病例数之和时点新老病例数之和/该时点平均人口数),只能计算该时点平均人口数),只能计算某病的某证候分布某病的某证候分布 频率。因为医院的病例不能包含各频率。因为医院的病例不能包含各年龄组、各职业、各病期、种种病情(轻、中、重、年龄组、各职业、各病期、种种病情(轻、中、重、并发症)的全部病例,所以医院病例是该病的有偏样并发症)的全部病例,所以医院病例是该病的有偏样本。理想的人群样本来自自然人群(人群各种特征的本。理想的人群样本来自自然人群(人群各种特征的比例符合所在的市或县最近一次人口普查的特征比例比例符合所在的市或县最近一次人口普查的特征比例)。)。2、了解某病及证候
35、的患病率及其影响因子(相关因、了解某病及证候的患病率及其影响因子(相关因素):来自自然人群的样本。城镇的居民委员会或农村素):来自自然人群的样本。城镇的居民委员会或农村的行政村均为自然人群。的行政村均为自然人群。二、统一诊断标准二、统一诊断标准 1、病的诊断标准:国际标准或国家标准。、病的诊断标准:国际标准或国家标准。2、证候的辩证标准:笔者建议制定、证候的辩证标准:笔者建议制定“统一的辩证用四统一的辩证用四诊量表诊量表”作为目前阶段统一的辩证标准,即暂行作为目前阶段统一的辩证标准,即暂行“金金”标准。制定方法可参阅本书第一章。标准。制定方法可参阅本书第一章。三、调查表三、调查表 应包含一般项
36、目和研究项目。应包含一般项目和研究项目。一般项目:姓名;性别;年龄组(按世界卫生组织提一般项目:姓名;性别;年龄组(按世界卫生组织提供的供的“标准人口构成标准人口构成”构成年龄分组方法,成年人构成年龄分组方法,成年人5岁岁一个年龄组,一个年龄组,75岁以上只一个年龄组,例如岁以上只一个年龄组,例如20 25 3075);职业。);职业。研究项目:凡是可疑的病或证的一切相关因素,而且研究项目:凡是可疑的病或证的一切相关因素,而且打算统计分析的,都不应遗漏;打算统计分析的,都不应遗漏;不打算统计分析的,一项也不要列入。不打算统计分析的,一项也不要列入。各种项目都要写明计算机编码:三分类名义变量如各
37、种项目都要写明计算机编码:三分类名义变量如男和女,编码为男和女,编码为1和和2;多类无序名义变量(如某病的;多类无序名义变量(如某病的证证1、证、证2、证、证3)以及多类有序变量(等级变量)以及多类有序变量(等级变量),编码为,编码为1、2、3K;连续型变量(计算资料)填;连续型变量(计算资料)填写实际观测值。写实际观测值。研究项目应尽量选择客观的测量指标,即硬数据(研究项目应尽量选择客观的测量指标,即硬数据(hard data),尽量减少主观的重复性差的不能准确度),尽量减少主观的重复性差的不能准确度量的指标,即软数据(量的指标,即软数据(softdata)。必不可少的软数据)。必不可少的软
38、数据(如症状、心理学指标等)收集,为了统一,宜做成(如症状、心理学指标等)收集,为了统一,宜做成量表(量表(scale),要做效度(真实性、准确度,即),要做效度(真实性、准确度,即validity)和信度(可靠性、可重复性、精确度,即)和信度(可靠性、可重复性、精确度,即reliability)检验,可参阅本书有关章节。)检验,可参阅本书有关章节。四、抽样方法及四、抽样方法及SAS 统计程序统计程序 无论采用何种抽样方法,必须遵守随机抽样的原则无论采用何种抽样方法,必须遵守随机抽样的原则。因为只有随机样本才能代表总体(自然人群中所有。因为只有随机样本才能代表总体(自然人群中所有的某病某证候者
39、的总体)的各种特征。而且要计算抽的某病某证候者的总体)的各种特征。而且要计算抽样误差(样误差(sampling error),以便对总体参数作出估),以便对总体参数作出估计,并对抽样调查结果的真实性(与总体真值的距离计,并对抽样调查结果的真实性(与总体真值的距离,即准确度或效度)和可靠性(可重复性,即精确度,即准确度或效度)和可靠性(可重复性,即精确度或信度)进行评价。或信度)进行评价。1、单纯随机抽样(、单纯随机抽样(Simple random Sampling)是简单又基本的抽样方法,从是简单又基本的抽样方法,从N个人的总体中随机个人的总体中随机抽出抽出 n 个构成一个含量为个构成一个含量
40、为 n 人的样本。这里,基本抽人的样本。这里,基本抽样单位是样单位是“人人”。笔者建议使用。笔者建议使用SAS程序进行随机抽程序进行随机抽样样单纯随机抽样单纯随机抽样SAS程序举例:程序举例:设计例题设计例题1 现有有限总体现有有限总体2000人,欲从中随机抽出人,欲从中随机抽出50人人的样本的样本,怎样改写,怎样改写SAS 程序?程序?data ebm3.samp;do i=1 to 50;x=ranuni(20020808);y=int(x*2000);output;end;run;运行结果如下:运行结果如下:OBS I X Y 1 1 0.09759 195 .答答:欲抽出欲抽出50人,
41、第人,第3行行do i1 to 50;如欲抽出;如欲抽出80人人,则把,则把 50 改为改为80;从;从2000人的有限总体中抽样,所人的有限总体中抽样,所以第以第5行行y=int(x*2000);即随机数先乘;即随机数先乘2,000 再取整。再取整。如有限总体为如有限总体为20000人,则把人,则把2000改为改为20000即可。第即可。第4行括号内是种子数,相当于抽样起始点,本例取日行括号内是种子数,相当于抽样起始点,本例取日期,读者也可取其它任意正整数。当然首先给有限总期,读者也可取其它任意正整数。当然首先给有限总体的每个抽样单位编号。体的每个抽样单位编号。上面运行结果的第上面运行结果的
42、第4列(列(Y列)就是在列)就是在2 000人的有人的有限总体内随机抽中的限总体内随机抽中的50人随机样本号,它是通过人随机样本号,它是通过x*2000得到的,得到的,x也是随机数。也是随机数。50 50 0.53951 107949 49 0.16101 322nSSX 2、抽样误差的计算公式:、抽样误差的计算公式:(1)无限总体抽样误差:)无限总体抽样误差:当(当(n/N)5%时,时,N 可看作无限总体。例如本例,可看作无限总体。例如本例,n/N=50/200=2.5%,看作无限总体。均数的标准误:,看作无限总体。均数的标准误:率的标准误:率的标准误:nppnppSp)1(1)1(式中式中
43、S=样本标准差,样本均数的标准误,样本标准差,样本均数的标准误,p=样本样本率,率,n=样本含量。样本含量。如果如果n/N5%,N 看作有限总体。上述看作有限总体。上述2个公式分别乘个公式分别乘上校正数(上校正数(1n/N)的平方根。)的平方根。(2)有限总体的抽样误差:有限总体的抽样误差:均数的标准误:均数的标准误:NnnSnSNnSx 1)/(2率的标准误:率的标准误:NnnppnppNnSp 1)1()1()/1(3、整群抽样(、整群抽样(Cluster Sampling)基本抽样单位不是以基本抽样单位不是以“人人”为单位,而是以为单位,而是以“群组群组”为单位,例如城镇的居委会,农村的
44、行政村、学校的为单位,例如城镇的居委会,农村的行政村、学校的班、部队的班、工人的车间班、部队的班、工人的车间等。等。设计例题设计例题2 欲调查北京市欲调查北京市2000年年8月城区常驻户口居月城区常驻户口居民民II型糖尿病患病率及型糖尿病患病率及II型糖尿病气阴两虚证的现患率。型糖尿病气阴两虚证的现患率。问:怎样进行整群抽样?问:怎样进行整群抽样?答:基本抽样单位是居委会。按照市公安局户口处的答:基本抽样单位是居委会。按照市公安局户口处的资料,先把各城区各街道办事处各居委会的名称、人资料,先把各城区各街道办事处各居委会的名称、人口列表,并且按某种人为的顺序对居委会编号,假定口列表,并且按某种人
45、为的顺序对居委会编号,假定1到到2000号。再计算样本量,得出平均需要多少个居委号。再计算样本量,得出平均需要多少个居委会作为样本,(样本量计算方法见本章第五节),会作为样本,(样本量计算方法见本章第五节),假假定需要抽出定需要抽出50个居委会。最后仍用个居委会。最后仍用SAS程序(数据集程序(数据集名:名:ebm3.samp)随机抽出)随机抽出50个居委会。被抽中的居个居委会。被抽中的居委会全体居民都是调查对象。委会全体居民都是调查对象。整群抽样的抽样误差大于单纯随机抽样,需要增加样整群抽样的抽样误差大于单纯随机抽样,需要增加样本量,一般增加本量,一般增加50左右即可。左右即可。4、分层抽样
46、(、分层抽样(Stratified sampling)先按总体人口学特征(年龄组、性别、种族、职业、经先按总体人口学特征(年龄组、性别、种族、职业、经济收水平等)或疾病的病情(轻、中、重、并发症等)济收水平等)或疾病的病情(轻、中、重、并发症等)分成若干层次,并在每层内作单纯随机抽样。一般说,分成若干层次,并在每层内作单纯随机抽样。一般说,当样本会计师足够大时,调查患病率和相关因素,只要当样本会计师足够大时,调查患病率和相关因素,只要单纯随机抽样即可,不一定需要事先分层。但是调查结单纯随机抽样即可,不一定需要事先分层。但是调查结束后处理资料时,分层统计分析是必要的,这是为了控束后处理资料时,分
47、层统计分析是必要的,这是为了控制混杂偏倚(制混杂偏倚(confounding bias)。)。第四节第四节 横断面调查需要的样本含量估计方法横断面调查需要的样本含量估计方法一、调查总体均数时样本含量计算公式(当总体标准一、调查总体均数时样本含量计算公式(当总体标准差和均数未知时,都用样本统计量代替):差和均数未知时,都用样本统计量代替):2 dStn 式中,式中,n=样本含量;样本含量;=0.05时,时,s=样本标准差;样本标准差;d=允允许误差,即样本均数与总体均数的容许差值,既可用所许误差,即样本均数与总体均数的容许差值,既可用所求总体均数求总体均数95可信区间间距之半(可信区间间距之半(
48、1.96倍标准误);倍标准误);又可根据专业知识提出一个容许差又可根据专业知识提出一个容许差d,通常用后者。,通常用后者。设计例题设计例题3 某单位拟抽样调查了解该地区某单位拟抽样调查了解该地区20岁男性身高。岁男性身高。据预调查计算的样本均数为据预调查计算的样本均数为170cm,样本标准差为,样本标准差为30cm,设计者要求容许差值,设计者要求容许差值d=总体均数(用样本均数总体均数(用样本均数代替)的代替)的1/100=170cm/100=1.7cm.问:需要多大样本含量?问:需要多大样本含量?答:设定答:设定=0.05,s=30cm,d=1.7cm,t0.05=1.96。将。将数据代入公
49、式数据代入公式4-5得得:n=(1.96*30/1.7)2=1196.3。即决定。即决定至少需要抽样调查至少需要抽样调查1197名名20岁男性。岁男性。如果想减少样本量必然要增大容许误差如果想减少样本量必然要增大容许误差d,例如令,例如令d=总体均数总体均数(用样本均数代替用样本均数代替)的的2/100=170cm*0.02=3.4cm.将数据代入公式将数据代入公式4-5,得,得:n=(1.96*30/3.4)2=299.1即至少需要抽样调查即至少需要抽样调查300名名20男性。男性。设计例题设计例题4 某中医科拟抽样调查了解空腹糖某中医科拟抽样调查了解空腹糖200mg/dL的的II 型糖尿病
50、气阴两虚证的证候加权积分均值(指总型糖尿病气阴两虚证的证候加权积分均值(指总体均值,这里的总体是研究结果推论的范围,即全国体均值,这里的总体是研究结果推论的范围,即全国的该证型患者)。的该证型患者)。/15=0.2。据预调查样本计算,样本证候加权分均数为据预调查样本计算,样本证候加权分均数为3分,标准分,标准差约为差约为1分,要求容许误差分,要求容许误差d=总体均数(用样本均数总体均数(用样本均数代替)的代替)的1/15=3分分/15=0.2。问:所需要调查多少人数?问:所需要调查多少人数?答答:设定设定0.05,s=1分分,d=0.2分,将数据代分,将数据代入公式入公式45,得:,得:n=(