1、预防医学第三讲描述性研究文档预防医学第三讲描述性研究文档ppt研究设计主要步骤v查阅文献,提出研究目的v确定研究内容v选择研究方法v确定研究对象v设计调查表v调查中的质量控制v资料整理,统计分析第二节 描述性研究 18541854年秋季,伦敦宽街暴发霍乱,年秋季,伦敦宽街暴发霍乱,1010天内死去天内死去500500多人,在霍乱暴多人,在霍乱暴发后的发后的6 6天内发病严重的街道有天内发病严重的街道有3/43/4以上的居民离去。据以上的居民离去。据18531853年统年统计,在过去几次霍乱流行中,该地区虽曾流行,但远比其他各区计,在过去几次霍乱流行中,该地区虽曾流行,但远比其他各区轻微。轻微。
2、死亡无数死亡无数人们纷纷逃散人们纷纷逃散 当时霍乱病原体尚未发现,当时霍乱病原体尚未发现,Snow集集中精力调查发生疫情的地点和死亡病例中精力调查发生疫情的地点和死亡病例,发现几乎所有的死亡病例都发生于离,发现几乎所有的死亡病例都发生于离宽街水井不远的地方,且他们都饮用宽宽街水井不远的地方,且他们都饮用宽街供水站的水街供水站的水,Snow根据疾病分布进行根据疾病分布进行分析,发现教区霍乱暴发与宽街供水站分析,发现教区霍乱暴发与宽街供水站的水井有密切关系,而以后的研究进一的水井有密切关系,而以后的研究进一步证实了这一假设。经封闭水井,暴发步证实了这一假设。经封闭水井,暴发即告终止。即告终止。英国
3、医师英国医师John.Snow运用了流行病学调运用了流行病学调查,分析了霍乱的流行情况查,分析了霍乱的流行情况。Snow关于霍乱的调查,正是运用关于霍乱的调查,正是运用了描述性研究的方法,分析霍乱的人群了描述性研究的方法,分析霍乱的人群现象、地区差异等情况,了解霍乱的分现象、地区差异等情况,了解霍乱的分布,根据分布特点,提出霍乱暴发与宽布,根据分布特点,提出霍乱暴发与宽街供水站有关这一假设。街供水站有关这一假设。描述性研究(描述性研究(descriptive studydescriptive study):又称描述性又称描述性流行病学(流行病学(descriptive epidemiology
4、descriptive epidemiology),是利是利用已有的资料或通过专题调查获得的资料,以述疾用已有的资料或通过专题调查获得的资料,以述疾病或健康状况在不同地区、时间和人群中的分布情病或健康状况在不同地区、时间和人群中的分布情况,找出某些因素与疾病或健康状况间的关系,提况,找出某些因素与疾病或健康状况间的关系,提供病因线索。供病因线索。它既是流行病学研究工作的起点,也是其他流行病它既是流行病学研究工作的起点,也是其他流行病学研究方法的基础。学研究方法的基础。历史或常规资料的收集、分析历史或常规资料的收集、分析 描述性研究描述性研究 现况研究(横断面研究)现况研究(横断面研究)调查调查
5、 生态学研究(相关性研究)生态学研究(相关性研究)个案调查和病例分析个案调查和病例分析 爆发调查爆发调查分类v对特定时间(或期间)和特定范围内人群中的有对特定时间(或期间)和特定范围内人群中的有关变量(因素)与疾病或健康关系的调查,称现关变量(因素)与疾病或健康关系的调查,称现况研究或横断面研究(况研究或横断面研究(crosssectional studycrosssectional study)。二、现况研究二、现况研究 (prevalence study)Time PointTimeCross-sectionv19791979至至19801980年我国对年我国对400400万万1515岁以
6、上人口进行了血岁以上人口进行了血压的抽样调查,按压的抽样调查,按WHOWHO提出的高血压诊断标准,不提出的高血压诊断标准,不同省、自治区、直辖市高血压的现患率显著不同同省、自治区、直辖市高血压的现患率显著不同,年龄调整现患率以西藏拉萨最高,为,年龄调整现患率以西藏拉萨最高,为17.76%17.76%,北京北京9.53%9.53%、天津、天津8.04%8.04%、内蒙古、内蒙古7.16%7.16%、吉林、吉林6.71%6.71%、广西、广西3.16%3.16%、贵州、贵州2.54%2.54%、广东、广东2.44%2.44%。但。但总的说来,高血压现患率华北、东北较南方各省总的说来,高血压现患率华
7、北、东北较南方各省、自治区、直辖市为高。、自治区、直辖市为高。v从不同年龄组来看,高血压现患率不论城市与农从不同年龄组来看,高血压现患率不论城市与农村均明显地随年龄而升高。城市的现患率高于农村均明显地随年龄而升高。城市的现患率高于农村,并且现患率升高的年龄,城市较农村约提早村,并且现患率升高的年龄,城市较农村约提早1010至至1515年。年。案例简便、易行的科学分组方法是利用随机数字表。3、适用于暴露因素后期累积作用的观察各种抽样方法的抽样误差1、最常用的流行病学调查方法;Cross-section再抽取n个观察单位组成样本1、最常用的流行病学调查方法;3、适用于暴露因素后期累积作用的观察抽样
8、过程分阶段进行,每个阶段可采用以上任意一种方法抽样,即将上述抽样方法综合运用,优势互补。能发现普查人群中的全部病例并给予及时的治疗;描述性研究(descriptive study):又称描述性流行病学(descriptive epidemiology),是利用已有的资料或通过专题调查获得的资料,以述疾病或健康状况在不同地区、时间和人群中的分布情况,找出某些因素与疾病或健康状况间的关系,提供病因线索。个案调查和病例分析便于对各层独立进行分析;一般只能获得患病率资料,不能获得发病率资料抽样调查样本含量的估计Snow关于霍乱的调查,正是运用了描述性研究的方法,分析霍乱的人群现象、地区差异等情况,了解
9、霍乱的分布,根据分布特点,提出霍乱暴发与宽街供水站有关这一假设。1 1、不太适用于病程比较短的急性病研究、不太适用于病程比较短的急性病研究2 2、无法区分暴露和疾病之间的时间先后、无法区分暴露和疾病之间的时间先后3 3、一般不能获得发病率资料;只有定期重复可获得、一般不能获得发病率资料;只有定期重复可获得现况研究的特点优点1 1、最常用的流行病学调查方法;一般不设对照、最常用的流行病学调查方法;一般不设对照2 2、适用于暴露因素不易发生变化的研究、适用于暴露因素不易发生变化的研究3 3、适用于暴露因素后期累积作用的观察、适用于暴露因素后期累积作用的观察局限性发现病因线索发现病因线索 描述目标群
10、体中疾病或健康状况的分布,为卫生保健工作描述目标群体中疾病或健康状况的分布,为卫生保健工作的计划和决策提供依据。的计划和决策提供依据。评价疾病防治、健康促进策略的效果评价疾病防治、健康促进策略的效果 早期发现病人,用于疾病的二级预防早期发现病人,用于疾病的二级预防确定机体某项指标正常值的范围确定机体某项指标正常值的范围(二)、现况研究目的(二)、现况研究目的三、现况研究类型三、现况研究类型 普查(普查(census)抽样调查(抽样调查(sampling survey)普查(普查(censuscensus)是指在特定的时点或时期、)是指在特定的时点或时期、特定范围内的全部人群均为研究对象的调查特
11、定范围内的全部人群均为研究对象的调查。普查的目的普查的目的 普查的目的可因不同的研究工作而异。普查的目的可因不同的研究工作而异。(1 1)早期发现疾病并及时给予治疗,如乳腺癌的)早期发现疾病并及时给予治疗,如乳腺癌的普查;普查;(2 2)了解疾病的病情及分布,如疟疾的普查;)了解疾病的病情及分布,如疟疾的普查;(3 3)了解人群的健康水平,如营养状况普查;)了解人群的健康水平,如营养状况普查;(4 4)建立某些指标的标准值,如血红蛋白等。)建立某些指标的标准值,如血红蛋白等。普查使用条件普查的疾病最好是患病率比较高的,以便短时间内调查能得普查的疾病最好是患病率比较高的,以便短时间内调查能得到足
12、够的病例;到足够的病例;调查目的明确,调查项目简单调查目的明确,调查项目简单 普查应具备灵敏度高、特异性强且易于在现场实施的检验普查应具备灵敏度高、特异性强且易于在现场实施的检验或检查的方法;或检查的方法;要有足够的人力、物力和财力支持进行普查。要有足够的人力、物力和财力支持进行普查。普查队伍要组织严密且有丰富的经验普查队伍要组织严密且有丰富的经验有群众基础有群众基础普查的优点普查的优点v 能发现普查人群中的全部病例并给予及时的治疗能发现普查人群中的全部病例并给予及时的治疗;能提供疾病分布情况和流行因素或病因线索能提供疾病分布情况和流行因素或病因线索;通过普查可进行一次广泛的医学科普宣传通过普
13、查可进行一次广泛的医学科普宣传。普查的缺点普查的缺点 工作量大,调查质量不易控制。工作量大,调查质量不易控制。普查对象多,难免漏诊、误诊;普查对象多,难免漏诊、误诊;不适于患病率低和检查方法复杂的疾病调查;不适于患病率低和检查方法复杂的疾病调查;耗费人力物理,成本太高耗费人力物理,成本太高一般只能获得患病率资料,不能获得发病率资料一般只能获得患病率资料,不能获得发病率资料现场观察与有关环境因素的检测预期现患率现患率越低,样本量越大单纯随机抽样的优点是简便易行。一般只能获得患病率资料,不能获得发病率资料样本含量太大或太小均不适宜。局限性总体较大时,抽到的个体分散,资料难以收集;以群组为抽样单位进
14、行随机抽样抽样调查样本含量的估计抽样调查能否成功的关键样本代表性3、适用于暴露因素后期累积作用的观察3、适用于暴露因素后期累积作用的观察据1853年统计,在过去几次霍乱流行中,该地区虽曾流行,但远比其他各区轻微。再抽取n个观察单位组成样本1、最常用的流行病学调查方法;一般只能获得患病率资料,不能获得发病率资料历史或常规资料的收集、分析抽样调查按一定的概率从总体中随机抽取一个有代表性的样本作为研究对象,然后根据调查所得的样本资料估计和推断被调查现象的总体特征。以群组为抽样单位进行随机抽样其缺点是在抽样范围较大时,工作量太大难以采用;抽样调查 Sampling Surveyv抽样调查按一定的概率从
15、总体中随机抽取一个有代抽样调查按一定的概率从总体中随机抽取一个有代表性的样本作为研究对象,然后根据调查所得的样表性的样本作为研究对象,然后根据调查所得的样本资料估计和推断被调查现象的总体特征。本资料估计和推断被调查现象的总体特征。v抽样调查能否成功的关键样本代表性抽样调查能否成功的关键样本代表性v保证样本代表性的基本原则随机抽样和样本含量适保证样本代表性的基本原则随机抽样和样本含量适当当v随机抽样的含义v在一个有N个观察单位的总体中,若抽取n个单位组成随机样本,则每个单位被抽到的概率均应为n/N。v样本含量适当的含义v将样本的随机误差控制在允许范围之内时所需的最小样本含量抽样调查优缺点优点v节
16、省时间和人力、物力v调查范围小,调查工作容易做得更细致v适用于患病率较高、变异程度不太大的疾病缺点v调查设计、实施和资料分析比较复杂v变异程度大,需大样本控制抽样误差v若患病率很低,小样本不能提供足够的信息;v若样本扩大到接近总体的75%时,直接进行普查更有意义抽样方法v单纯随机抽样单纯随机抽样(simple random sampling)(simple random sampling)v系统抽样系统抽样(systemic sampling)(systemic sampling)v分层抽样分层抽样(stratified sampling)(stratified sampling)v整群抽样整
17、群抽样(cluster sampling)(cluster sampling)v多级抽样多级抽样(multistage sampling)(multistage sampling)单纯随机抽样v从总体N个对象中,利用抽签、随机数字表或电子计算机等方法随机抽取n个对象。v先对被研究总体N个对象进行编号v再抽取n个观察单位组成样本v这种方法的基本原则是每个抽样单元被抽中选入这种方法的基本原则是每个抽样单元被抽中选入样本的机会是相等的。简便、易行的科学分组方样本的机会是相等的。简便、易行的科学分组方法是利用随机数字表。法是利用随机数字表。v单纯随机抽样的优点是简便易行。其缺点是在抽单纯随机抽样的优点
18、是简便易行。其缺点是在抽样范围较大时,工作量太大难以采用;以及抽样样范围较大时,工作量太大难以采用;以及抽样比例较小而样本含量较小时,所得样本代表性差比例较小而样本含量较小时,所得样本代表性差。单纯随机抽样单纯随机抽样系统抽样系统抽样v按照一定顺序,机械地每隔若干单位抽取一个单位的抽样方法。v将总体的个体单位按某种标志排列、编号;v根据总体单位数N、需要的样本数n,确定抽样比例K=N/n,抽样间隔为K1;v以K个单位为一组,用单纯随机抽样的方法确定一个起始号;v每间隔(K1)个单位抽取一个单位为样本。从总体中随机抽取若干群体为抽样单位,对其中所有人进行调查的方法。但总的说来,高血压现患率华北、
19、东北较南方各省、自治区、直辖市为高。简便、易行的科学分组方法是利用随机数字表。分层抽样(stratified sampling)工作量大,调查质量不易控制。描述性研究(descriptive study):又称描述性流行病学(descriptive epidemiology),是利用已有的资料或通过专题调查获得的资料,以述疾病或健康状况在不同地区、时间和人群中的分布情况,找出某些因素与疾病或健康状况间的关系,提供病因线索。以群组为抽样单位进行随机抽样(1)早期发现疾病并及时给予治疗,如乳腺癌的普查;抽样误差一般小于单纯随机抽样。描述性研究(descriptive study):又称描述性流行病
20、学(descriptive epidemiology),是利用已有的资料或通过专题调查获得的资料,以述疾病或健康状况在不同地区、时间和人群中的分布情况,找出某些因素与疾病或健康状况间的关系,提供病因线索。个案调查和病例分析普查的疾病最好是患病率比较高的,以便短时间内调查能得到足够的病例;每间隔(K1)个单位抽取一个单位为样本。描述性研究(descriptive study):又称描述性流行病学(descriptive epidemiology),是利用已有的资料或通过专题调查获得的资料,以述疾病或健康状况在不同地区、时间和人群中的分布情况,找出某些因素与疾病或健康状况间的关系,提供病因线索。抽
21、样调查能否成功的关键样本代表性系统抽样(systemic sampling)整群抽样(cluster sampling)把握度把握度要求高,则样本量应适当增加普查队伍要组织严密且有丰富的经验五、资料分析和结果解释 某些变量需要分组、分级、编码等系统抽样系统抽样v按无关标志排序姓氏笔画顺序、工号、学号;产品按生产时间等。v按有关标志排序 按照身高、体重、年龄等指标从高到低牌序,间隔抽样。系统抽样系统抽样v优点简便易行;样本在总体中的分布均匀,代表性比较好;抽样误差一般小于单纯随机抽样。v局限性总体较大时,抽到的个体分散,资料难以收集;总体各单位排列有某种规律、而且与研究结果有关时,若利用该排列抽
22、样,可产生系统误差(偏倚)。分层抽样分层抽样v将调查的总体按照某种特征分成若干层,然后在每层中进行随机抽样的方法。v分层变量应是总体内部变异的主要因素v层中的抽样方法简单随机抽样或系统抽样v按比例分层抽样将样本含量按每层在总体中所占比例分配到各层中,然后再在每层中按分配的数额抽取研究对象。分层抽样可按年龄、可按年龄、性别、职业、性别、职业、种族等分层种族等分层在各层内再进在各层内再进行随机分组行随机分组层层层层层层总体总体分层抽样分层抽样分层抽样v优点抽样误差小;便于对不同层采用不同的抽样方法;便于对各层独立进行分析;当层间变异大、层内变异小时,最适合用分层抽样的方法。v局限性总体较大时,抽到
23、的个体分散,资料难以收集,不适于大型流行病学研究整群抽样整群抽样v从总体中随机抽取若干群体为抽样单位,对其中所有人进行调查的方法。v将总体分成若干群组v以群组为抽样单位进行随机抽样v被抽到的群组中的全部个体均为调查对象整群抽样整群抽样整群抽样v优点易于组织、实施方便,易为研究对象所接受,节省人力和物力。v局限性抽样误差较大,通常要比其他方法增加1/2的样本含量,分析工作量也较大。多级抽样多级抽样v抽样过程分阶段进行,每个阶段可采用以上任意一种方法抽样,即将上述抽样方法综合运用,优势互补。常用于大型流行病学调查。v先将总体分成若干层,然后整群抽样v按行政区域逐级进行整群抽样。从总体中抽取范围较大
24、的单元(一级抽样),从一级单元中抽取范围较小的单元(二级抽样),依此类推各种抽样方法的抽样误差v整群抽样单纯随机抽样系统抽样分层抽样3.确定样本量 在设计任何一项抽样调查时必须注意的在设计任何一项抽样调查时必须注意的问题之一。样本含量太大或太小均不适宜。问题之一。样本含量太大或太小均不适宜。太大则造成浪费,太小时所要调查的具有某太大则造成浪费,太小时所要调查的具有某种特征的个体可能未包括在样本之内,缺乏种特征的个体可能未包括在样本之内,缺乏代表性而出现偏倚代表性而出现偏倚样本大小的决定因素v预期现患率现患率越低,样本量越大v单位间的变异程度变异越大,样本量越大v精确度要求调查的精确度高,则样本
25、量相应增加v把握度把握度要求高,则样本量应适当增加22dpqund=0.1Pd=0.15Ppq 400pq178计数资料计数资料 分类变量样本量估计分类变量样本量估计抽样调查样本含量的估计例3-1:某地欲了解其50岁以上人口中高血压病的患病率,估计该人口的患病率p=25%,设为0.05,允许误差为0.1p,样本含量为:(人)120025.075.0400400pqn 数值变量样本量估计数值变量样本量估计222/4dsun)(计量资料计量资料05.0抽样调查样本含量的估计例3-2:拟用抽样调查了解某地健康成人白细胞计数的平均水平,希望误差不超过100/mm。已知健康成人白细胞计数的标准差约100
26、0/mm,如定 为0.05,需查多少人?(人)3852.384)1010010100096.1(266n四.资料的收集v利用现有记录资料v访问v体检v现场观察与有关环境因素的检测5.资料的收集 收集的内容 个个人人的的基基本本情情况况职职业业情情况况生生活活习习惯惯及及保保健健情情况况妇妇女女生生育育情情况况人人口口学学资资料料环环境境资资料料常常规规记记录录资资料料专专题题询询问问调调查查专专题题信信函函调调查查各各种种医医学学检检查查收集的方式五、资料分析和结果解释1.1.数据整理数据整理 录入计算机前的检查、双轨录入计算机时的检查和录入计算机前的检查、双轨录入计算机时的检查和统计分析前的
27、检查统计分析前的检查 某些变量需要分组、分级、编码等某些变量需要分组、分级、编码等2.2.数据分析数据分析(1 1)计算有关统计指标)计算有关统计指标(2 2)描述疾病或健康状态的分布)描述疾病或健康状态的分布 患病率患病率(3 3)分析性描述)分析性描述 相关或关联分析、多因素分析相关或关联分析、多因素分析能提供疾病分布情况和流行因素或病因线索;整群抽样(cluster sampling)抽样调查 Sampling Survey耗费人力物理,成本太高抽样调查按一定的概率从总体中随机抽取一个有代表性的样本作为研究对象,然后根据调查所得的样本资料估计和推断被调查现象的总体特征。2、无法区分暴露和
28、疾病之间的时间先后当层间变异大、层内变异小时,最适合用分层抽样的方法。普查(census)是指在特定的时点或时期、特定范围内的全部人群均为研究对象的调查。多级抽样(multistage sampling)再抽取n个观察单位组成样本局限性总体较大时,抽到的个体分散,资料难以收集;保证样本代表性的基本原则随机抽样和样本含量适当将总体的个体单位按某种标志排列、编号;普查的疾病最好是患病率比较高的,以便短时间内调查能得到足够的病例;常用于大型流行病学调查。抽样调查能否成功的关键样本代表性把握度把握度要求高,则样本量应适当增加调查范围小,调查工作容易做得更细致整群抽样单纯随机抽样系统抽样分层抽样经封闭水
29、井,暴发即告终止。2、资料分析和结果解释统计描述统计描述现患病例合 计+-现 况 暴 露+abn1-cdn0合 计m1m0N描述某疾病的频率指标描述某疾病的频率指标 总患病率总患病率=m1/N 暴露分组的患病率暴露分组的患病率 a/n1,c/n0统计描述统计描述现患病例合 计+-现 况 暴 露+abn1-cdn0合 计m1m0N描述暴露频率的指标描述暴露频率的指标 总暴露率总暴露率=n1/N 患病分组的暴露率患病分组的暴露率 a/m1,b/m0例题:高血压与吸烟关系的研例题:高血压与吸烟关系的研究究高血压合 计+-吸烟+46530123477-88476528536合 计13491066412
30、013高血压患病率:高血压患病率:1349/12013=11.231349/12013=11.23抽样调查 Sampling Survey普查队伍要组织严密且有丰富的经验调查目的明确,调查项目简单样本在总体中的分布均匀,代表性比较好;以群组为抽样单位进行随机抽样评价疾病防治、健康促进策略的效果局限性总体较大时,抽到的个体分散,资料难以收集;已知健康成人白细胞计数的标准差约1000/mm,如定 为0.已知健康成人白细胞计数的标准差约1000/mm,如定 为0.分层变量应是总体内部变异的主要因素在一个有N个观察单位的总体中,若抽取n个单位组成随机样本,则每个单位被抽到的概率均应为n/N。某些变量需
31、要分组、分级、编码等抽样调查样本含量的估计局限性总体较大时,抽到的个体分散,资料难以收集;先将总体分成若干层,然后整群抽样但总的说来,高血压现患率华北、东北较南方各省、自治区、直辖市为高。描述性研究(descriptive study):又称描述性流行病学(descriptive epidemiology),是利用已有的资料或通过专题调查获得的资料,以述疾病或健康状况在不同地区、时间和人群中的分布情况,找出某些因素与疾病或健康状况间的关系,提供病因线索。一般只能获得患病率资料,不能获得发病率资料Cross-section一般只能获得患病率资料,不能获得发病率资料总暴露率=n1/N评价疾病防治、
32、健康促进策略的效果工作量大,调查质量不易控制。患病分组的暴露率 a/m1,b/m0抽样调查按一定的概率从总体中随机抽取一个有代表性的样本作为研究对象,然后根据调查所得的样本资料估计和推断被调查现象的总体特征。它既是流行病学研究工作的起点,也是其他流行病学研究方法的基础。1、最常用的流行病学调查方法;调查范围小,调查工作容易做得更细致城市的现患率高于农村,并且现患率升高的年龄,城市较农村约提早10至15年。据1853年统计,在过去几次霍乱流行中,该地区虽曾流行,但远比其他各区轻微。层中的抽样方法简单随机抽样或系统抽样3、适用于暴露因素后期累积作用的观察抽样调查样本含量的估计总暴露率=n1/N1、不太适用于病程比较短的急性病研究分层变量应是总体内部变异的主要因素一般只能获得患病率资料,不能获得发病率资料 录入计算机前的检查、双轨录入计算机时的检查和统计分析前的检查抽样调查能否成功的关键样本代表性但总的说来,高血压现患率华北、东北较南方各省、自治区、直辖市为高。谢谢观看!