1、临床病理数据收集及处理方法简介临床病理数据收集及处理方法简介1主要内容主要内容l科研思路确立,研究的主题l前瞻性研究l回顾性研究l数据库建立l数据标准化l数据处理l结果输出-文章撰写 2科研思路确立,研究的主题科研思路确立,研究的主题l长期病理观察现象的总结l密切联系临床病理工作l论证是否具有临床工作的指导意义l个人兴趣而在某一领域做系统性研究3研究的方法研究的方法l前瞻性研究(prospective study)l以现在为起点追踪到将来的研究方法;l预定好研究对象,研究方式;l相关的影响因素纳入统计范围;l做持续的追踪研究;l分析判断统计;l相关影响波动有效的因素构成重点目标。4研究的方法研
2、究的方法l前瞻性研究(prospective study)l以现在为起点追踪到将来的研究方法;l预定好研究对象,研究方式;l相关的影响因素纳入统计范围;l做持续的追踪研究;l分析判断统计;l相关影响波动有效的因素构成重点目标。l由“因”至“果”的研究方法5研究的方法研究的方法l回顾性研究l过去某时点开始到其后某一时点或直到研究当时l分析入组数据的特征或暴露情况l相当于从过去某时点开始的前瞻性研究的随访,l调查过去的既成事实l病理研究多采用回顾性研究方法6临床病理研究数据库建立临床病理研究数据库建立l多采用EXCEL软件l数据库的表结构l第一行为:字段名称l以后追加数据变量l字段名称:编号、姓名
3、、性别、年龄、病理号、临床资料、研究资料、预后数据等78数据标化处理,准备用于统计分析数据标化处理,准备用于统计分析1:阴性结果 2:阳性结果9统计准备统计准备l统计软件SPSSl可以直接导入EXCEL数据l也可以在SPSS软件中直接建立数据库l资料类型包括:定量资料、计量资料、计数资料、定性资料、名义资料、有序资料10正态检验正态检验l对所收集资料的分布特征进行检验,以确定是否符合正态或近似正态。l定量资料和频数资料(加权处理)。l用于了解不明数据的分布特征。l样本量较小时,应当常规做正态检验。l偏度计算,描述分布的对称性lSkewness值l0正偏态l0负偏态l=0 正态lKolmogor
4、ov-Smirnov 检验 lZ值,P值(0.05,接收正态分布资料假设)11方差齐性检验方差齐性检验l收集标本总会出现抽样误差l均值比较时要求组间的方差齐同,如t检验和方差分析l方差不齐就不能选择该方法l要么增加样本量减少抽样误差l要么选择非参数检验l方差齐性检验(Homogeneity of variance test)是数理统计学中检查不同样本的总体方差是否相同的一种方法 l两独立样本t检验,单因素方差分析等,除要求检验数据满足正态或近正态,还要求2组数据满足方差齐性l方差齐F值,P值0.05 表示方差齐lt检验则真实可靠,P值0.05 得出检验结果12t检验检验l样本信息推断总体特征,
5、最常用l主要用于定量资料统计学处理。l主要方法l单样本t检验l两独立样本t检验(成组t检验)l配对资料t检验(方差不齐时使用)l近似t检验(方差不齐时使用)l使用要求l必须是定量资料、计量资料和计数资料l符合正态分布l比较组应当方差具有方差齐性13方差分析方差分析lF检验l主要用于3组及3组以上样本均数比较l满足正态性:要做正态检验l方差齐性:判断是否具有方差齐性l应当采用方差分析的资料反复进行多次t检验是最常见统计学方法错误l运算过程:lKolmogorov-Smirnov 检验正态性P0.05lLevene检验方差齐性 P0.05lF值 P0.05 得出具有差异的结论14X2检验检验l主要
6、用于定性资料的统计学处理l四格表X2检验l检验方法:lPearson chi-Square:样本总数40,各单元数目5l连续性校正X2检验(Continuity Corretion):样本总数40,但某一格数目1,5l确切概率法(Fisher法):l样本数40;l格子中1的达到1个以上;lP为临界状态l似然比X2检验(Likelihood Ratio):用于RC表(多行多列)15X2检验检验l主要用于定性资料的统计学处理lRC(多行多列)X2检验l检验方法:lPearson chi-Square:样本总数40,各单元数目5l确切概率法(Fisher法):l似然比X2检验(Likelihood
7、Ratio):用于RC表(多行多列)l总体无差异性,统计结束l总体有差异性,要进行两两比较lX2检验的RC表分割16秩和检验秩和检验l对样本资料无特殊要求l非参数检验l总体分布为偏态l总体分布形式未知l观察例数偏少n30,且总体分布形势不确定l有序或无序的等级资料l个别数据偏大l样本均数方差不齐17相关分析相关分析l观察两个或两个以上变量的变化研究他们之间的关系l需要首先进行正态检验l符合正态:Pearson相关分析 r值 P值l不符合正态:Spearman,Kendolll判读lr0 正相关lr0 负相关l绝对值越大说明相关性越好18生存分析生存分析l根据试验或调查得到的数据对生物或人的生存时间进行分析和推断l研究生存时间和结局及众多影响因素间关系及其程度大小的方法 l应变量2个l生存时间,不符合正态分布l结局:生存,死亡,痊愈,好转,无效l有些数据观察不全,失访l主要方法lKaplan-Meier生存分析(Log rank检验 P0.05)l单因素组间比较l死亡一般为阳性值;存活与失访同组l得出组间生存曲线19Cox回归分析回归分析l多因素生存分析l得出独立性预后因素结论20引文管理软件引文管理软件lNoteExpressl用于管理引文l文章引文插入21222324252627