1、常用医学统计方法二、医学统计学在临床医学中的应用及意义二、医学统计学在临床医学中的应用及意义1、临床科研设计、临床科研设计2、对搜集资料的内在规律进行分析、对搜集资料的内在规律进行分析3、为医务工作者阅读科技文献和撰写科研论、为医务工作者阅读科技文献和撰写科研论文提供工具文提供工具常用医学统计方法2第二节第二节 统计工作的统计工作的基本步骤基本步骤 统计工作的基本步骤通常分为四步:统计工作的基本步骤通常分为四步:(研究研究)设计、搜集资料、整理资料和分析资料。设计、搜集资料、整理资料和分析资料。一研究设计一研究设计(design)设计一般包括专业设计和统计设计。专业设设计一般包括专业设计和统计
2、设计。专业设计即确定调查题目、内容等。统计设计包括资料计即确定调查题目、内容等。统计设计包括资料收集、整理与分析。收集、整理与分析。统计设计包括资料收集、整理与分析全过程统计设计包括资料收集、整理与分析全过程的统计设想和科学安排。的统计设想和科学安排。常用医学统计方法3二、搜集资料二、搜集资料(data collection)按照设计要求,按照设计要求,原则原则是及时、准确、完整是及时、准确、完整地收集原始数据。地收集原始数据。1、病历、病历2、日常医疗工作记录、日常医疗工作记录3、临床检查与化验记录、临床检查与化验记录4、疾病监测报表、疾病监测报表5、专题研究、专题研究常用医学统计方法5三、
3、整理资料(三、整理资料(data sorting)1、资料的录入和清理资料的录入和清理资料录入前后初步的清理是核实,其次是发现资料录入前后初步的清理是核实,其次是发现异常值。异常值。2、资料的分组、资料的分组 主要方法有按变量的性质分组和按变量的数主要方法有按变量的性质分组和按变量的数量大小分组两种。量大小分组两种。(1)按性质分组)按性质分组(2)按数量分组)按数量分组 一般以分一般以分10-15组为宜。组为宜。常用医学统计方法6吸烟与肺癌的成组病例对照研究资料整理表吸烟与肺癌的成组病例对照研究资料整理表吸烟史吸烟史肺癌病人肺癌病人对照对照合计合计有有6886501338无无215980合计
4、合计7097091418(1)按性质分组)按性质分组常用医学统计方法7表表8 81 1 药物药物A A与药物与药物B B的疗效分析的疗效分析组别组别例数例数治愈人数治愈人数有效人数有效人数无效人数无效人数 治愈率治愈率(%)(%)药物药物A A110110363671713 332.7332.73药物药物B B979752523232131353.6153.61常用医学统计方法8(2)按数量分组)按数量分组 例例9.1(P155),某市某年调查的,某市某年调查的120名名8岁男岁男孩身高(孩身高(cm)资料。)资料。常用医学统计方法9常用医学统计方法10注意注意分组时界限要明确。分组时界限要明
5、确。如:第一组如:第一组112114岁,第二组岁,第二组114116岁,岁,第三组第三组116118岁,界限不明确。岁,界限不明确。又如:第一组又如:第一组112岁,第二组岁,第二组114岁,第岁,第三组三组116岁,分组明确。岁,分组明确。常用医学统计方法11第三节第三节 统计学的几个常用术语及统计方法选择统计学的几个常用术语及统计方法选择一、常用术语一、常用术语1、变量和个体变异、变量和个体变异 根据研究目的确定的观察单位根据研究目的确定的观察单位(observation unit)也称观察对象,或个体。观察单位的某项特也称观察对象,或个体。观察单位的某项特征称为征称为变量变量(varia
6、ble)。变量的观察结果称为变量变量的观察结果称为变量值值(value of variable)。同质同质(homogeneity)是指被研究指标(变量)是指被研究指标(变量)的影响因素相同。在统计学中可以把同质理解为的影响因素相同。在统计学中可以把同质理解为除处理因素外,影响被研究指标较大的、可以控除处理因素外,影响被研究指标较大的、可以控制的主要因素尽可能相同。制的主要因素尽可能相同。变异变异(variation)同质基础上的个体差异称为变同质基础上的个体差异称为变异。异。常用医学统计方法122、总体和样本、总体和样本 总体总体(population)是根据研究目的而确定的同是根据研究目的
7、而确定的同质观察单位的全体。质观察单位的全体。总体又分有限总体和无限总体。总体又分有限总体和无限总体。样本样本(sample)是按随机化原则从总体中抽出是按随机化原则从总体中抽出的部分观察单位的某变量值的集合。的部分观察单位的某变量值的集合。常用医学统计方法133、抽样和抽样误差、抽样和抽样误差 抽样是指从总体选取样本的过程。抽样是指从总体选取样本的过程。抽样研究抽样研究是从总体中随机抽取部分观察单位,是从总体中随机抽取部分观察单位,其变量值构成样本,用样本信息来推断总体特征。其变量值构成样本,用样本信息来推断总体特征。由于抽样所造成的样本指标与总体指标的差由于抽样所造成的样本指标与总体指标的
8、差异称为异称为抽样误差抽样误差(sampling error)。抽样误差是抽样研究不可避免的,但有一定抽样误差是抽样研究不可避免的,但有一定的规律性。的规律性。常用医学统计方法144、概率和小概率事件、概率和小概率事件 概率概率(probability)是反映某一事件发生的可是反映某一事件发生的可能性的大小,常用符号能性的大小,常用符号P表示。其值在表示。其值在0和和1之间之间()。概率等于)。概率等于1的事件是必然事件,概的事件是必然事件,概率等于率等于0的事件是不可能事件,随机事件的概率的事件是不可能事件,随机事件的概率小于小于1,而大于,而大于0()。)。小概率事件小概率事件习惯习惯上是
9、指概率(上是指概率()的事件。)的事件。10P10P05.0P常用医学统计方法155、参数与统计量、参数与统计量 根据总体资料计算得到的指标称为根据总体资料计算得到的指标称为参数参数(parameter)。例如总体均数、总体标准差、总例如总体均数、总体标准差、总体率等。体率等。根据样本变量值计算出来的指标称为根据样本变量值计算出来的指标称为统计统计量量(statistic)。例如样本均数、样本标准差、样例如样本均数、样本标准差、样本率。本率。常用医学统计方法16二、资料的类型二、资料的类型1 1、定量变量定量变量(numerical variable)numerical variable)也称
10、数值变量或计量资料,即用定量方法测也称数值变量或计量资料,即用定量方法测得的变量值称为定量变量。表现为数值的大小,得的变量值称为定量变量。表现为数值的大小,常有度量衡单位。常有度量衡单位。2 2、定性变量定性变量(categorical variable)categorical variable)也称分类变量,即按某种属性或类别分组也称分类变量,即按某种属性或类别分组,所得的各组变量值个数称为定性变量。表现为互所得的各组变量值个数称为定性变量。表现为互不相容的类别或属性。不相容的类别或属性。根据各类别之间有无程度上的差别又分为无序分根据各类别之间有无程度上的差别又分为无序分类类(unorder
11、ed categories)unordered categories)和有序分类和有序分类(ordinal ordinal categories)categories)变量,有序分类又称变量,有序分类又称等级资料等级资料。常用医学统计方法17 根据分析的需要,各类变量间可以互相转根据分析的需要,各类变量间可以互相转换。但原始资料应尽量保存数值变量,以便分换。但原始资料应尽量保存数值变量,以便分析资料时可根据需要进行转换。析资料时可根据需要进行转换。例例9.1(9.1(P155)P155),某市某年调查的某市某年调查的120120名名8 8岁男岁男孩身高(孩身高(cmcm)资料。资料。常用医学统计方法18