1、第一章第一章 基础知识基础知识第一节第一节 什么是统计学什么是统计学?什么是医学统计学什么是医学统计学?统计学统计学(statistics)来自拉丁语中的国家来自拉丁语中的国家(status),历史上指的是历史上指的是,一个国家政府要求的来一个国家政府要求的来自各个地区的资料自各个地区的资料,例如例如,税收税收,农作物的种植等等农作物的种植等等.现在所说的统计学是现在所说的统计学是:设计设计(design);收集收集数据数据(data collection);整理数据整理数据(sorting data);分析数据分析数据(analysis)的一门学科的一门学科.使用统计学的目的是使用统计学的目
2、的是,从大量观察数据中得从大量观察数据中得到规律性的结论到规律性的结论.统计学是一门统计学是一门收集和分析数据的收集和分析数据的艺术艺术(art).把统计学应用到医学领域中就是把统计学应用到医学领域中就是医学统计学医学统计学.北京某医院某大夫用“乌贝散”治疗胃溃疡出血107例,有效101例,有效率为94.4%。问别的医院是否有效率也是94.4%?某临床医生研究两种药物治疗脱发的效果,两药均观察了20例患者,甲药,乙药有效率分别为75%和95%。能否认为乙药优于甲药?北京某医院有位老大夫,用冠心灵治疗冠心病,其对照组用西药.观察结果如下:冠心灵与单纯西药疗效请问冠心灵是否比单纯西药有效?用某种中
3、草药治疗玫瑰糠疹,有效率为78%,平均疗程3周.由于玫瑰糠疹不服药3周后也可自愈.问:此药是否的确有效?上述这些问题都涉及到统计分析,只有正确运用统计分析方法,才不会造成不应有的缺陷或得出错误的结论.医学统计学的内容分为两部分医学统计学的内容分为两部分:描述性医学统计学描述性医学统计学(descriptive statistics):(descriptive statistics):从数据计算均数从数据计算均数,标准差标准差,率率,构成比构成比等等推断性医学统计学推断性医学统计学(inferential statistics):(inferential statistics):从样本统计量推断
4、总体参数从样本统计量推断总体参数,从多样从多样本统计量推断多总体参数有无差别本统计量推断多总体参数有无差别.第二节第二节 数据数据(data)(data)及其分类及其分类(category)(category)v统计学研究的对象是数据统计学研究的对象是数据 俗话说俗话说“用数据说话用数据说话”,指的就是,指的就是结论要有数据支持,不能凭空瞎说结论要有数据支持,不能凭空瞎说得到数据的方法有两种:得到数据的方法有两种:观察观察:观察者处于被动的地位,记:观察者处于被动的地位,记录下录下“自然而然自然而然”发生的结果,不去改发生的结果,不去改变所观察的事物如,研究吸烟和肺癌变所观察的事物如,研究吸烟
5、和肺癌之间的关系,可以记录下被调查者是否之间的关系,可以记录下被调查者是否吸烟,每天吸多少只烟,是否患肺吸烟,每天吸多少只烟,是否患肺癌但是不能也不会改变被调查者的状癌但是不能也不会改变被调查者的状况在流行病学调查中是常见的况在流行病学调查中是常见的v试验试验:观察者处于主动的地位,:观察者处于主动的地位,记录下记录下“试验条件试验条件下下”发生的结果如,发生的结果如,研究一种药物的疗效,可以找具有相同研究一种药物的疗效,可以找具有相同条件(性别比,年龄,患有同样的疾病,条件(性别比,年龄,患有同样的疾病,病程相同等)的两组人群,其中一组人病程相同等)的两组人群,其中一组人群不服用该药(称为对
6、照组),另一组群不服用该药(称为对照组),另一组人群服用该药(称为治疗组),经过一人群服用该药(称为治疗组),经过一个疗程,记录他们的数据(如,生化指个疗程,记录他们的数据(如,生化指标等)从而研究该药有无疗效在临标等)从而研究该药有无疗效在临床医学和基础医学研究中是常见的床医学和基础医学研究中是常见的数据分类数据分类1.1.计量数据计量数据(quantitative data):(quantitative data):有单位有单位,有数值大小的数据有数值大小的数据.例如例如:身高(米)身高(米),体重(千克)体重(千克),血压值(血压值(),脉搏数(次分)等脉搏数(次分)等.例例 某农村地区
7、某农村地区19991999年年1414岁女孩的身高岁女孩的身高(厘厘米米)数据分类数据分类2.2.分类数据分类数据(categorical data):(categorical data):记录频记录频(个个)数的数据数的数据.细分为两种细分为两种:2.1.2.1.无序分类(名义)数据无序分类(名义)数据(nominal(nominal data)data)例如例如;血型(,)血型(,),性别(男,性别(男,女)等女)等.计算患病率计算患病率数据分类数据分类2.2.分类数据分类数据(categorical data):(categorical data):2.2.2.2.等级(有序)资料等级(
8、有序)资料(ordinal data)(ordinal data)例如;病情的轻,中,重等.甲亢病人与性别的关系。计算构成比计算构成比第三节第三节 统计学的基本概念统计学的基本概念1.随机变量随机变量:变量是一个数学名词变量被用于描写事物特征,用字母表示,如:用表示身高,用sex表示性别等变量可以在某个连续范围中取值,叫连续随机变量连续随机变量(continuous variable):(continuous variable):取连续取连续值值(计量数据计量数据)的变量的变量.变量只能取某些固定的(分类)值,叫 分类变量分类变量(categorical variable)(categoric
9、al variable):取分类值(分类数据)的变量.使用一个变量描述研究对象的统计学称使用一个变量描述研究对象的统计学称为为一元统计学一元统计学,使用多个变量描述研究对象的统使用多个变量描述研究对象的统计学称为计学称为多元统计学多元统计学.2 2 总体和样本总体和样本总体总体(population):(population):观察对象观察对象(同质个体同质个体)的全体的全体称为总体称为总体.总体可以是观察的人群或动物总体可以是观察的人群或动物,也可以也可以是指标是指标.例如例如:高血压患者高血压患者;高寒地区人群的脉搏数高寒地区人群的脉搏数.样本样本(sample):(sample):随机地
10、随机地从总体中抽出的部分对象从总体中抽出的部分对象(同质个体同质个体)的集合的集合.有时也称为有代表性的部分有时也称为有代表性的部分.总体与样本的关系是总体与样本的关系是:总体 样本3 3 参数和统计量参数和统计量参数参数(parameter)(parameter):总体的数值特征.用小写希腊字母表示.均数(),标准差(),方差(2),标准误等.率(),构成比,率的标准差等.统计量统计量(statistic):(statistic):样本的数值特征样本的数值特征.用拉丁字母表示用拉丁字母表示.均数均数(X,x)X,x),标准差标准差(S,sS,s),),方差方差(S S2 2,s,s2 2),
11、),标标准误等准误等.率率(p p),),构成比构成比,率的标准差等率的标准差等.4 4 概率概率(probability)(probability)客观世界中事物的发生有两种形式:确定的确定的如:在一个大气压下,水在摄氏100度时沸腾平抛运动的轨迹是抛物线(牛顿第二定律)等等不不确定的确定的如:投掷一枚硬币,正面向如:投掷一枚硬币,正面向上还是背面向上,投掷前是不能确定上还是背面向上,投掷前是不能确定的只有投掷后才知道但是,投掷次的只有投掷后才知道但是,投掷次数多了,可以知道正面和反面的次数大数多了,可以知道正面和反面的次数大致相等致相等试验结果试验结果描述不确定事件发生的可能性的数学量是描
12、述不确定事件发生的可能性的数学量是概率概率概率概率:事件发生的可能性事件发生的可能性.用一个实数表示用一个实数表示,大于等于零大于等于零,小于等于小于等于1.1.必然事件的概率为1,即P(U)=10P(A)1我们用P(A)表示事件A发生的概率,则 不可能事件的概率为0,即 P(V)=0例如:天气预报中的今天下雨概率是60,你怎么理解?掷骰子出现1点的概率是1/6,你怎么理解?正确的理解是:如果出现像今天这样的气象条件,温度,湿度,风向,风力等100天,那么会有60天下雨 如果掷骰子6次,那么会出现1次1点5统计研究设计的原则统计研究设计的原则v统计学方面的设计是医药卫生科研设计统计学方面的设计
13、是医药卫生科研设计不可或缺的部分。医药卫生科研主要有不可或缺的部分。医药卫生科研主要有两大类:干预性研究和观察性研究。两大类:干预性研究和观察性研究。四个原则:对照,重复,随机和均衡安慰剂对照空白对照对照 实验对照自身对照标准对照安慰剂对照空白对照对照实验对照自身对照标准对照整个实验的重复重复 用多个受试对象重复同一受试对象的重复观察整个实验的重复重复 用多个受试对象重复同一受试对象的重复观察 随机化方法:1 完全随机化:直接对受试对象进行随机化分组。2 分层随机化:对影响实验过程和结果的混杂因素分层,在每一层内完全随机化。均衡:在设立对照时除给予处理因素不同外,其它对实验效应有影响的因素(非
14、处理因素)尽量均衡一致。6抽样方法抽样方法v1 单纯随机抽样单纯随机抽样v 保证总体中的每一个个体都有同等的机保证总体中的每一个个体都有同等的机会被抽出来作为样本的抽样方法,称为会被抽出来作为样本的抽样方法,称为单纯随机抽样,或简单随机抽样。单纯随机抽样,或简单随机抽样。分层随机抽样 先将总体全部个体按某种特征分成若干层,再从每一层内随机抽取一定数量的个体合起来组成样本。3 整群抽样先将总体分成若干群体,从中随机抽取几个群体组成样本;对抽中群体的全部个体进行调查,称为整群抽样.三种抽样方法比较 中华医学会系列杂志 对统计学处理的有关要求:1 统计研究设计合理2 资料的表达和描述正确 正确选择统计分析方法3 正确解释和表达统计结果