1、编辑版编辑版pptppt1 1 编辑版编辑版pptppt2 2内容提要内容提要为什么要学统计学为什么要学统计学?编辑版编辑版pptppt3 3统计学统计学(statistics)从数据中提取信息的一门学科从数据中提取信息的一门学科医学统计学(医学统计学(medical statistics)用统计学的原理和方法研究医学中的问题用统计学的原理和方法研究医学中的问题什么是医学统计学什么是医学统计学?编辑版编辑版pptppt4 41.1.科研设计:科研设计:包括调查设计、实验设计包括调查设计、实验设计2.2.收集资料:收集资料:取得准确可靠的原始资料取得准确可靠的原始资料3.3.整理资料:整理资料:
2、对资料进行清理、改错,数对资料进行清理、改错,数量化量化4.4.分析资料:分析资料:统计描述、统计推断统计描述、统计推断编辑版编辑版pptppt5 51.1.采用统计学方法,发现不确定现采用统计学方法,发现不确定现象背后隐藏的规律。象背后隐藏的规律。编辑版编辑版pptppt6 62.2.用统计学思维方式考虑有关医学研用统计学思维方式考虑有关医学研究中的问题究中的问题 “阳性阳性”结果能否说明干预有效?结果能否说明干预有效?某感冒药治疗某感冒药治疗1周后,治愈率为周后,治愈率为90%,能否说该感冒,能否说该感冒药十分有效?药十分有效?(时间效应)(时间效应)“阴性阴性”结果是否说明干预无效?结果
3、是否说明干预无效?样本含量是否足够?(吸烟与肺癌的相关性)样本含量是否足够?(吸烟与肺癌的相关性)干预时间是否足够?(心理护理与心理健康)干预时间是否足够?(心理护理与心理健康)编辑版编辑版pptppt7 73.3.保证你的论文能通过统计学审查保证你的论文能通过统计学审查 中华医学会杂志中华医学会杂志对来稿都有统计学要对来稿都有统计学要求或统计学指导。求或统计学指导。科学的科研设计科学的科研设计 正确的统计分析正确的统计分析 准确的结论推断准确的结论推断 编辑版编辑版pptppt8 84.4.获得循证医学证据的主要手段获得循证医学证据的主要手段“以证据为基础的医学以证据为基础的医学”(evid
4、ence-based medicine,EBM)需要运用)需要运用最好最好的统计学证据的统计学证据可靠可靠“证据证据”:随机对照试验:随机对照试验编辑版编辑版pptppt9 91.1.了解了解医学统计学的基本概念医学统计学的基本概念2.2.掌握掌握医学统计数据的分类医学统计数据的分类3.3.掌握掌握统计学分析方法的选择统计学分析方法的选择4.4.了解了解SPSSSPSS统计学软件的使用统计学软件的使用编辑版编辑版pptppt1010胆管癌患者部分指标胆管癌患者部分指标 编号编号 性别性别 年龄(岁)年龄(岁)部位部位 分化程度分化程度 分期分期 肝转移肝转移 PCNA指数指数 生存时间生存时间
5、(月月)(1)(2)(3)(4)(5)(6)(7)(8)(9)1 男男 61 上上 低分化低分化 阳性阳性 52 14 2 女女 58 中中 高分化高分化 阴性阴性 89 20 3 女女 63 上上 高分化高分化 阴性阴性 93 19 4 女女 71 下下 中分化中分化 阳性阳性 78 5 5 男男 59 上上 高分化高分化 阴性阴性 85 35 编辑版编辑版pptppt1111总体总体:根据研究目的:根据研究目的确定的确定的同质同质研究对象研究对象的的全体全体(集合)。(集合)。样本样本:从总体中随机:从总体中随机抽取的部分研究对象抽取的部分研究对象 编辑版编辑版pptppt1212为了保证
6、样本的为了保证样本的可靠可靠性性和和代表性代表性,需要采,需要采用随机的方法抽取样用随机的方法抽取样本(在总体中每个个本(在总体中每个个体具有体具有相同的机会相同的机会被被抽到)。抽到)。编辑版编辑版pptppt1313 随机抽样的方法:随机抽样的方法:抽签法:编号、抽签抽签法:编号、抽签机械抽样法:又称等间隔抽样,按比例分配机械抽样法:又称等间隔抽样,按比例分配分层抽样法:先分层,每层内按比例抽样分层抽样法:先分层,每层内按比例抽样随机数字:随机数字表、软件产生随机数字随机数字:随机数字表、软件产生随机数字研究研究目的目的总体总体湘雅二医院湘雅二医院20201111年全体住院年全体住院患者满
7、意度得分值患者满意度得分值观测单位观测单位每个住院患者每个住院患者观测值观测值每个住院患者满意度得分每个住院患者满意度得分样本样本从湘雅二医院从湘雅二医院2011年全体住院患者年全体住院患者中随机抽取中随机抽取1000人测得满意度得分人测得满意度得分编辑版编辑版pptppt1515 样本的实际发生率样本的实际发生率称为称为频率频率。设在相。设在相同条件下,独立重复进行同条件下,独立重复进行n n次试验,事件次试验,事件A A出现出现f f 次,则事件次,则事件A A出现的频率为出现的频率为f f/n n。概率概率:随机事件发生的可能性大小:随机事件发生的可能性大小,用大写的用大写的P P 表示
8、;取值表示;取值00,11。编辑版编辑版pptppt1616频率与概率间的关系:频率与概率间的关系:1.样本频率总是围绕概率上下波动样本频率总是围绕概率上下波动 2.样本含量样本含量n越大,波动幅度越小,越大,波动幅度越小,频率越接近概率。频率越接近概率。编辑版编辑版pptppt1717必然事件必然事件 P P=1=1随机事件随机事件 0 0 P P 1 1不可能事件不可能事件 P P=0=0 P P 0.05 0.05(5 5)或)或P P 0.01 0.01(1 1)称为称为小小概率事件概率事件(习惯习惯),统计学上认为不大可能发生。,统计学上认为不大可能发生。编辑版编辑版pptppt18
9、18100%某一组成部分的观察单位数构成比 同一事物各组成部分的观察单位总数=(100%)甲指标相对比乙指标某时期内发生某现象的观察单位数率比例基数 同期可能发生某现象的观察单位总数编辑版编辑版pptppt19191.不能以构成比代率不能以构成比代率放环情况(1)放环人数(2)失败人数(3)失败人数比(%)(4)失败率(%)(5)人工流产后 255 78 61.9 30.6 月经后 87 39 31.0 44.8 哺乳期 17 9 7.1 52.9 合 计 359 126 100.0 35.1 表表 已婚育龄妇女不同情况下放环失败率的比较已婚育龄妇女不同情况下放环失败率的比较 编辑版编辑版pp
10、tppt2020 年龄组(岁)患者人数 患者构成比(%)0 9 3.8 10 36 15.3 20 34 14.4 30 37 15.7 40 45 19.1 50 39 16.5 60 21 8.9 70 15 6.3 合计 236 100.0 表表 口腔门诊龋齿患者年龄构成口腔门诊龋齿患者年龄构成 例如例如某医师对口腔门诊不同年龄龋齿患病情况某医师对口腔门诊不同年龄龋齿患病情况进行了分析,得出进行了分析,得出4049岁组患病率高,岁组患病率高,09岁组和岁组和70岁及以上组患病率低的错误结论。岁及以上组患病率低的错误结论。编辑版编辑版pptppt2121 如果例数较少会使相对数波动较大。如
11、某种如果例数较少会使相对数波动较大。如某种疗法治疗疗法治疗5例病人例病人5例全部治愈,则计算治愈率例全部治愈,则计算治愈率为为5/5100%=100%,若若4例治愈,则治愈率例治愈,则治愈率为为4/5100%=80%,由由100%至至80%波动幅度波动幅度较大,但实际上只有较大,但实际上只有1例的变化。例的变化。2.计算相对数分母不宜太小计算相对数分母不宜太小编辑版编辑版pptppt22221112221212,pXnpXnXXpnn若则 合 计 率例如用某疗法治疗肝炎,甲医院治疗例如用某疗法治疗肝炎,甲医院治疗150人,治人,治愈愈30人,治愈率为人,治愈率为20%;乙医院治疗;乙医院治疗1
12、00人,治人,治愈愈30人,治愈率为人,治愈率为30%。两个医院合计治愈率应。两个医院合计治愈率应该是该是(30+30)/(150+100)100%=24%。编辑版编辑版pptppt2323 (1)观察对象是否同质,研究方法是否相同,)观察对象是否同质,研究方法是否相同,观察时间是否相等,以及地区、周围环境、风俗观察时间是否相等,以及地区、周围环境、风俗习惯和经济条件是否一致或相近等。习惯和经济条件是否一致或相近等。(2)观察对象内部结构是否相同,若两组资)观察对象内部结构是否相同,若两组资料的年龄、性别等构成不同,可以分别进行同年料的年龄、性别等构成不同,可以分别进行同年龄别、同性别的小组率
13、比较或对总率(合计率)龄别、同性别的小组率比较或对总率(合计率)进行标准化后再作比较。进行标准化后再作比较。编辑版编辑版pptppt2424问:流脑的预防工作问:流脑的预防工作1990年不如年不如1985年吗?年吗?编辑版编辑版pptppt2525根据变量值的性质可将资料分为根据变量值的性质可将资料分为:计量资料、计数资料、等级资料计量资料、计数资料、等级资料编辑版编辑版pptppt2626定义定义:用用定量定量的方法对观察单位准确测量后的方法对观察单位准确测量后所得的资料所得的资料。特点特点:有有度量衡单位度量衡单位,多为,多为连续性资料连续性资料。连续数据:连续数据:例:身高、体重、年龄、
14、体温、血压 离散数据:离散数据:例:心率、白细胞计数、24小时早博次数编辑版编辑版pptppt2727定义:定义:用用定性定性的方法得到的资料。将全的方法得到的资料。将全体观测单位按照某种性质或特征分组,体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数然后再分别清点各组观察单位的个数。特点:特点:没有度量衡单位没有度量衡单位;多为;多为间断性资间断性资料料。2.2.计数资料计数资料-分类变量资料分类变量资料编辑版编辑版pptppt2828两分类数据两分类数据(binary data)binary data):例:男例:男/女;怀孕女;怀孕/未怀孕;糖尿病未怀孕;糖尿病/非糖尿
15、病非糖尿病;吸烟吸烟/不吸烟;高血压不吸烟;高血压/血压正常血压正常多分类数据多分类数据(polytomous data)polytomous data):名义数据名义数据(nominal)nominal):已婚已婚/单身单身/离婚离婚/分居分居/鳏鳏寡;寡;A/B/AB/OA/B/AB/O有序数据有序数据(ordinal categories)ordinal categories):轻轻/中中/重;重;治愈、好转、无效治愈、好转、无效;编辑版编辑版pptppt2929 定义:定义:将观察单位按某种属性的不同程度将观察单位按某种属性的不同程度分成分成等级等级后分组计数所得的资料,后分组计数所得
16、的资料,是介于计量资料和计数资料之间的是介于计量资料和计数资料之间的一种资料。一种资料。特点:特点:其变量值具有其变量值具有半定量半定量性质,表现为性质,表现为等级大小等级大小或或属性程度属性程度。3.3.等级资料等级资料 例:一组例:一组20 40岁成年人的血压岁成年人的血压以以12kPa12kPa为界分为正常(为界分为正常(0 0)与异常()与异常(1 1)两组,)两组,统计每组例数统计每组例数 8 低血压低血压 1 1 8 8 正常血压正常血压 2 2 12 12 轻度高血压轻度高血压 3 3 15 15 中度高血压中度高血压 4 4 17 17 重度高血压重度高血压 5 5计量数据计量
17、数据等级数据等级数据计数数据计数数据 不同资料转化举例(每分钟脉搏次数)不同资料转化举例(每分钟脉搏次数)计量资料计量资料 计数资料计数资料 等级资料等级资料 7575 缓缓 脉(脉(6060 )8282 正常(正常(60 60 100 100)125125 正常脉(正常脉(6060100100)9696 异常(异常(60100100)5656 速速 脉(脉(100100 )住院号住院号年龄年龄身高身高体重体重住院天数住院天数职业职业文化程度文化程度分娩方式分娩方式妊娠结局妊娠结局20256552025655272716516571.571.55 5无无中学中学顺产顺产足月足月20256532
18、025653222216016074.074.05 5无无小学小学助产助产足月足月20258302025830252515815868.068.06 6管理员管理员大学大学顺产顺产足月足月20225432022543232316116169.069.05 5无无中学中学剖宫产剖宫产足月足月20224662022466252515915962.062.01111商业商业中学中学剖宫产剖宫产足月足月20245352024535272715715768.068.02 2无无小学小学顺产顺产早产早产20258342025834202015815866.066.04 4无无中学中学助产助产早产早产201
19、94642019464242415815870.570.53 3无无中学中学助产助产足月足月20257832025783292915415457.057.07 7干部干部中学中学剖宫产剖宫产足月足月观察单位observations个体individuals变量variablesQuantitative data Quantitative data 计量资料计量资料Qualitative data Qualitative data 计数资料计数资料编辑版编辑版pptppt3333编辑版编辑版pptppt34341.1.计量数据计量数据:计算计算均数均数、标准差标准差等(可等(可采用采用t t、F
20、 F检验等检验等)2.2.计数数据计数数据:编码是任意的,不能对编码执行均编码是任意的,不能对编码执行均数标准差等计算,但可计算数标准差等计算,但可计算率或比率或比(可采用卡方可采用卡方检验等检验等)3.等级数据:允许基于顺序的计算,如计算等级数据:允许基于顺序的计算,如计算中位中位数、百分位数数、百分位数(可当做计数数据处理可当做计数数据处理)编辑版编辑版pptppt3535变量关系的显著性检验类型变量关系的显著性检验类型定类定序定距定类卡方类测量(卡方检验)卡方类测量(卡方检验)方差分析(F 检验)定序Spearman 相关系数(Z 检验)Spearman 相关系数(Z 检验)定距Pear
21、son 相关(F 检验)回归系数(T 检验)等等 级级计计 数数计计 量量计计 数数等等 级级计计 量量编辑版编辑版pptppt3636表 4-1 g 个处理组的试验结果 处理分组 测量值 统计量 1 水平 X11 X12 X1j 1nX1 n1 1X S1 2 水平 X21 X22 X2j 2nX2 n2 2X S2 g 水平 Xg1 Xg2 Xgj ggnX ng gX Sg 完全随机设计资料的方差分析的基本思想完全随机设计资料的方差分析的基本思想 合计合计 N S XijX编辑版编辑版pptppt37371.1.对于正态分布且方差齐同的资料,常采用对于正态分布且方差齐同的资料,常采用单因
22、单因素方差分析素方差分析的的单向分类的方差分析单向分类的方差分析或成组资料或成组资料的的 t t 检验(检验(g g=2=2););2.2.对于非正态分布或方差不齐的资料,可进行对于非正态分布或方差不齐的资料,可进行数数据变换据变换或采用或采用WilcoxonWilcoxon秩和检验秩和检验。编辑版编辑版pptppt3838 例例 某医生为了研究一种降血脂新药的临某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择床疗效,按统一纳入标准选择120120名高血名高血脂患者,采用完全随机设计方法将患者等脂患者,采用完全随机设计方法将患者等分为分为4 4组(具体分组方法见表组(具体分组方法见表
23、5 5),进行),进行双盲试验。双盲试验。6 6周后测得周后测得低密度脂蛋白低密度脂蛋白作为作为试验结果,见表试验结果,见表4-34-3。问。问4 4个处理组患者个处理组患者的低密度脂蛋白含量总体均数有无差别的低密度脂蛋白含量总体均数有无差别?完全随机设计完全随机设计统计量 分 组 测量值 n iX X 2X 3.53 4.59 4.34 2.66 3.59 3.13 2.64 2.56 3.50 3.25 3.30 4.04 3.53 3.56 3.85 4.07 3.52 3.93 4.19 2.96 安慰剂组 1.37 3.93 2.33 2.98 4.00 3.55 2.96 4.3
24、4.16 2.59 30 3.43 102.91 367.85 降血脂新药 2.42 3.36 4.32 2.34 2.68 2.95 1.56 3.11 1.81 1.77 1.98 2.63 2.86 2.93 2.17 2.72 2.65 2.22 2.90 2.97 2.4g 组 2.36 2.56 2.52 2.27 2.98 3.72 2.80 3.57 4.02 2.31 30 2.72 81.46 233.00 2.86 2.28 2.39 2.28 2.48 2.28 3.21 2.23 2.32 2.68 2.66 2.32 2.61 3.64 2.58 3.65 2.66
25、 3.68 2.65 3.02 4.8g 组 3.48 2.42 2.41 2.66 3.29 2.70 3.04 2.81 1.97 1.68 30 2.70 80.94 225.54 0.89 1.06 1.08 1.27 1.63 1.89 1.19 2.17 2.28 1.72 1.98 1.74 2.16 3.37 2.97 1.69 0.94 2.11 2.81 2.52 7.2g 组 1.31 2.51 1.88 1.41 3.19 1.92 2.47 1.02 2.10 3.71 30 1.97 58.99 132.13 表表5 45 4个处理组低密度脂蛋白测量值个处理组低密度
26、脂蛋白测量值(mmol/L)(mmol/L)编辑版编辑版pptppt4040H0:1234,即4个试验组的总体均数相等 H1:4个试验组的总体均数不全相等 0.05 按表4-4中的公式计算各离均差平方和SS、自由度、均方MS和F值。H0:即即4个试验组总体均数个试验组总体均数相等相等 H1:4个试验组总体均数不全相等个试验组总体均数不全相等 12340.052.计算检验统计量计算检验统计量 1.建立检验假设,确定检验水准建立检验假设,确定检验水准0.053.确定确定P值,作出推断结论:值,作出推断结论:按按 水准水准 如果如果P0.05,则不能拒绝则不能拒绝H0,不能认为,不能认为4个试个试验
27、组验组ldl-c总体均数有差别。总体均数有差别。编辑版编辑版pptppt4242分组分组观测值观测值记得一定要记得一定要是计量资料是计量资料建立数据库建立数据库编辑版编辑版pptppt43432个或者个或者2个以个以上组之间某观上组之间某观测值的比较测值的比较2个组之间某个组之间某观测值的比较观测值的比较编辑版编辑版pptppt4444观测值观测值分组分组编辑版编辑版pptppt4545两两比较时选择两两比较时选择编辑版编辑版pptppt4646编辑版编辑版pptppt4747 1.不同科室护士实施静脉输液操作所用工 时是否差别?2.不同科室患者满意度是否有差别?3.不同科室护士职业倦怠感和生
28、活质量得分是否有差别?4.实施护理干预组与未实施护理干预组患者满意度、住院时间、住院费用、康复时间等是否有差别?编辑版编辑版pptppt4848 推断两个总体率或构成比之间有无差别推断两个总体率或构成比之间有无差别 多个总体率或构成比之间有无差别多个总体率或构成比之间有无差别 多个样本率的多重比较多个样本率的多重比较 两个分类变量之间有无关联性两个分类变量之间有无关联性 频数分布拟合优度的检验频数分布拟合优度的检验 统计学方法:卡方检验统计学方法:卡方检验 目的目的:检验统计量检验统计量:应用应用:计数资料或等级资料:计数资料或等级资料2编辑版编辑版pptppt4949 例例 某医师欲比较胞磷
29、胆碱与神经节苷酯治疗脑某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将血管疾病的疗效,将7878例脑血管疾病患者随机例脑血管疾病患者随机分为两组,结果见表。问两种药物治疗脑血管分为两组,结果见表。问两种药物治疗脑血管疾病的有效率是否相等?疾病的有效率是否相等?组别 有效 无效 合计 有效率(%)胞磷胆碱组 46 6 52 88.46 神经节苷酯组 18 8(4.67)26 69.23 合计 64 14 78 82.05 表表 两种药物治疗脑血管疾病有效率的比较两种药物治疗脑血管疾病有效率的比较四格表资料四格表资料425534813529016107编辑版编辑版pptppt5050编辑版
30、编辑版pptppt5151编辑版编辑版pptppt5252编辑版编辑版pptppt5353编辑版编辑版pptppt5454编辑版编辑版pptppt5555编辑版编辑版pptppt5656编辑版编辑版pptppt5757编辑版编辑版pptppt5858编辑版编辑版pptppt5959多个样本率比较时,有R行2列,称为R R 2 2表;两个样本的构成比比较时,有2行C列,称2 2C C表;多个样本的构成比比较,以及双向无序分类资料关联性检验时,有行列,称为R R C C表。编辑版编辑版pptppt6060 疗法 有效 无效 合计 有效率(%)物理疗法组 199 7 206 96.60 药物治疗组
31、164 18 182 90.11 外用膏药组 118 26 144 81.94 合计 481 51 532 90.41 例例 某医师研究物理疗法、药物治疗和外用某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表。问三种疗法的有效率有无差别?料见表。问三种疗法的有效率有无差别?表表 三种疗法有效率的比较三种疗法有效率的比较R2表资料表资料编辑版编辑版pptppt6161 例 某医师在研究血管紧张素I转化酶(ACE)基因I/D多态与2型糖尿病肾病(DN)的关系时,将249例2型糖尿病患者按有无糖尿病肾病分为两组,资料见表7-
32、9。问两组2型糖尿病患者的ACE基因型总体分布有无差别?组 别 DD ID II 合 计 DN组 42(37.8)48(43.3)21(18.9)111 无DN组 30(21.7)72(52.2)36(26.1)138 合 计 72(28.9)120(48.2)57(22.9)249 表表 DN组与无组与无DN组组2型糖尿病患者型糖尿病患者ACE基因型分布的比较基因型分布的比较 2C表表编辑版编辑版pptppt6262表表 某地某地5801人的血型人的血型 MN血型 ABO血型 M N MN 合计 O 431 490 902 1823 A 388 410 800 1598 B 495 587
33、950 2032 AB 137 179 32 348 合计 1451 1666 2684 5801 R C表表编辑版编辑版pptppt6363变量关系的显著性检验类型变量关系的显著性检验类型定类定序定距定类卡方类测量(卡方检验)卡方类测量(卡方检验)方差分析(F 检验)定序Spearman 相关系数(Z 检验)Spearman 相关系数(Z 检验)定距Pearson 相关(F 检验)回归系数(T 检验)等等 级级计计 数数计计 量量计计 数数等等 级级计计 量量编辑版编辑版pptppt6464P=0.061表表1 络合碘与赛肤润治疗压疮疗效对比络合碘与赛肤润治疗压疮疗效对比组别组别显效显效有效有效无效无效合计合计络合碘络合碘925640赛肤润赛肤润1918542编辑版编辑版pptppt6565表表2 不同科室护士职称的比较不同科室护士职称的比较科室科室护士护士护师护师主管护主管护师师副主任副主任护师护师科室科室17421科室科室26530科室科室35820编辑版编辑版pptppt6666THE ENDTHE END