医学统计学和SPSS电脑实验课件.ppt

上传人(卖家):晟晟文业 文档编号:3943753 上传时间:2022-10-27 格式:PPT 页数:49 大小:188.01KB
下载 相关 举报
医学统计学和SPSS电脑实验课件.ppt_第1页
第1页 / 共49页
医学统计学和SPSS电脑实验课件.ppt_第2页
第2页 / 共49页
医学统计学和SPSS电脑实验课件.ppt_第3页
第3页 / 共49页
医学统计学和SPSS电脑实验课件.ppt_第4页
第4页 / 共49页
医学统计学和SPSS电脑实验课件.ppt_第5页
第5页 / 共49页
点击查看更多>>
资源描述

1、医学统计学医学统计学与与SPSSSPSS电脑实验电脑实验单位:河北医科大学公共卫生学院单位:河北医科大学公共卫生学院 流行病与卫生统计学教研室流行病与卫生统计学教研室授课教师:唐龙妹授课教师:唐龙妹联系电话:联系电话:8626558886265588理论:理论:本科知识回顾本科知识回顾实验设计实验设计方差分析方差分析秩和检验秩和检验卡方检验卡方检验双变量回归与相关双变量回归与相关统计图表统计图表高级统计方法概述高级统计方法概述SPSSSPSS及实习:及实习:数据管理数据管理统计描述及统计描述及t t检验检验方差分析方差分析秩和检验秩和检验卡方检验卡方检验双变量回归与相关双变量回归与相关统计图表

2、统计图表案例综合分析案例综合分析本科统计学知识回顾本科统计学知识回顾 统计学统计学(Statistics)(Statistics)是一门研究数据的收是一门研究数据的收集、整理、分析、表达和解释的科学。集、整理、分析、表达和解释的科学。将统计学应用于医学研究领域形成了卫生将统计学应用于医学研究领域形成了卫生统计学统计学(Health Statistics)(Health Statistics)和医学统计学和医学统计学(Medical Statistics)(Medical Statistics),卫生统计学偏重于,卫生统计学偏重于医疗卫生的社会性,医学统计学偏重于医学医疗卫生的社会性,医学统计学

3、偏重于医学研究的临床方面,两者之间无截然的界限,研究的临床方面,两者之间无截然的界限,其主要内容是相同的。其主要内容是相同的。第一节第一节 医学统计学的基本概念医学统计学的基本概念 总体与样本总体与样本 变量与资料变量与资料 误差误差 概率概率一、总体与样本一、总体与样本(population and sample)population and sample)1.1.总体:根据研究目的确定的性质相同观总体:根据研究目的确定的性质相同观察单位的全体。确切的说是,全部同质观察单位的全体。确切的说是,全部同质观察单位某项观察值的集合。察单位某项观察值的集合。2.2.样本:从总体中样本:从总体中随机抽

4、取随机抽取的部分观察的部分观察单位,其实测值的集合构成样本。单位,其实测值的集合构成样本。样本是总体中有代表性的一部分。样本是总体中有代表性的一部分。二、变量与资料二、变量与资料(variable and data)variable and data)在确定总体之后,研究者对每个观察单位在确定总体之后,研究者对每个观察单位的某项特征进行测量和观察,这种特征称为变的某项特征进行测量和观察,这种特征称为变量。变量的测得值或观察值称为变量值。变量量。变量的测得值或观察值称为变量值。变量值构成资料。值构成资料。编号编号 (ID)(ID)性别性别血型血型体重体重(kgkg)疗效疗效张张1 1男男A A6

5、666无效无效李李2 2男男O O7878有效有效王王3 3女女ABAB5757显效显效赵赵4 4男男B B6969有效有效按变量属性可将资料分为三种:按变量属性可将资料分为三种:计量资料(计量资料(measurement datameasurement data)计数资料(计数资料(enumeration count dataenumeration count data)等级资料(等级资料(ranked ordinal dataranked ordinal data)过失误差:过失误差:指实验过程中由于偶然失误造成的指实验过程中由于偶然失误造成的误差。误差。随机误差:随机误差:由于随机因素造

6、成的误差。由于随机因素造成的误差。系统误差:系统误差:也是实验过程中产生的误差,但也是实验过程中产生的误差,但它的值或者恒定不变,或者遵循一定的变化规它的值或者恒定不变,或者遵循一定的变化规律,其产生的原因往往是可知的或可掌握的。律,其产生的原因往往是可知的或可掌握的。三、误差三、误差(error)(error)误差:测量值和真值之间的差值。误差:测量值和真值之间的差值。随机抽样误差:随机抽样误差:因存在个体差异,由于随因存在个体差异,由于随机抽样引起的统计量与参数之间或者统计量机抽样引起的统计量与参数之间或者统计量与统计量之间的差异。与统计量之间的差异。样本均数的标准差称为样本均数的标准差称

7、为均数的标准误均数的标准误,是用来,是用来反映抽样误差大小的指标。反映抽样误差大小的指标。XnXSSn四、频率与概率四、频率与概率(relative frequency and(relative frequency and probability)probability)概率:概率:描述某事件发生可能性大小的数,用描述某事件发生可能性大小的数,用P P表示。表示。概率的取值范围:概率的取值范围:00,11。小概率事件:小概率事件:当某事件发生的概率很小时,称当某事件发生的概率很小时,称之为小概率事件。一般取之为小概率事件。一般取0.050.05或或0.010.01为小概率为小概率事件的标准。事

8、件的标准。小概率事件实际不可能性原理:小概率事件实际不可能性原理:如果一个事件如果一个事件是小概率事件,在一次试验中我们当作是不可是小概率事件,在一次试验中我们当作是不可能发生的。能发生的。第二节第二节 统计工作的基本步骤统计工作的基本步骤设计(设计(designdesign)收集资料(收集资料(collection of datacollection of data)整理资料(整理资料(sorting of datasorting of data)分析资料(分析资料(analysis of dataanalysis of data)统计描述统计描述 统计推断(参数估计和假设检验)统计推断(参

9、数估计和假设检验)第三节第三节 计量资料的统计描述计量资料的统计描述集中趋势和离散趋势集中趋势和离散趋势常用集中趋势指标常用集中趋势指标统计指标统计指标定义定义表示符号表示符号适用条件适用条件算术均数算术均数各观察值之和除各观察值之和除以观察值的个数以观察值的个数总体:总体:样本:样本:对称分布,特别是正态或对称分布,特别是正态或者近似正态分布者近似正态分布几何均数几何均数n n个观察值乘积个观察值乘积的的n n次方根次方根G等比级数资料或对数正态等比级数资料或对数正态分布资料分布资料中位数中位数将全部观察值从将全部观察值从小到大排列,居小到大排列,居中位置对应的数中位置对应的数值值M各种资料

10、均适用,特别是各种资料均适用,特别是偏态分布、资料的分布不偏态分布、资料的分布不明确或者资料的一端或两明确或者资料的一端或两端无确切数值端无确切数值X分布类型分布类型 对称分布:对称分布:集中位置在中间,左右两侧频数大体对称集中位置在中间,左右两侧频数大体对称 偏态分布:偏态分布:集中位置偏向一侧,频数分布不对称集中位置偏向一侧,频数分布不对称 正偏态:正偏态:集中位置偏向左侧集中位置偏向左侧 负偏态:负偏态:集中位置偏向右侧集中位置偏向右侧尿酸浓度(mol/L)420390360330300270图9-1 2002年某市20岁-29岁正常成年男子的尿酸浓度频数分布频数(人)3020100发汞

11、含量(mol/kg)87654321图2-3 某地居民238人发汞含量(mol/kg)分布频率密度806040200血清肌红蛋白(g/m L)52.542.532.522.512.52.5图 101名 正常人血清肌红蛋白的频数分布人数302520151050 正态分布是最常见、最重要的一种连续型概正态分布是最常见、最重要的一种连续型概率分布,其形态为:中间高,两端低,左右对率分布,其形态为:中间高,两端低,左右对称,略呈钟型。称,略呈钟型。图1-d 正态分布始终在横轴上方,正态分布始终在横轴上方,X X=处曲线达到最高点处曲线达到最高点 正态分布以正态分布以X X=为对称轴,左右对称为对称轴,

12、左右对称 正态分布的两个参数:位置参数正态分布的两个参数:位置参数和形状参数和形状参数 表示方法表示方法X X N N(,2 2)正态曲线下面积的分布规律:正态曲线下面积的分布规律:正态曲线下的总面积为正态曲线下的总面积为1 1(100%100%)(-,+)间的面积为)间的面积为68.27%68.27%(-1.645-1.645,+1.645+1.645)间的面积为)间的面积为90%90%(-1.96-1.96,+1.96+1.96)间的面积为)间的面积为95%95%(-2.58-2.58,+2.58+2.58)间的面积为)间的面积为99%99%正态分布的特征正态分布的特征正态分布的应用正态分

13、布的应用医学参考值范围医学参考值范围 正态分布法正态分布法 :适用于正态或近似正态分布资料。适用于正态或近似正态分布资料。对数正态分布法:对数正态分布法:适用于对数正态分布资料适用于对数正态分布资料 百分位数法:百分位数法:常用于偏态分布资料常用于偏态分布资料 常用集中趋势指标常用集中趋势指标统计指标统计指标定义定义表示符号表示符号适用条件适用条件算术均数算术均数各观察值之和除各观察值之和除以观察值的个数以观察值的个数总体:总体:样本:样本:对称分布,特别是正态或对称分布,特别是正态或者近似正态分布者近似正态分布几何均数几何均数n n个观察值乘积个观察值乘积的的n n次方根次方根G等比级数资料

14、或对数正态等比级数资料或对数正态分布资料分布资料中位数中位数将全部观察值从将全部观察值从小到大排列,居小到大排列,居中位置对应的数中位置对应的数值值M各种资料均适用,特别是各种资料均适用,特别是偏态分布、资料的分布不偏态分布、资料的分布不明确或者资料的一端或两明确或者资料的一端或两端无确切数值端无确切数值X标准正态分布:标准正态分布:=0,=0,=1=1的正态分布的正态分布对数正态分布:对数正态分布:X(XX(X1 1,X X2 2,X XN N)不服从正态分布,但对不服从正态分布,但对X X取对数后取对数后Y Y=lg=lgX X,Y Y(Y Y1 1,Y Y2 2,Y YN N)服从正态分

15、布,则称服从正态分布,则称X X服从对数正态分布。对数正态分布是一种正偏态分布。服从对数正态分布。对数正态分布是一种正偏态分布。正常成人血铅含量57.051.045.039.033.027.021.015.09.03.0频数6050403020100血铅含量对数值1.531.24.95.66.37频数6050403020100常用描述离散趋势的指标常用描述离散趋势的指标统计指标统计指标表示符号表示符号用途及缺点用途及缺点全距全距R各分布类型资料,但仅涉及到最大值各分布类型资料,但仅涉及到最大值和最小值和最小值四分位数间距四分位数间距QR各分布类型资料,特别是偏态分布资各分布类型资料,特别是偏态

16、分布资料,但仅是中间料,但仅是中间50%观察值的范围观察值的范围方差方差总体总体:2样本样本:s2对称分布资料,特别是正态分布资料,对称分布资料,特别是正态分布资料,但单位是原观察值单位的平方但单位是原观察值单位的平方标准差标准差总体总体:样本样本:s对称分布资料,特别是正态分布资料对称分布资料,特别是正态分布资料变异系数变异系数CV比较度量单位不同或均数相差悬殊资比较度量单位不同或均数相差悬殊资料的离散趋势料的离散趋势正态分布资料:均数和标准差正态分布资料:均数和标准差偏态分布资料:中位数和四分位数间距偏态分布资料:中位数和四分位数间距 M M(QRQR)XS第四节第四节 计量资料的统计推断

17、计量资料的统计推断总体均数的估计与假设检验总体均数的估计与假设检验一、一、t t分布分布 t t分布分布(t t-distribution)-distribution)也是一种连续性随机也是一种连续性随机变量的分布类型。最早由英国统计学家变量的分布类型。最早由英国统计学家GossetGosset以以“Student”Student”的笔名发表,所以又称的笔名发表,所以又称Student Student t t分分布布(Students(Students t t-distribution)-distribution),主要用于总,主要用于总体均数的区间估计和体均数的区间估计和t t检验等。检验等

18、。0.00.10.10.20.20.30.30.40.4-4-3-2-101234tf(t)自由度为1的t分布自由度为9的t分布标准正态分布1 1、t t分布是单峰分布,以为中心,左右对称。分布是单峰分布,以为中心,左右对称。2 2、t t分布的图形不是一条曲线,而是一簇曲线,其形状与自由度分布的图形不是一条曲线,而是一簇曲线,其形状与自由度有关。自由度越小,有关。自由度越小,值越分散,曲线的峰部越矮,尾部翘得越值越分散,曲线的峰部越矮,尾部翘得越高。随着自由度逐渐增大,高。随着自由度逐渐增大,t t分布曲线逐渐逼近标准正态分布曲分布曲线逐渐逼近标准正态分布曲线,当自由度为线,当自由度为时,时

19、,分布曲线与标准正态分布曲线重合。分布曲线与标准正态分布曲线重合。t界值界值单侧概率对应的界值表示为:单侧概率对应的界值表示为:双侧概率对应的界值表示为:双侧概率对应的界值表示为:/2,t,t 二、总体均数的估计二、总体均数的估计 参数估计是统计推断的一个重要方面。所参数估计是统计推断的一个重要方面。所谓参数估计是指用样本指标(统计量)估计总谓参数估计是指用样本指标(统计量)估计总体指标(参数)。体指标(参数)。1、参数估计的方法、参数估计的方法:u 点估计:用样本统计量直接作为总体参数的估计值点估计:用样本统计量直接作为总体参数的估计值u 区间估计:按预先指定的概率(区间估计:按预先指定的概

20、率(1-1-)确定包含未知总)确定包含未知总体参数的范围。预先给定的概率用体参数的范围。预先给定的概率用1-1-表示,称为置信度表示,称为置信度或可信度(或可信度(confidence levelconfidence level),常取),常取95%95%,99%99%。2、总体均数区间估计的方法、总体均数区间估计的方法已知已知 的的95%95%的可信区间:的可信区间:1.96XX未知未知 的的95%95%的可信区间:的可信区间:0.05/2,XXts未知,但未知,但n n足够大,一般足够大,一般n n6060的的95%95%的可信区间:的可信区间:1.96XXs三、三、t t检验检验 t t

21、检验是计量资料假设检验中最简单、最常用检验是计量资料假设检验中最简单、最常用的方法。的方法。所谓假设检验是利用小概率反证法思想,从问所谓假设检验是利用小概率反证法思想,从问题的对立面题的对立面(H H0 0)出发间接判断要解决的问题出发间接判断要解决的问题(H H1 1)是是否成立。在假设否成立。在假设H H0 0成立的条件下计算检验统计量,成立的条件下计算检验统计量,最后获得最后获得P P值来判断,拒绝值来判断,拒绝H H0 0还是不拒绝还是不拒绝H H0 0。假设检验的基本思想:先假设差别由抽假设检验的基本思想:先假设差别由抽样造成,即总体间本无差异,在此假设成立样造成,即总体间本无差异,

22、在此假设成立的前提下作抽样研究,如果该次抽样属小概的前提下作抽样研究,如果该次抽样属小概率事件,则样本信息不支持原假设的成立,率事件,则样本信息不支持原假设的成立,因而拒绝它,反之样本信息支持原假设的成因而拒绝它,反之样本信息支持原假设的成立,不拒绝原假设。立,不拒绝原假设。1、假设检验的一般步骤、假设检验的一般步骤 建立假设,确定检验水准建立假设,确定检验水准 检验假设检验假设(H H0 0)和备择假设和备择假设(H H1 1)确定检验水准(确定检验水准(),),计算统计量计算统计量 计算方法要受资料类型、设计方案、统计推断目的、计算方法要受资料类型、设计方案、统计推断目的、资料的分布类型、

23、样本容量的多少等因素决定资料的分布类型、样本容量的多少等因素决定 确定确定P P值,做出推断结论值,做出推断结论一般:统计量一般:统计量界值时,界值时,P P,拒绝,拒绝H H0 0,接受,接受H H1 1 统计量统计量 ,不拒绝,不拒绝H H0 02 2、t t检验的应用条件:检验的应用条件:t t检验理论上要求样本来自正态总体,检验理论上要求样本来自正态总体,两小样均数比较时,还要求两样本对应的两小样均数比较时,还要求两样本对应的总体方差相等。总体方差相等。单样本单样本t t检验(样本均数与已知总体均检验(样本均数与已知总体均数比较的数比较的t t检验):样本来自正态总体检验):样本来自正

24、态总体 配对配对t t检验(配对实验设计的检验(配对实验设计的t t检验):检验):每个对子的差值来自正态总体每个对子的差值来自正态总体 两样本两样本t t检验检验(完全随机设计两样本均数完全随机设计两样本均数比较的比较的t t检验检验):两个样本均来自正态总体:两个样本均来自正态总体且总体方差相等且总体方差相等第五节第五节 正态性检验和两样本方差正态性检验和两样本方差齐性检验齐性检验一、正态性检验一、正态性检验(1)P-P(1)P-P图(概率图):以实际的累积频率图(概率图):以实际的累积频率(X X)与与理论累计频率理论累计频率(Y Y)作图。作图。(2)Q-Q(2)Q-Q图(分位数图):

25、以实际分位数图(分位数图):以实际分位数(X X)与理与理论分位数论分位数(Y Y)作图。作图。若两图的散点都在一条直线上,可认若两图的散点都在一条直线上,可认为资料服从正态分布为资料服从正态分布1 1、图示法、图示法实际累计概率1.00.75.50.250.00期望累计概率1.00.75.50.250.00图图 100100个样本均数的个样本均数的P-PP-P图图实际值(实际分位数)174172170168166164162正态期望值(期望分位数)174172170168166164162图图 100100个样本均数的个样本均数的Q-QQ-Q图图(1)(1)对偏度和峰度各用一个指标评定对偏度

26、和峰度各用一个指标评定矩法效矩法效率最高率最高2 2、计算法、计算法(2)(2)用一个指标综合评定用一个指标综合评定W W检验法、检验法、W W检验法检验法和和D D检验法检验法W W检验法和检验法和W W检验:适用于样本含量少于检验:适用于样本含量少于100100的资料的资料D D检验法:适用于样本容量检验法:适用于样本容量10-200010-2000的资料的资料 矩法要对偏度和峰度分别检验。偏度指分矩法要对偏度和峰度分别检验。偏度指分布不对称的程度和方向,用偏度系数衡量,样布不对称的程度和方向,用偏度系数衡量,样本偏度系数用本偏度系数用g g1 1表示,总体偏度系数用表示,总体偏度系数用1

27、 1表表示;峰度指分布与正态曲线相比的冒尖程度或示;峰度指分布与正态曲线相比的冒尖程度或扁平程度,用峰度系数衡量,样本峰度系数用扁平程度,用峰度系数衡量,样本峰度系数用g g2 2表示,总体峰度系数用表示,总体峰度系数用2 2表示。表示。111222总体偏度系数:=0为对称分布 0为正偏态分布 0为尖峭峰 P时,可认为资料满足正态分布条件时,可认为资料满足正态分布条件二、两样本的方差齐性检验二、两样本的方差齐性检验F F检验:检验:要求资料服从正态分布。要求资料服从正态分布。LeveneLevene检验:检验:不依赖总体分布的具体形式,不依赖总体分布的具体形式,而且可以用于多个样本的方差齐性检

28、验。而且可以用于多个样本的方差齐性检验。方差齐性检验的方差齐性检验的H H0 0为:总体方差相等,为:总体方差相等,所以:当所以:当P P 时,可认为资料满足方差齐性条件时,可认为资料满足方差齐性条件第六节第六节 假设检验中的两类错误假设检验中的两类错误型错误:型错误:拒绝了实际上成立的拒绝了实际上成立的H H0 0,也称弃真错误,也称弃真错误,概率大小由研究者根据研究目的确定,用概率大小由研究者根据研究目的确定,用表示表示(预先规定的允许犯(预先规定的允许犯型错误概率的最大值)。型错误概率的最大值)。型错误:型错误:“接受接受”了实际上不成立的了实际上不成立的H H0 0,也称取,也称取伪错

29、误,其概率大小用伪错误,其概率大小用表示,表示,只取单侧,大小只取单侧,大小一般未知,在已知两总体差值、一般未知,在已知两总体差值、和和n n时,利用公式时,利用公式才能算出。才能算出。000HttH0实际情况:不成立,界值,P按=0.05的水准,不拒绝,以单样本以单样本t t检验(单侧)说明:检验(单侧)说明:H H0 0:=0 0 H H1 1:0 0 =0.05=0.050010HttHH0实际情况:成立,界值,P按=0.05的水准,拒绝,接受,型错误型错误型错型错误误 由样本推断的结果由样本推断的结果 真实结果真实结果 拒绝拒绝H H0 0 不拒绝不拒绝H H0 0 H H0 0成立成立 型错误型错误 推断正确推断正确(1(1)H H0 0不成立不成立 推断正确推断正确(1(1)型错误型错误减少减少(增加增加)I)I型错误,将会增加型错误,将会增加(减少减少)II)II型错误型错误同时减小同时减小和和,唯一的方法就是增大样本含量,唯一的方法就是增大样本含量

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 医疗、心理类
版权提示 | 免责声明

1,本文(医学统计学和SPSS电脑实验课件.ppt)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|