1、 2022-7-301第1页,共236页。邹宗峰 工作单位:广东药学院公卫学院卫生统计教研室职称:讲师13189012071Email:zouzongfeng21cn2022-7-302第2页,共236页。2022年7月30日2022-7-303第3页,共236页。安装方法为“傻瓜式傻瓜式”安装主要通过点击“NEXT”按钮,就可以完成安装。通过双击SPSS11.5Eval.exe开始安装。2022-7-304第4页,共236页。2022-7-305第5页,共236页。2022-7-306第6页,共236页。2022-7-307第7页,共236页。2022-7-308第8页,共236页。继续点击
2、“NEXT”按钮,就可以完成安装。该版本为SPSS公司的试用版,试用期30天。SPSS12EVAL.exe为SPSS公司spss12的试用版.也可以试用30天。2022-7-309第9页,共236页。统计分析软件是数据分析的主要工具完整的数据分析过程为:数据的收集数据的整理数据的分析统计学为数据的分析提供了科学的方法论方法论。统计软件为数据分析提供了实现手段实现手段。2022-7-3010第10页,共236页。SAS 8.2真正的巨无霸。被誉为国际上的标准统计软件和最权威的组合式优秀统计软件。人机对话界面太不友好图形操作界面比较糟糕一切围绕编程设计学习起来较困难(编程)说明书非常难懂价格贵的人
3、直跳2022-7-3011第11页,共236页。SPSS(Ver11.5)-统计软件中的贵族操作界面极为友好所有统计软件中具有最友好的操作精心设计的图形操作界面美观的结果输出美观的结果输出强大的辅助教学功能输出结果与中文WORD尚存在一定兼容问题在国内深受欢迎,特别是市场调研行业在欧洲各研究机构中得到广泛应用2022-7-3012第12页,共236页。弄清分析的目的正确收集待处理和分析的数据(目的、影响因素的剔除)弄清统计概念和统计含义,知道统计方法的适用范围,无需记忆公式。选择一种或几种统计分析方法探索性地分析数据。读懂计算机分析的数据结果,发现规律,得出分析读懂计算机分析的数据结果,发现规
4、律,得出分析2022-7-3013第13页,共236页。SPSS是软件英文名称的首字母缩写,原意为Statistical Package for the Social Sciences,即“社会科学统计软件包”。但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为Statistical Product and Service Solutions,意为“统计产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。2022-7-3014第14页,共236页。2022-7-3015第15页,共236页。2022-7-3016第16页,共236页。
5、2022-7-3017第17页,共236页。2022-7-3018第18页,共236页。2022-7-3019第19页,共236页。2022-7-3020第20页,共236页。2022-7-3021第21页,共236页。2022-7-3022第22页,共236页。2022-7-3023第23页,共236页。2022-7-3024第24页,共236页。2022-7-3025第25页,共236页。SPSS最突出的特点就是操作界面极为友好,输出结果美观漂亮,他使用Windows的窗口方式展示各种管理和分析数据方法的功能,使用对话框展示出各种功能选择项,只要掌握一定的Windows操作技能,粗通统计分
6、析原理,就可以使用该软件为特定的科研工作服务。是非专业统计人员的首选统计软件是非专业统计人员的首选统计软件2022-7-3026第26页,共236页。2022-7-3027第27页,共236页。2022-7-3028第28页,共236页。2022-7-3029第29页,共236页。2022-7-3030第30页,共236页。2022-7-3031第31页,共236页。数据编辑窗口(数据编辑窗口 data editor)功能:对SPSS的数据进行定义、录入、修改、管理等基本操作的窗口组成:窗口主菜单(Data、Transform、Analyze、Graphs)、工具栏、数据编辑区、状态显示区SP
7、SS运行过程中自动打开;且只能打开一个窗口;运行过程中无法关闭SPSS中各统计分析功能都是针对该窗口中的数据进行的;窗口中的数据以.sav存于磁盘上2022-7-3032第32页,共236页。2022-7-3033第33页,共236页。输出窗口(viewer viewer)功能:SPSS统计分析报表及图形的输出窗口组成:窗口主菜单、工具栏、结果显示区、状态显示区在进行第一次分析时自动打开,也可手工打开;可以手工打开若干个可相互切换的viewer窗口;输出窗口可以关闭;状态栏上的!表示当前输出窗口窗口内容以.spo存于磁盘上2022-7-3034第34页,共236页。2022-7-3035第35
8、页,共236页。总体:所研究对象的全体为总体样本(sample):就是从总体中随机抽取部分观察单位,其实测值的集合。个体:组成总体的元素称为个体。指标或变量:表征个体特征(信息)的量,称为指标或变量。指标值(变量值)或数据(Data):指标或变量的具体值称为指标值(变量值)或数据。2022-7-3036第36页,共236页。(1)参数参数(parameter)总体指标在一定条件下为常数。总体指标在一定条件下为常数。(2)统计量统计量 从总体中随机抽取的样本所算得的指标值。从总体中随机抽取的样本所算得的指标值。2022-7-3037第37页,共236页。概率概率(probability)(pro
9、bability):是描述随机事件发生的可能性:是描述随机事件发生的可能性大小的数值,用大小的数值,用P P表示。表示。在一定条件下,肯定发生的事件称为,肯定不发生的事件称为,可能发生也可能不发生的事件称为或偶然事件,必然事件的概率为1,不可能事件的概率为0,随机事件的概率介于0和1之间。P0.05P0.05或或P0.01P0.01称为称为“小概率事件小概率事件”,表明,表明在一次观察或实验中该事件发生的可能性很小,可在一次观察或实验中该事件发生的可能性很小,可以看作很可能不发生。以看作很可能不发生。2022-7-3038第38页,共236页。定类(分类或计数资料)(Nominal)性别,职业
10、次序资料或等级资料(Ordinal)治疗效果、化验结果定距数据细胞个数定比资料米,小时定距数据、定比资料一般我们通称计量资料。2022-7-3039第39页,共236页。利用SPSS的帮助窗口可以方便地获得SPSS软件中各种功能的使用方法,包括窗口的操作、图标操作、键盘和鼠标操作、语句的语法解释等各类操作。Help菜单 或 相应的Help按钮2022-7-30第40页,共236页。2022年7月30日2022-7-3041第41页,共236页。建立 建立SPSS SPSS数据文件 数据文件 定义数据文件结构录入修改和编辑待分析的数据分析数据 分析数据 统计分析之前的数据预处理统计分析和建模结果
11、的说明和解释 结果的说明和解释 数据和分析结果的保存 2022-7-3042第42页,共236页。2022-7-3043第43页,共236页。1、变量名(Variable name)变量名是变量存取的唯一标志。汉字汉字4个,英文个,英文8个字符。个字符。2、变量类型(type):数值型:常用标准数值型(Numeric):默认类型8.2如:12345678、12345.67、-1234.56字符型(String):存储字符数据8位。如:beijing处理时用双引号扩起来日期型(Date):存储日期数据,如:20-AUG-20191582年10月14日零点开始2022-7-3044第44页,共23
12、6页。3.Width:变量宽度,默认为8。4.Decimals:小数位数,默认为2。5.Label:变量编码,注释变量名的含义。6.Values:变量值编码,注释变量值的含义。7.Missing:缺失值。8.Columns:列宽,默认为8。9.Align:对齐,默认右对齐(Right)。10.Measure:测度,包括三类:数值变量(Scale),名义变量(Nominal),有序变量(Ordinal)。2022-7-3045第45页,共236页。2022-7-3046第46页,共236页。Name栏、栏、type栏、栏、Label栏、栏、Values最常最常用!用!练习:建立变量练习:建立变量
13、 keshi 类型:数值型,类型:数值型,Label为科室,为科室,Values为为1 内科;内科;2 外科;外科;3 妇妇产科;产科;4;儿科;儿科 2022-7-3047第47页,共236页。2022-7-3048第48页,共236页。连续多个相同值的录入(COPY拖放粘贴)将EXCEL的数据直接复制进SPSS(文本除外)将WORD的数据表格直接引入SPSS(选中表格复制切换到SPSS粘贴)2022-7-3049第49页,共236页。将指针移动到指定观察值号(记录快速定位)相当于查找第?人的资料DataGo to Case点击搜索指定变量中的数据相当于查找某一属性等于某个值的人。EditF
14、indMatch case 是指定是否区分大小写示例:EX.sav2022-7-3050第50页,共236页。可以通过在第一列变量名上点击右键,选择Pin Selected Column,就可以将该列冻结在左侧。2022-7-3051第51页,共236页。增加一个观察值左键选中序号单元格右键显菜单选“Insert Cases”删除一个观察值左键选中序号单元格右键显菜单选“Cut”或“Clear”示例:EX.sav2022-7-3052第52页,共236页。记录排序(Sort Cases)(加速、查错)2022-7-3053第53页,共236页。2022-7-3054第54页,共236页。202
15、2-7-3055第55页,共236页。2022-7-3056第56页,共236页。2022-7-3057第57页,共236页。2022-7-3058第58页,共236页。2022-7-3059第59页,共236页。2022-7-3060第60页,共236页。EG2-1中学家长问卷.savD变量(家庭人口数)等于4的。D变量(家庭人口数)小于4的。D变量(家庭人口数)小于4并且g变量(家庭年收入)大于10000的。and 的用法2022-7-3061第61页,共236页。选择对象范围剪切、复制和粘贴2022-7-3062第62页,共236页。点击列名,选中列右键点击出菜单选“Insert var
16、iables”或“clear”2022-7-3063第63页,共236页。删除ex.sav文件中id为57的case,将文件另存为ex_1.sav2022-7-3064第64页,共236页。2022-7-3065第65页,共236页。2022-7-3066第66页,共236页。2022-7-3067第67页,共236页。1、产生新变量:compute 计算2022-7-3068第68页,共236页。2022-7-3069第69页,共236页。2022-7-3070第70页,共236页。/不等于&AND 和和|OR 或或*乘方乘方 not 2022-7-3071第71页,共236页。ABS(数值
17、表达式):绝对值LG10(数值表达式):求10为底的对数sqrt(数值表达式):平方根RND(数值表达式):返回四舍五入的整数trunc(数值表达式):直接返回整数部分,不四舍五入MOD(数值表达式,除数):返回余数2022-7-3072第72页,共236页。SUBSTR(字符串,位置):返回字符串中从某位置开始到结尾的字符串SUBSTR(字符串,位置,长度):返回字符串中从某位置开始,某个长度的字符串应用:ICD编码的筛选取前3位?取前2位?2022-7-3073第73页,共236页。DATE.MDY(month,day,year)返回与月、日、年相对应的日期或 DATE.DMY(day,m
18、onth,year)2022-7-3074第74页,共236页。trunc(当前日期-过去日期)/60/60/24/365)统计年满岁数RND(当前日期-过去日期)/60/60/24/365)返回四舍五入年龄2019040404042019Date.dmy(d,m,y)2022-7-3075第75页,共236页。2022-7-3076第76页,共236页。2022-7-3077第77页,共236页。2022-7-3078第78页,共236页。2022-7-3079第79页,共236页。2022-7-3080第80页,共236页。2022-7-3081第81页,共236页。2022-7-3082
19、第82页,共236页。2022-7-3083第83页,共236页。2022-7-3084第84页,共236页。2022-7-3085第85页,共236页。2022-7-3086第86页,共236页。2022-7-3087第87页,共236页。2022-7-3088第88页,共236页。2022-7-3089第89页,共236页。数据文件的连接纵向连接:增加记录(Merge Files.Add Cases)打开数据文件ex_1.sav作为“工作数据文件”2022-7-3090第90页,共236页。2022-7-3091第91页,共236页。2022-7-3092第92页,共236页。2022-7
20、-3093第93页,共236页。打开ex3.sav作为“工作数据文件”2022-7-3094第94页,共236页。2022-7-3095第95页,共236页。2022-7-3096第96页,共236页。2022-7-3097第97页,共236页。2022-7-3098第98页,共236页。2022-7-3099第99页,共236页。2022-7-30100第100页,共236页。2022-7-30101第101页,共236页。2022-7-30102第102页,共236页。2.6.1 数据文件的存储2.6.2 其他类型数据文件的读入2022-7-30103第103页,共236页。打开其他格式的
21、数据文件直接打开在SPSS 10已经可以直接读入许多常用格式的数据文件使用数据库查询打开利用通用数据库ODBC接口读取数据文件在9.0及以前版本中非常重要使用文本导入向导读入文本文件和大型机交换文件时常用2022-7-30104第104页,共236页。2022-7-30105第105页,共236页。ODBC数据接口FileOpen DatabaseNew Query2022-7-30106第106页,共236页。2022-7-30107第107页,共236页。2022-7-30108第108页,共236页。2022-7-30109第109页,共236页。2022-7-30110第110页,共2
22、36页。2022-7-30111第111页,共236页。FileRead Text Data六步操作均选下一步读入示例数据 data.txt2022-7-30112第112页,共236页。驾驭结果浏览窗口结果文件的打开和保存窗口元素的移动和删除标准的拖放式操作在大纲视图中操作最方便2022-7-30113第113页,共236页。结果的导出以纯文本格式导出以HTML格式导出EXCEL格式导出WORD格式导出如何在WORD中引用分析结果纯文本结果:直接使用统计表格:拷贝或拷贝对象统计图:拷贝对象注意:中文支持不好,直接拷贝表格,汉字乱码。注意:中文支持不好,直接拷贝表格,汉字乱码。示例:结果拷贝到
23、WORD2022-7-30114第114页,共236页。2022-7-30115第115页,共236页。2022-7-30116第116页,共236页。2022-7-30117第117页,共236页。2022-7-30118第118页,共236页。2022年7月30日2022-7-30119第119页,共236页。1、均数均数是算术均数的简称。总体均数用希腊字母(缪,mu)表示样本均数 (X bar)表示。均数反映一组观察值在数量上的平均水平。均数的应用计算方法均数的两个重要特征2022-7-30120第120页,共236页。12nXXXXXnn2022-7-30121第121页,共236页。
24、中位数将一组观察值从小到大按顺序排列,位次居中的观察值。一半的值比M小,一半的值比M大。百分位数位置指标;界值;分布数列的百等份分割值。有x%的比Px小,有(100-x)%的比Px大。中位数是一个特定的百分位数P50。2022-7-30122第122页,共236页。21nXM,n为为奇奇数数时时2XXM,n12n2n 为为偶偶数数时时2022-7-30123第123页,共236页。fX 为PX所在组段的频数,i 为该组段的组距,L 为该组段的下限,fL 为小于L各组段的累计频数。Lxxfx%nfiLP2022-7-30124第124页,共236页。R=极大值 极小值特点:不稳定、易受极大值或极
25、小值的影响,失掉很多数据的信息量如上例:R甲=34-26=8(kg)R乙=36-24=12(kg)2022-7-30125第125页,共236页。四分位数(quartile,Q):特定的百分位数,把一组观察值分为四等份。下四分位数为:QL=P25上四分位数为:QU=P75四分位数间距:QUQL含一半的观察值,较极差稳定。2022-7-30126第126页,共236页。例:甲组 26 28 30 32 34 X甲=30kg 丙组 26 29 30 31 34 X丙=30kg R甲=R 丙=8(kg)问何组变异程度较大?2022-7-30127第127页,共236页。1nXXs22 2022-7-
26、30128第128页,共236页。1nX-XsSD2 2022-7-30129第129页,共236页。例中:最后求得 s甲=3.16(kg)s乙=2.92(kg)可见甲组的变异度大于乙组,即甲组均数的代表性比乙组均数的代表性差。2022-7-30130第130页,共236页。标准差与均数之比,CV为相对数,无单位。度量单位不同的变异度比较;均数相差悬殊的变异度比较。100%100%X Xs sCVCV2022-7-30131第131页,共236页。此过程可产生频数分布表绘制条形图、圆图、直方图计算集中趋势与离散趋势等统计量2022-7-30132第132页,共236页。点击菜单栏中“Analy
27、ze”菜单,展开下拉菜单点击“Descriptive Statistics”菜单项,弹出级联菜单再点击“Frequencies”命令,则弹出“Frequencies”对话框。2022-7-30133第133页,共236页。2022-7-30134第134页,共236页。2022-7-30135第135页,共236页。2022-7-30136第136页,共236页。点击菜单栏中“Analyze”菜单,展开下拉菜单点击“Descriptive Statistics”菜单项,弹出级联菜单再点击“Descriptives”命令,则弹出“Descriptives”对话框。2022-7-30137第137
28、页,共236页。2022-7-30138第138页,共236页。2022-7-30139第139页,共236页。2022-7-30140第140页,共236页。2022年7月30日2022-7-30141第141页,共236页。从外形上看,统计表由标题、标目(包括横标目、纵标目)、线条、数字及必要的文字说明和备注5部分构成。2022-7-30142第142页,共236页。2022-7-30143第143页,共236页。统计表制作是否良好,可以从以下几方面检查:统计表制作是否良好,可以从以下几方面检查:1)标题是否正确2)主谓语的排列是否合适,标目是否组合重复。3)表线是否过多过密。2022-7
29、-30144第144页,共236页。某地1974年111例钩端螺旋体病患者发病季节、年龄和职业构成资料如表124所示,请按照编制统计表的基本要求,检查此表编制的是否合适,如不合适,请指出并修改成正确表。2022-7-30145第145页,共236页。1)标题不确切,并且未注明时间与地点。2)发病季节、年龄、职业三项指标放在一起,内容繁杂,不能突出重点。3)标目设计不合理。人数、%多次重复,不便于比较分析。4)表内文字和线条过多。2022-7-30146第146页,共236页。2022-7-30147第147页,共236页。2022-7-30148第148页,共236页。2022-7-30149
30、第149页,共236页。选择合适的统计图的原则1.根据资料分析的目的2.根据资料的性质连续变量资料:普通线图(半对数线图)、直方图、散点图分类变量资料:直条图、圆图、百分条图2022-7-30150第150页,共236页。Olap cubs(在线分析处理)过程Case summaries(个案简明统计报表)过程Report summaries in row/column(行/列形式报表)过程,结果使用不便,过于复杂,不涉及。2022-7-30151第151页,共236页。数据为OLAP.sav操作过程:analyzereportOLAP CubesSummary variable 框:身高、体
31、重Grouping variable 框:性别、ID2022-7-30152第152页,共236页。2022-7-30153第153页,共236页。2022-7-30154第154页,共236页。2022-7-30155第155页,共236页。Differences 按钮 用不到Title 按钮 用不到2022-7-30156第156页,共236页。2022-7-30157第157页,共236页。2022-7-30158第158页,共236页。2022-7-30159第159页,共236页。练习:添加科室类别,进行分析2022-7-30160第160页,共236页。用于按分组统计量不同水平的交
32、叉组合对记录列表。数据:用SPSS自带的数据CARS.SAV演示操作过程:操作过程:analyzereport Case summaries variable 框:horseGrouping variable 框:cylinder(汽缸数)、orgin(产地)2022-7-30161第161页,共236页。2022-7-30162第162页,共236页。2022-7-30163第163页,共236页。2022-7-30164第164页,共236页。2022-7-30165第165页,共236页。针对EG2-1中学家长问卷.sav,比较各区不同家庭人口数的人均年收入的不同。2022-7-3016
33、6第166页,共236页。2022-7-30167第167页,共236页。定义:表示某事物在时间上的发展变化或某现象随另一现象变迁的情况。特点:1.纵横轴为算术尺度。2.相邻两点用线段连接(折线图)。2022-7-30168第168页,共236页。2022-7-30169第169页,共236页。2022-7-30170第170页,共236页。2022-7-30171第171页,共236页。2022-7-30172第172页,共236页。2022-7-30173第173页,共236页。1.输入数据2022-7-30174第174页,共236页。2022-7-30175第175页,共236页。20
34、22-7-30176第176页,共236页。2022-7-30177第177页,共236页。定义:比较不同事物的变化速度。特点:1.横轴为算术尺度,纵轴为对数尺度。2.相邻两点用线段连接(折线图)。3.尤其适用于指标数量级相差悬殊的不同事物变化速度的比较。(此时要注意,用普通线图可能会得。(此时要注意,用普通线图可能会得出错误结论)出错误结论)2022-7-30178第178页,共236页。2022-7-30179第179页,共236页。2022-7-30180第180页,共236页。2022-7-30181第181页,共236页。定义:用等宽直条的长短来表示相互独立的各指标的数值大小。特点:
35、1.纵轴从0开始。2.等宽直条,直条间距相等。3.按一定顺序(如高低顺序)排列。2022-7-30182第182页,共236页。2022-7-30183第183页,共236页。GraphBar选择Simple,简单条图;Values of individual cases2022-7-30184第184页,共236页。2022-7-30185第185页,共236页。2022-7-30186第186页,共236页。2022-7-30187第187页,共236页。死因恶 性 肿 瘤心 脏 病肺 结 核Value 死亡率(1/10万)20010002022-7-30188第188页,共236页。操作
36、步骤同前,但要选择“柱形图”2022-7-30189第189页,共236页。2022-7-30190第190页,共236页。数据EQ13-2.sav按309页操作2022-7-30191第191页,共236页。按316页操作2022-7-30192第192页,共236页。按317页操作2022-7-30193第193页,共236页。表示一事物中各部分的比重(构成比)。2022-7-30194第194页,共236页。2022-7-30195第195页,共236页。2022-7-30196第196页,共236页。操作步骤同前,但要选择“条形图”2022-7-30197第197页,共236页。操作步
37、骤同前,但要选择“饼图”2022-7-30198第198页,共236页。按322页操作2022-7-30199第199页,共236页。其他高血压损伤和中毒心脏病呼吸系统疾病恶性肿瘤2022-7-30200第200页,共236页。定义:用点的密集程度和趋势表示两种现象的相关关系。2022-7-30201第201页,共236页。2022-7-30202第202页,共236页。操作步骤同前,但要选择“散点图”2022-7-30203第203页,共236页。按327页操作2022-7-30204第204页,共236页。定义:定义:用一组连续的矩形表示数值变量资料的频数分布特征:特征:1.横轴表示变量,
38、纵轴表示频数。2.各矩形宽度相等,等于组距。2022-7-30205第205页,共236页。2022-7-30206第206页,共236页。2022-7-30207第207页,共236页。2022-7-30208第208页,共236页。2022-7-30209第209页,共236页。2022年7月30日2022-7-30210第210页,共236页。判断抽取的样本是否来自同一总体。总体1 总体2 x1 x22022-7-30211第211页,共236页。(一)样本均数与已知总体均数的比较(二)完全随机设计(成组设计)的两样本均数比较(三)配对设计的两样本均数比较2022-7-30212第212
39、页,共236页。t检验的目的推断两个总体均数是否相等假设检验的结论具有概率性。当P0.05,拒绝H0时,有可能犯第一类错误();当P0.05,不拒绝H0时,有可能犯第二类错误()为事先指定的检验水平(一般取0.05),未知增大样本量n,可以同时减小和。2022-7-30213第213页,共236页。例1 通过大量调查,已知某地正常男婴出生体重为3.26kg。某医生随机抽取20名难产男婴,测得出生体重如下。问该地难产男婴出生体重均数是否与正常男婴不同?3.5 3.5 3.2 3.5 3.3 3.0 3.3 3.2 3.4 2.7 3.4 3.6 3.5 2.8 3.4 2.9 3.5 3.5 4
40、.0 4.02022-7-30214第214页,共236页。2022-7-30215第215页,共236页。2022-7-30216第216页,共236页。2022-7-30217第217页,共236页。例2 某医师测得12名正常人和13名病毒性肝炎患者血清转铁蛋白含量(g/L),结果如下。问病毒性肝炎患者和正常人血清转铁蛋白含量有无差异?病毒性肝炎患者:2.34 2.47 2.22 2.31 2.36 2.38 2.15 2.57 2.19 2.25 2.28 2.31 2.42正常人:2.61 2.71 2.73 2.64 2.68 2.81 2.76 2.55 2.91 2.85 2.7
41、1 2.642022-7-30218第218页,共236页。变量说明:group:分组,1患者;2正常人。X:血清转铁蛋白。2022-7-30219第219页,共236页。2022-7-30220第220页,共236页。2022-7-30221第221页,共236页。例3 为比较某新药与常规药降血脂的效果,将性别将性别相同、血清总胆固醇水平相近的高血脂患者配成对相同、血清总胆固醇水平相近的高血脂患者配成对子。子。每对中随机抽取一人服用新药,另一人服用常规药。服用一段时间后,测得血清总胆固醇含量(mmol/L)如下。问新药与常规药降血清总胆固醇效果是否相同?常规药:6.57 6.46 6.27
42、6.89 6.21 7.61 7.60 7.04 6.68 7.42新药:6.00 6.83 5.97 7.28 6.30 6.64 7.38 7.00 6.03 7.222022-7-30222第222页,共236页。变量说明:X1:常规药的血清总胆固醇,X2:新药的血清总胆固醇2022-7-30223第223页,共236页。2022-7-30224第224页,共236页。2022-7-30225第225页,共236页。方差分析的目的推断多个总体均数是否相等方差分析的适用条件各处理组样本来自正态总体各样本是相互独立的随机样本各处理组的总体方差相等,即方差齐性2022-7-30226第226页
43、,共236页。二、方差分析(一)完全随机设计(成组设计)的单因素方差分析(二)随机区组设计(配伍设计)的两因素方差分析2022-7-30227第227页,共236页。方差分析的结果解释方差分析的F检验,当P0.05,可以认为各组总体均数不等或不全相等,即总的说来各组总体均数有差别,但并不意味着任何两组总体均数都有差别。要想确定哪些组间有差别,需进一步作两两比较。多个样本均数间的两两比较当样本数大于2时,不宜再用前述t检验方法分别作两两比较,否则会增大犯第一类错误的概率。方差分析与t检验的联系t检验可以看作为方差分析的特例,两者的计算结果有如下关系:=t2022-7-30228第228页,共23
44、6页。例4 某社区随机抽取30名糖尿病患者、糖耐量减低(IGT)者和正常人进行载脂蛋白(载脂蛋白(mg/dL)测定)测定,结果如下,问三种人载脂蛋白有无差别?糖尿病患者:糖尿病患者:85.70 105.20 109.50 96.00 115.20 95.30 110.00 100.00 125.60 111.00 106.50IGT异常者:96.00 124.50 105.10 76.40 95.30 110.00 95.20 99.00 120.00正常人:常人:144.00 117.00 110.00 109.00 103.00 123.00 127.00 121.00 159.00 115.002022-7-30229第229页,共236页。变量说明:X:载脂蛋白(mg/dL);group:组别,1=糖尿病患者,2=IGT异常者;3=正常人。2022-7-30230第230页,共236页。2022-7-30231第231页,共236页。2022-7-30232第232页,共236页。2022-7-30233第233页,共236页。2022-7-30234第234页,共236页。2022-7-30235第235页,共236页。2022-7-30236第236页,共236页。