1、1课程介绍课程介绍 统计方法是一种用于收集,表示(图解),分析和解释数据的方法.也可以说,统计方法就是从一大堆资料中提取有用信息的方法.“统计”常作为统计方法的缩写使用.“统计”在我们日常生活生活和工作中,特别是社会调查和科研工作中,是随时都可能迂到的问题.统计不仅是简单的把一堆数据数数个数,算算平均值,列成表格,而是要进行分析整理,给出一些更有意义的“统计量”.2课程介绍课程介绍 统计学是数据的科学,是对数据进行收集,整理,分析,并作出推断的一门科学.统计学是一门方法论的学科.统计的重要性在于:它由单纯的综合分析转变为统计推断,可超越观测的时间,空间范围,由过去推断未来,由局部推断总体.统计
2、方法在自然科学,社会科学各个领域都有广泛的应用.3课程介绍课程介绍 统计方法包括的内容及一些应用统计方法包括的内容及一些应用:基本统计推断基本统计推断(估计和检验).统计预报统计预报(回归和时间序列分析回归和时间序列分析):高中成绩预报高考成绩;用电量预报;气象预报;虫情预报;地震预报;火警预报;财政收入的预测;青少犯罪的预测.分类分类(聚类和判别聚类和判别):大气污染地区的分类;医学上的临床诊断;中医阴阳学说的研究;服装的定型分类;含矿的诊断;考古学中文物的分类;红楼梦的研究;企业经济效益的分类.数据结构的简化数据结构的简化(主分量主分量,因子分析和典型相关因子分析和典型相关):进一步可应用
3、于预报与分类.方案设计方案设计(试验设计试验设计,抽样抽样),数量化理论等数量化理论等 4第一章 描述统计第二章 估计和检验第三章 方差分析与协方 差分析第四章 回归与回归诊断第五章 属 性数据分析第六,七章 聚类与判别第八,九,十章 多变量分析(主分量,因子分析和典型相关)第十一章 时间序列预报系统附录1 SAS系统入门本课程的内容5实用统计方法与SAS系统(高惠璇,2000)实用多元统计分析(方开泰,1989)常用统计方法(王玲玲等,1994)实用数据分析方法(王国富等,1992)应用多元分析(王学民,1999.9)多元统计分析(于秀林,1999.8)SAS系统与基础统计分析(高惠璇等,1
4、995)SAS系统使用手册等资料(1997-1999)教材与参考书6 教学方式教学方式:授课与上机实习相结合.本课程的特点与教学方式本课程的特点本课程的特点是将实用统计方法的介绍与在计算机上实现这些方法的软件紧密地结合起来,不仅介绍每种统计方法的实际背景、统计思想、统计模型和解题的思路,并结合实例介绍应用统计软件解决问题的步骤和计算结果的分析。本书不侧重严格的数学推导。提供SAS系统(6.12版本)供大家使用.7本课程的考核方法期末上机开卷考试(占60%70%)平时作业,期中练习,考勤等(占40%30%)选课办法选课办法:根据学校8月20日的规定,全校选修课第二,三周为试听阶段,第四周(9月2
5、4日)在课堂登记选课.一旦选定不得退选.8 第一章 描述统计4统计的方法,通常包括描述统计和推断统计两方面。本章介绍描述统计,而以后几章介绍包括统计推断、统计预测等应用更广泛的推断统计。4描述统计是把观测数据本身包含的信息加以总结概括、整理简化。例如频数表、频率分布直方图及描述统计量的计算都属于描述性统计。9 第一章第一章 描述统计描述统计 1.1 描述统计量已知一组观测数据已知一组观测数据:x1,x2,xn.描述这组数据描述这组数据的特征量有的特征量有:描述取值位置的描述取值位置的特征特征量量:均值均值,众数众数,中中位位数数,分位数分位数描述分散程度的特征量描述分散程度的特征量:方差方差,
6、标准差标准差,标准误标准误,四分位数四分位数,极差极差,四分位极差四分位极差.描述分布形状的特征量描述分布形状的特征量:偏度偏度,峰度峰度,分位数分位数10 第一章第一章 描述统计描述统计 1.2 用图表概括数据 (1)频数表频数表 11 第一章第一章 描述统计描述统计 1.2 用图表概括数据(2)直方图直方图(条形图条形图)12 第一章第一章 描述统计描述统计 1.2 用图表概括数据(3)茎叶图及盒须图茎叶图及盒须图13 第一章第一章 描述统计描述统计 1.2 用图表概括数据(4)盒形盒形(须须)图图14 第一章第一章 描述统计描述统计 1.2 用图表概括数据(5)正态概率图正态概率图15
7、附录1 SAS系统入门1.SAS 系统简介2.SAS系统对数据的管理3.SAS数据集的建立、浏览、编辑4.用数据步生成SAS数据集5.增改删数据集中的记录或变量6.串接或并接SAS数据集7.用PROC PRINT 制作列表报告8.SAS图形入门16 SAS系统4 SAS系统是用于数据分析与决策支持的大型4 集成式模块化软件系统。4 其早期的名称为统计分析系统-4 Statistical Analysis System(缩写为SAS)4 在数据处理和统计分析领域,SAS系统被誉为4 国际上的标准软件系统.17 SAS系统是用于决策支持 的大型集成信息系统4SAS系统主要完成以数据为中心的四大任务
8、:4 数据访问-访问任何形式和来源的数据4 数据管理-将数据转变成可用形式4 (SAS/WA)4 数据呈现-使信息产生效用4 数据分析-获得有意义的信息(SAS/EM)18 SAS 系统介绍DATA19 SAS系统软件由模块构成4SAS系统是一个可由几个到二、三十个工具模块及面向行业的子系统组成的可伸缩系统。其模块按功能大体有四类:4 数据库部分:Base SAS,FSP,ACCESS,.4 分析核心:STAT,ETS,QC,OR,INSIGHT,.4 开发呈现工具:AF,EIS,GRAPH,.4 分布处理与数据仓库:CONNECT,WA,.20 第一章 SAS 系统简介 1 使用系统运行一个
9、简例4例.(中学生数据的简单分析)4 数据集SASUSER.CLASS中收集了19名中学生的年龄(AGE),性别(SEX),身高(HEIGHT)和体重(WEIGHT)的数据.4 .试求年龄,身高,体重的平均值,最大值和最小值;4 .分别求男女二组中学生身高的平均值和方差;4 .试问男女中学生的平均体重是否有显蓍差异?(数据见练习题P2,SAS程序见BASE11.SAS)21第一章 SAS 系统简介 1 使用系统运行一个简例4解题步骤解题步骤(用基本的编程方式用基本的编程方式):4 ()启动启动SAS系统系统(使用最简单的快捷方式使用最简单的快捷方式);4 ()告诉告诉SAS系统您要做什么系统您
10、要做什么-在在 PROGRAM EDITOR窗窗口中口中 键入程序键入程序(BASE11.SAS):4 ()SAS系统按要求完成分析计算系统按要求完成分析计算-提交程序(提交程序(SUBMIT);4 ()由由LOG 窗口查看程序执行的信息窗口查看程序执行的信息4 ()重调已提交的重调已提交的SAS程序(程序(RECALL),修改后再次提交修改后再次提交;4 ()在在OUTPUT 窗口查看运行结果窗口查看运行结果;4 ()存储有用的信息存储有用的信息(SAS程序或计算结果程序或计算结果).(转到SAS系统运行BASE11.SAS)22第一章 SAS 系统简介 1 使用系统运行一个简例4解题步骤(
11、用菜单系统SAS/INSIGHT或分析员应用):4 1.启动SAS系统=进入INSIGHT环境=打开CLASS数据集=Analyze=Multivariate(Ys)=选变量Age,Height,Weight4 =Output=在弹出窗口选Univariate=OK=OK,显示结果.4 2.在分布窗口指定SEX(性别)为GROUP变量及变量Age,Height,Weight,在Output窗选Univariate=OK=OK.4 3.启动SAS系统=进入分析员应用=打开CLASS数据集4=Statistics=Hypothesis Tests=Two-Sample t-test for Mea
12、ns4=指定分析变量(Weight)和分组变量(Sex)=OK,则显示结果.23启动SAS的方法:()在Windows桌面系统下双击AS图标第一章 SAS 系统简介 SAS 提供的基本运行环境-启动SAS()运行SAS系统目录下(例C:SAS)的可执行程序sas.exe()从“运行“打开或从”资料管理器”双击某个已 有的SAS程序,也可启动SAS系统并调入该程序工作界面介绍24 第一章 SAS系统简介 2 SAS 提供的基本运行环境-显示管理系统4SAS显示管理系统是用户和SAS系统交互会话的环境.包括众多的窗口(三个基本窗口:PROGRAM EDITOR窗口,LOG窗口OUTPUT窗口),命
13、令.4发布显示管理命令有四种方式:4 在命令框直接键入命令;4 使用显示管理系统的下拉菜单(弹出菜单);4 使用工具栏。4 按功能键(命令显示功能键所表示的命令).25 第一章 SAS系统简介 2 SAS 提供的基本运行环境-显示管理系统4常用的其它窗口:4KEYS 查看及改变功能键的设置4LIBNAME 查看已存在的SAS数据库 4DIR 查看某个SAS数据库的内容4VAR 查看SAS数据集的有关信息4OPTIONS 查看及改变SAS的系统设置4HELP 完整的帮助信息窗口26 第一章 SAS系统简介 SAS 提供的基本运行环境4SAS常用的交互式运行方式:44.用SAS提供的菜单系统实现各
14、种任务4.用SAS编程实现各种任务.用SAS/ASSIST.用SAS桌面系统进菜单系统27第一章 SAS系统简介 SAS 提供的基本运行环境4进入SAS/ASSIST41.使用工具栏图标42.发命令ASSIST43.下拉菜单选 Globals=ASSIST进入SAS桌面系统 1.发命令DESKTOP 2.下拉菜单选 Globals=DesktopP00528第一章 SAS系统简介 2 SAS 提供的基本运行环境-SAS菜单系统4SAS系统提供几个交互式地菜单系统用来完成各种分析任务.4 .SAS/INSIGHT软件4 .分析员应用(ANALYST)4 .市场研究应用(MARKET)4 .SAS
15、/LAB软件4 .SAS/ETS软件的时间序列预报系统P00529第一章 SAS系统简介 2 SAS 提供的基本运行环境-应用工作界面4应用工作界面(AWS)4 SAS AWS是Windows环境下使用显示管理系统运行SAS系统的工作界面.4 SAS AWS的主窗口是标题为SAS的窗口4 SAS AWS还包括:4 .所有打开的SAS窗口(含最小化的窗口)4 .子窗口和对话框4 .菜单条,工具栏,命令框,状态栏30第二章 SAS系统对数据的管理4SAS对数据的分析与呈现都是面对SAS数据集进行的4SAS数据集是一种SAS文件4SAS文件是由SAS系统创建和管理的有特殊结构的文件。包括SAS数据集
16、和SAS目录册(CATALOG)等31第二章 SAS系统对数据的管理数据直接输入流行的数据库其它文件格式SAS数据集SAS应用程序32第二章 SAS系统对数据的管理1 SAS 数据集4 两种类型的数据对象:.SAS数据集(Data sets):包含描述部分和数据部分 2.SAS数据视窗(Data View):只含描述部分(变量名,属性,长度,标签,输入输出格式,创建与修改日期)Ass=D.Manag.=Utilities=Contents.=B&E=Dst Attr.33第二章 SAS系统对数据的管理1 SAS 数据集-描述部分34第二章 SAS系统对数据的管理1 SAS 数据集-数据部分VA
17、R1VAR2.VARn观测 1123 aBc12Mar90观测 2456 XyZ01Jul97观测 312.34 12331Dec56观测 40.1234 Lm3n01jan80变 量35第二章 SAS系统对数据的管理2 SAS 数据库-SAS 数据库 及其库标记4SAS数据集存储在SAS数据库中SAS数据库还存储其它SAS专用文件4SAS数据库文件用两级命名方式定名:libname.SAS-filename4 (库标记.文件名)SAS数据集SAS数据库36第二章 SAS系统对数据的管理 2 SAS 数据库-永久库和临时库4SAS数据库有永久库和临时库两种:4临时库:名为WORK,系统自动指定
18、4永久库:系统自动指定永久库的库标记为4 SASUSER,用户还可以规定其它4 永久库标记.4例如:Libname out a:;37第二章 SAS系统对数据的管理 2 SAS 数据库-Windows下SAS数据库的设定4不同的主操作系统下SAS数据库文件以不同方式与主操作系统下的文件组织相联系4在Windows下每个SAS数据库置于主机硬盘的某个子目录之中.4例:SASUSER:C:SASSASUSER WORK:C:SASSASWORK COURSE:C:COURSE连库 Libname 库名 目录1 目录238第二章 SAS系统对数据的管理 2 SAS 数据库-Windows下SAS数据
19、库的设定4.系统指定的库(设SAS系统在目录C:SAS下)4 SASUSER设置在 C:SASSASUSER4 WORK 设置在 C:SASSASWORK 4.LIBNAME语句4 使用LIBNAME语句可以指定SAS数据库的库标记4LIBNAME 库标记名 目录名;挘4例如:LIBNAME out a:;挘4 LIBNAME course c:course;看库39第二章 SAS系统对数据的管理 2 SAS 数据库-Windows下SAS数据库的设定43.Libname窗口,DIR和VAR窗口4()用工具栏中的图标进入库管理对话窗(或键入命令 Dlglib)可浏览库内容或操作库文件或4()用
20、LIBNAME命令进入Libname窗口4 用DIR 命令进入Dir窗口4 用VAR 命令进入Var窗口40第二章 SAS系统对数据的管理 2 SAS 数据库-浏览数据集4()用工具栏中的图标进入库管理对话窗4 =选中数据集后点鼠标右键4 =在弹出菜单选 Open table view4()在命令框发命令:FSV 数据集名4()提交程序:proc print data=数据集名;run;41第三章 SAS数据集的建立、浏览、编辑建立SAS数据集的各种途径数据存于纸上需直接键入数据存于文本文件数据存于流行数据库文件中用VIEWTABLE FSEDIT FSVIEW编程:用DATA步用Import
21、菜单用SAS/ACCESS42第三章 SAS数据集的建立、浏览、编辑 1 变量属性与输入、输出格式-变量的属性4数据集中变量的属性描述:4 变量名(Name):字母或下划线开始且不超过 8个字符或数字构成4 类型(Type):数值型、字符型4 长度(Length):缺省8字节()4 标记(Label):缺省40字节4 输入格式(Informat):$输入格式名w.d4 输出格式(Format):$输出格式名w.d 200必须可选43第三章 SAS数据集的建立、浏览、编辑 1 变量属性与输入、输出格式-缺失值4在数据集的一条记录的某个变量无数据时,称为缺失值(Missing Value)。4字符
22、型变量的缺失值用空格符表示4数值型变量的缺失值用句号“.”表示NAME SEX POSITION AGESALARYAlex MA 35 1500Linda F 28 1400Simon MC 45 .44第三章 SAS数据集的建立、浏览、编辑 1 变量属性与输入、输出格式-输入/输出格式4输入、输出格式的例子:12234.123412,234.1234$12,234.12348.2comma8.2dollar8.2输入数据输入格式实际存储 数据值12234.12输出格式8.2comma8.2dollar8.2输出数据12234.1212,234.12$12,234.12看转换:data _n
23、ull_;x=put(today(),date7.);put x;run;45第三章 SAS数据集的建立、浏览、编辑 1 变量属性与输入、输出格式-日期的格式4日期输入、输出格式例:20OCT9720/10/971997/10/20DATE7.DDMMYY8.yymmdd10.输入数据输入格式实际存储 数据值 13807输出格式date9.mmddyy6.yymmdd8.输出数据20OCT199710209797-10-2046第三章 SAS数据集的建立、浏览、编辑 1 变量属性与输入、输出格式4几种常用的输入、输出格式:w.d$w.COMMAw.dDOLLARw.dDATEw.MMDDYYw
24、.标准的数字型格式 标准的字符型格式数字中嵌入逗号数字中嵌入逗号,前加$日期格式 日期格式 47第三章 SAS数据集的建立、浏览、编辑 1 变量属性与输入、输出格式4利用HELP查找SAS系统提供的输入、输出格式Help下拉菜单SAS System 目录:SAS Language 索 引:SAS Informats and Formats -ContentsSAS Formatsand Informats从分类功能找从格式名找操作:VT 输入48第三章 SAS数据集的建立、浏览、编辑 2 创建SAS数据集-直接输入.键入命令:VT(viewtable)-表格方式输入或用SAS菜单系统-SAS/
25、INSIGHT软件和分析员应用.逐条输入PROC FSEDIT NEW=SAS-data-set;RUN;.成批输入PROC FSVIEW NEW=SAS-data-set;RUN;.DATA步(见第四章)操作:看生成的数据集和sasuser.class49第三章 SAS数据集的建立、浏览、编辑 3 浏览、修改SAS数据集1.键入命令:VT 数据集(如:VT SASUSER.CLASS)或用SAS菜单系统-SAS/INSIGHT软件和分析员应用2.逐行浏览 PROC FSEDIT DATA=SAS-data-set;RUN;.成批浏览 PROC FSVIEW DATA=SAS-data-set
26、;RUN;4.用PRINT过程显示SAS数据集50第四章 用数据步生成SAS数据集 1 SAS程序的构成4SAS的程序由两种程序步(Step)构成:4数据步(DATA STEP):以DATA语句开始,用于创建和整理SAS数据集4过程步(PROC STEP):以PROC语句开始,用于分析处理SAS数据4 SAS程序是由一个或若干个DATA步和PROC步组成的.514DATA步中设定变量属性的语句:4第四章 用数据步生成SAS数据集 在DATA步中规定变量属性LENGTH 变量名 长度.;INFORMAT 变量名 输入格式.;FORMAT 变量名 输出格式.;LABEL 变量名=字符串输入格式.;
27、Length还决定了变量在数据集中的次序看testdata,testdt2,testdt3 不同格式文本本件52第四章 用数据步生成SAS数据集 直接输入数据生成SAS数据集4在DATA步直接输入数据的4一般形式:4 DATA SAS-data-set;4 变量属性设定语句;4 INPUT 语句;4 其它语句;4 CARDS;4 数据行;4 RUN;在DATA步直接输入数据的例子:data da1;input x y z;sum=x+y+z;cards;1 3.1 5 3 2.3 7 6 3.4 6 ;看testdata,testdt2,testdt3 不同格式文本本件53第四章 用数据步生成
28、SAS数据集 5 由文本数据文件生成SAS数据集4在DATA步由文本数据文件生成4SAS数据集的一般格式:DATA SAS-data-set;变量属性设定语句;INFILE filename ;INPUT 语句;其它语句;RUN;在DATA步由文本数据文件生成SAS数据集的例子:data da2;infile c:f1.txt;input x y z;mean=(x+y+z)/3;run;文本数据文件f1.txt的内容:3.1 5 3 2.3 7 .54第五章 增改删数据集中的记录或变量1 读入其它SAS数据集4要增加、修改、删除SAS数据集中的观测或变量可在DATA步中加入各种语句来实现4
29、()生成SAS数据集(由外部文件或直接输入)时,在INPUT语句之后加入;4 ()用SET语句读入已有SAS数据集再加入各种语句对读入数据集中的变量或观测进行增改.4或用数据集选项实现.55第五章 增改删数据集中的记录或变量1 读入其它SAS数据集4增改删数据集中的记录或变量4 或在INPUT语句后 或用SET语句并加入其它SAS语句:加入其它SAS语句 DATA new;.;INPUT ;其它 SAS 语句;RUN;DATA new;SET old;其它 SAS 语句;RUN;操作,p04756第五章 增改删数据集中的记录或变量2 选择数据集的变量和观测-选择变量4在DATA 语句中用数据集
30、选项DROP=和 KEEP=4在SET 语句中用数据集选项DROP=和 KEEP=4在DATA步中加入DROP语句和 KEEP语句 4例:(1)data new(drop=x y);4 (2)set old(keep=x y);4 (3)data new;.4 drop x y;4 run;操作:class,if 年龄,性别57第五章 增改删数据集中的记录或变量2 选择数据集的变量和观测-选择观测4用SAS语句4保留观测4 IF expression;(子集IF语句)4剔除观测4 IF expression THEN DELETE;操作58第五章 增改删数据集中的记录或变量2 选择数据集的变量
31、和观测-选择观测4用数据集选项4在DATA 语句中用选项WHERE=4在SET 语句中用选项WHERE=4在SET 语句中用选项FIRSTOBS=和/4 或OBS=4例:(1)data new(where=(sex=F);4 (2)set old(where=(age13);4 (3)set old(firstobs=6 obs=20);59第五章 增改删数据集中的记录或变量3 用SAS语句创建、赋值和修改4DATA步中常用的语句:4 设定变量属性的语句4 赋值语句4 条件语句4 循环语句4 转移语句4OUTPUT语句与PUT语句操作:class,W/H h inch-cm604赋值语句的一般
32、形式4var 新建或修改的变量名expression 由变量、SAS函数和四则运算 (+,-,*,/,*)构成的表示式4赋值语句将表示式的值赋给变量第五章 增改删数据集中的记录或变量3 用SAS语句创建、赋值和修改-赋值语句var=expression;fct132 取整,fct134 平均,求和614SAS函数共19类4调用形式:4 函数名(变元)4 函数名(OF 变量名列)4其中变元可以是常数、变量、函数或表示式4例:sqrt(x),probnorm(x),tinv(x,df)4 sum(of x1,x10-x20,x25)第五章 增改删数据集中的记录或变量 3 用SAS语句创建、赋值和修
33、改-SAS函数(转到SAS系统运行BASE53_3.SAS)62第五章 增改删数据集中的记录或变量 3 用SAS语句创建、赋值和修改-SAS函数4利用HELP查找SAS系统提供的各种函数Help下拉菜单SAS System 目录:SAS Language 索引:SAS Function -Contents从分类功能找从函数名找SAS Functions63第五章 增改删数据集中的记录或变量 3 用SAS语句创建、赋值和修改-SAS函数4 函函 数数 类类例例Arithmetic ABS,SQRT,DIMCharacter UPCASE,SUBSTR,TRIMDate and TimeTODAY
34、,DAY,MONTH,MDYMathematical LOG,EXP,GAMMANoncentrality CNONCT,FNONCT,TNONCTQuantile PROBIT,CINV,TINV,FINVProbability and Density PROBNORM,PROBT,POISSON,PDF,PDMRandom NumberRANUNI,RANNOR,RANEXPSample StatisticSUM,MEAN,STD,VAR,RANGESpecialPUT,INPUT,DIF,LAGTrigonometricSIN,TAN,ARCOSTruncationINT,CEIL,RO
35、UNDOthersZIPSTATE64第五章 增改删数据集中的记录或变量 3 用SAS语句创建、赋值和修改-SAS函数4测试函数功能的一个简单的程序:4 data _null_;y=sqrt(3);put y=;run;p050 日期函数65第五章 增改删数据集中的记录或变量 3 用SAS语句创建、赋值和修改-SAS日期时间函数4SAS日期常数和函数:4直接作为数字型常数:ddMMMyyD(例如:12JAN96d)4一些操作日期的函数:DATE(),TODAY(),DATETIME(),TIME(),YEAR(SAS-date),QTR(SAS-date),MONTH(SAS-date)DAY
36、(SAS-date),HOUR(datetime|time),MINUTE(.),4MDY(month,day,year),HMS(hour,minute,second),4DHMS(date,hour,minute,second)书上例,p41开始664 条件语句IF 条件表达式条件表达式 THEN 可执行语句可执行语句;ELSE 可执行语句可执行语句;第五章 增改删数据集中的记录或变量 3 用SAS语句创建、赋值和修改-条件语句比较操作符:,GT,=EQ,LE,GE,NE,IN逻辑操作符:&AND,-OR,NOT.IF expression THEN DO;statements;.END;
37、ELSE DO;statements;.END;67第五章 增改删数据集中的记录或变量 3 用SAS语句创建、赋值和修改-例子4(1)tatol=x+y+z;tatol=sum(x,y,z);tatol=sum(of x1-x6);4(2)if sex=F then y=100+y;4 if upcase(dest)=LAX then y=x+z;4(3)if sum le 170 then delete;4(4)if upcase(dest)=LAX then do;4 y=x+z;city=Dallas;4 end;4(5)length city$12;4(6)date=01jan97d;
38、4 year=year(date);qtr=qtr(date);4 month=month(date);day=weekday(date);(参见BASE53.SAS)68第六章 串接或并接SAS数据集AB AB ABSAS 数据步数据步数据串接数据串接SAS 数据集数据集SAS 数据集数据集数据并接数据并接69DATA SAS-data-set;SET SAS-data-set1 SAS-data-set2.;RUN;第六章 串接或并接SAS数据集1 串接SAS数据集4用SET语句串接SAS数据集4(变量相同或变量不同的连接)p058 最简,p059 变量不同,p060 变量改名70第六章
39、串接或并接SAS数据集1 串接SAS数据集NUM VARA 1 A1 2 A2 5 A3DATA COMBINE;set A B;run;A:B:NUM VARA VARB 1 A1 2 A2 5 A3 3 B1 4 B2 6 B3 COMBINE:NUM VARB 3 B1 4 B2 6 B3(参见BASE61.SAS)71DATA SAS-data-set;SET SAS-data-set1 SAS-data-set2.;BY Variables;RUN;第六章 串接或并接SAS数据集1 串接SAS数据集4用SET语句串接SAS数据集4(按BY变量的顺序交替连接数据集中观测)724NUM
40、VARB4 3 B14 4 B24 6 B3第六章 串接或并接SAS数据集1 串接SAS数据集NUM VARA 1 A1 2 A2 5 A3DATA COMBINE;set A B;BY NUM;run;A:B:NUM VARA VARB 1 A1 2 A2 3 B1 4 B2 5 A3 6 B3 COMBINE:(参见BASE61.SAS)p06173第六章 串接或并接SAS数据集1 串接SAS数据集-SORT过程4用PROC SORT语句对SAS数据集排序4 (当用BY语句时,要求对每个数据集先用SORT过程按BY变量排好次序)PROC SORT DATA=SAS-dat-set1 OUT
41、=SAS-dat-set2;BY by-variables;RUN;p063(比较有无by)74第六章 串接或并接SAS数据集2 并接SAS数据集 4用MERGE语句合并SAS数据集DATA SAS-data-set;MERGE SAS-data-set1 SAS-data-set2;BY by-variables;RUN:MERGE SAS-data-set1(In=var)SAS-data-set2(In=var);Set 258 内部变量,Set258_2 转为用户设定变量75第六章 串接或并接SAS数据集1 串接SAS数据集4 NUM VAR 1 C1 2 C2 2 C3 3 C4NU
42、M VAR 2 D1 3 D2 3 D3data combine;set C D;by num;run;C:D:NUM VAR 1 C1 2 C2 2 C3 2 D1 3 C4 3 D2 3 D3COMBINE:(参见BASE61.SAS)76第六章 串接或并接SAS数据集2 并接SAS数据集4 NUM VARA 1 A1 2 A2 3 A3NUM VARB 1 B1 2 B2 4 B3DATA COMBINE;merge A B;by num;run;A:B:NUM VARA VARB 1 A1 B1 2 A2 B2 3 A3 4 B3COMBINE:(参见BASE62.SAS)p066 b
43、y+in,p067 by+in+rename77第六章 串接或并接SAS数据集2 并接SAS数据集4 NUM VARA 1 A1 2 A2 3 A3NUM VARB 2 B1 2 B2 3 B3DATA COMBINE;merge A B;by num;run;A:B:NUM VARA VARB 1 A1 2 A2 B1 2 A2 B2 3 A3 B3COMBINE:(参见BASE62.SAS)p07078PROC PRINT DATA=SAS-data-set;RUN;第七章 用PROC PRINT 制作列表报告1 产生列表报告 PROC PRINT语句的最简单形式:例:Proc print
44、 data=sasuser.class;run;P79第七章 用PROC PRINT 制作列表报告1 产生列表报告4PROC PRINT过程的一般形式:4PROC PRINT DATA=SAS-data-set;4 ID variable;4 VAR variables;4 WHERE where-expression;4 SUM variables;4 BY by-variables;4 PAGEBY by-variables;4RUN;80第七章 用PROC PRINT 制作列表报告1 产生列表报告-例子4(1)proc print data=class noobs;4 run;4(2)p
45、roc print data=class noobs;4 var name height weight;4 where age between 134 and 15;4 run;(3)proc sort data=class;by sex;proc print data=class;by sex;id name;run;(4)proc print data=class;by sex;sum age;run;(参见BASE71.SAS)p079 title,p080 footnote81第七章 用PROC PRINT制作列表报告2 改进列表报告4TITLEn text;FOOTNOTEn tex
46、t;标题、脚注和选项:OPTIONS options;p08882第七章 用PROC PRINT制作列表报告2 改进列表报告4与PRINT有关的一些系统选项4CENTER|NOCENTERDATE|NODATENUMBER|NONUMBERLINESIZE=widthPAGESIZE=nPAGENO=n定义方法OPTIONS 语句OPTIONS 窗口83第七章 用PROC PRINT制作列表报告2 改进列表报告PROC PRINT 选项选项;4PROC PRINT 的一些选项:4HEADING=v|h4LABEL4SPLIT=符号4WIDTH=Full|Min|Up081 label 临时设定
47、,p082 split.用cclass+opton label84第七章 用PROC PRINT制作列表报告2 改进列表报告4LABEL variable1=label4 variable2=label4 .;Print 选项:SPLIT=符号Label语句:例:proc print data=class split=#;label weight=weight#in#pounds;run;p084 用已有格式,p086 用定义格式85第七章 用PROC PRINT制作列表报告2 改进列表报告4FORMAT语句:FORMAT variables format;定义用户格式:PROC FORMAT
48、;VALUE format-name range1=label range2=label .;86第七章 用PROC PRINT制作列表报告2 改进列表报告-综合例子4proc format;4 value group low-95=S 96-110=M 111-high=L;4run;4option ps=40 ls=80;4proc print data=class split=*label;4 format weight group.;4 var name sex height weight;4 title 中学生数据;4 footnote 1986;4 label name=First
49、*name4 sex=Gender4 weight=Weight*in*group4 height=Height*in*inches;4 id name;4run;4(转到SAS运行BASE72.sas)87第八章 SAS图形入门4Base SAS和SAS/GRAPH提供了许多过程用于绘制图形(这里介绍高分辨图形):散点图及连线图(PLOT过程或GPLOT过程)图表(CHART过程或GCHART过程)地图(MAP过程)三维图形(three-dimensional graphics)文本缩放及其它(text slides)88第八章 SAS图形入门1 散点图及连线图4用GOPTIONS语句指定图
50、形设备:goptions dev=win;goptions dev=winprtm;goptions reset=all;p105 散点图89第八章 SAS图形入门1 散点图及连线图-过程4用GPLOT过程步绘制散点图及连线图:4例:绘制CLASS数据集中体重对身高的散点图.4 Proc gplot data=class;4 plot weight*height;4 run;PROC GPLOT DATA=SAS-data-set;PLOT vert-var*hor-var/options;RUN;p107 连线 v=square,p108 加色,线型,粗细90第八章 SAS图形入门1 散点图