1、分析软件分析软件概述语言基础( ),中文名),中文名“赛仕赛仕”,译为译为“统计分析系统统计分析系统”一、概述一、概述国际上的公认的标准统计软件之一。公司卓著的业绩使之被评为“全美国人最乐意为之工作的家公司”之一 及最佳决策支持工具的供应商。 发展年 美国北卡州立大学 年 推出供大学使用版年 成立研究所( .),总部在美国北卡州凯瑞市 现已是全球最大的私人软件公司和全球排名第九位的独立软件商系统组成系统组成: 三十几个模块,三十几个模块,如,如, , , *, ,: , , , , , , , , 等等q界面:三个基本窗口q 编辑窗:在此编写程序q 记录窗:记录程序运行过程中所做的内容,如所运
2、行的数据情况、所调用的过程步、程序运行时间等(红色错误 绿色 警告 兰色正常 )q结果输出窗:统计分析的结果。q窗口,窗口q其他:窗、窗、 窗、窗、窗 (在命令窗 或命令行输入相应的命令可激活这些窗口)会话窗口程序编辑窗口运行记录窗口结果输出窗口命令窗口窗口在命令窗口输入“”后情况命令行命令行命令窗命令窗(条条)中文界面的几个窗口v使用 可修改的界面显示,或输出文件的格式等。v在命令窗输入 并回车,可在编辑窗口中加入行号。v文件的扩展名v* 数据集(版)(必须以字母开头,长度不超过位); 以上版为*;v* 程序文件 v* 窗口输出 v * 结果文件 语句以一个关键词开始, 以分号(;)结束;
3、; ; ; ; ; ;程序的基本结构程序的基本结构数据步:数据步:创建数创建数据据过程步:调过程步:调用数据分用数据分析过程析过程或 或 运行编辑窗内程序运行编辑窗内程序点击图标点击图标按功能键按功能键“”“”在命令行(窗)键入在命令行(窗)键入“”“”在下拉菜单中选在下拉菜单中选“ ”所激活窗口(、)内容的保存所激活窗口(、)内容的保存在命令行(窗)键入在命令行(窗)键入 “路径路径文件名文件名”点击图标点击图标在下拉菜单中选在下拉菜单中选“ ”或或“ ”只有编辑窗口只有编辑窗口(窗窗)才能打开文件才能打开文件常用的快捷键常用的快捷键 命令命令,用于窗用于窗,将前面提交的将前面提交的程序调回
4、,可多次使用程序调回,可多次使用 切换到窗切换到窗; 切换到窗切换到窗; 切换到窗切换到窗 命令命令 清除当前窗口的内容。清除当前窗口的内容。 窗窗被清除的内容不能用调回被清除的内容不能用调回二、语言基础 ; ; ; 以关键词以关键词开始语句;对开始语句;对于以上软件,于以上软件,这些关键词显这些关键词显示为蓝色;如示为蓝色;如果显示为红色,果显示为红色,则可能的关键则可能的关键词无效或拼写词无效或拼写错误错误 ; ; ;. 所有语句必须以“;”结束 ; ; ; 初学者最容易犯的错误就是不写分号。初学者最容易犯的错误就是不写分号。此时将两个语句误认成一个语句()。此时将两个语句误认成一个语句(
5、)。注意:()一个语句可以写成两行或多行,注意:()一个语句可以写成两行或多行,如如“ “ ;”;”可写成可写成 ; ;()多个语句可以写成简单的一行。如:()多个语句可以写成简单的一行。如:“ “ ;”;”. 程序的结束 ; ; ;. 数据集名与变量名 ; ; ;数据集名称变量名称 数据集名与变量名取名时可以是字母、下划线、数字,不能以数字开头,最多可以个字符(以下软件的最大字符数为个字符) 字母可以大写、小写或大小写混合,因此、被视为相同的变量。. 变量的排列 ; ; ; 如果有多个变量,如、,则在中如果有多个变量,如、,则在中排列为排列为“ “ ;” ;” 如果将以上变量用代号、表示,如
6、果将以上变量用代号、表示,则语句可写为:则语句可写为:“ “ ;” ;” 或简写为:或简写为:“ “ ;”;”. 输入数据的标识语句 ; ; ;或; 或;语句之后表示数据的输入即将开始。数据的变量名、变量的格式等在语句中定义。数据输入结束,也必须采用分号结束。三、数据步 ; ; ; 数据分析前,数据集必须数据分析前,数据集必须被读入。被读入。 读入数据方法:读入数据方法:. 直接创建;直接创建;. 和和 语句语句 创建;创建; . 对对.、.数据进行简单编辑,数据进行简单编辑,创建新的变量等。创建新的变量等。. 直接创建数据集直接创建数据集 ; *建立临时数据集建立临时数据集,自动放在子目录下
7、自动放在子目录下* $ ; * 指明要输入的变量指明要输入的变量 , $为字符型变量为字符型变量*; *标志数据区开始标志数据区开始,数据之间以一个或几个空格分隔数据之间以一个或几个空格分隔* ; * 标志数据区结束,分号必须单独一行标志数据区结束,分号必须单独一行 * ;中的常用变量类型数值型:不需特殊定义字符型: 定义方式 变量名 $日期型:多种形式如: 变量名 . 实际记录为距的天数输入格式可以是: 其它数据库中的逻辑型、备注型变量在中均为字符型变量。日期型变量转进后一般也变为字符型变量。 ; $ ; ; ;结果结果: ; $ ; ; ;结果结果: 数据集创建时存在的问题数据集创建时存在
8、的问题 ; ; *每读入一个记录后,数据指针保持原位不换行, 继续读下一条记录* ; ; ; ; 结果: 不分行符的使用 ; $ ; ; . ; ;缺失值的输入缺失值的输入 以以“ . ”表示,缺失值不表示,缺失值不进入分析进入分析 如已存在一纯文本文件:,内容如下: 可用 直接读入: ; ; $ ; ;. 和和 语句语句 创建数据创建数据如从现有文件“”中读取数据,变成文件名为“”的文件。 ; ; ;.从现有数据集中读取数据从现有数据集中读取数据前面所产生的文件都是临时文件,退出后,这些文件将自动删除。为了将文件变成永久性数据集存储在磁盘上,可采用语句。 ; ; ;.在磁盘上存储数据集在磁盘
9、上存储数据集用代表子目录“”,可任意取名,但应与打算建立的文件名前的前缀相同数据集名称的表示方式数据集名称的表示方式: 库关联名库关联名. 数据集名数据集名永久数据集永久数据集 格式:格式: 库关联名库关联名 “ 盘符盘符:路径路径”; 如:如: :; 为库关联名,代表路径为库关联名,代表路径: ;库关联名可任意取,一旦定义,只要不退出,始终有效(因库关联名可任意取,一旦定义,只要不退出,始终有效(因为命令为全局命令)。但路径必须实际存在。为命令为全局命令)。但路径必须实际存在。临时数据集:临时数据集:每次启动时,会自动开辟一个临时存储区,其库关联名为,每次启动时,会自动开辟一个临时存储区,其
10、库关联名为,代表代表子目录。子目录。一旦退出,临时存储区数据集文件自动删除,称为临时数据一旦退出,临时存储区数据集文件自动删除,称为临时数据集集临时数据集的库关联名默认为,均省略不写。临时数据集的库关联名默认为,均省略不写。 如如 ; (实际为)(实际为)永久数据集和临时数据集永久数据集和临时数据集利用下拉菜单中的功能 ,可转入:文本型数据:空格分隔、逗号分隔、制表键分隔 数据库(*)数据库有的数据可通过粘贴的方法贴到窗,然后采用和等语句,直接生成数据集。. 从其他数据集转入从其他数据集转入u变量赋值:变量赋值:u 变量名表达式;如变量名表达式;如*; ; ;u加减乘除、乘方运算符:加减乘除、
11、乘方运算符:*、*u缺失值赋值举例:缺失值赋值举例: .; 字符型变量:字符型变量:;u u ;u ; 如如 ;u u子集化:用或语句整理变量名表子集化:用或语句整理变量名表 u ; u ;. 修改数据修改数据 ; ; ; ; ; ; ;注:注: 等价于等价于 ; 数据集的整理举例数据集的整理举例数据子集化 记录输出 数据集; 记录删除 ; ; ; ; ; ; 数据集的整理记录操作数据集的整理记录操作数据集整理记录操作数据集整理记录操作 ; ; ; ; ; ; ; ; ; ; . . . . . . . . . . . . . . . n 纵向合并: ;数据集整理记录操作数据集整理记录操作 ;
12、 ; ; ; ; . . . ; ; ; ; n 横向合并: ;数据集整理记录操作数据集整理记录操作排序 ; ;横向合并: 一般要先按识别字段排序 ; 识别字段;四、过程步四、过程步 过程步(过程步( )是以关键)是以关键字开始的一个或多个语句。字开始的一个或多个语句。过程步的结构一般为:过程步的结构一般为: 过程名过程名 过程选择项过程选择项 ; 语句语句 语句选择语句选择项项 ; 语句语句 语句选择语句选择项项 ; 语句语句 ; 常用过程步、(定量资料的描述、配对检验,一个样本对应总体与一定量资料的描述、配对检验,一个样本对应总体与一个已知总体的比较检验个已知总体的比较检验)(两样本对于的总体均数的比较)(两样本对于的总体均数的比较)(卡方检验,精确检验)(卡方检验,精确检验)、(方差分析)、(方差分析) (非参数检验)(非参数检验)(相关)(相关)(简单与多重回归)(简单与多重回归) 、(绘图)、(绘图)(排序)(排序) (按要求输出结果)(按要求输出结果)