1、spss在数据分析中的应用-PPT精品文档目 录数据现状SPSS现状SPSS构成SPSS数据预处理2 人类积累的数据量以每月环比15%的速度增加 世界上信息的数量每二十个月翻一番1、数据现状3 随着计算机的广泛应用,数据分析工作已经在悄然的萌芽 数据分析工作目前主要是对数据进行一些描述性统计分析、相关分析、回归分析、聚类分析、因子分析等1、数据现状4评估与表达数据分析数据库及数据仓库循序渐进2、数据分析的定义 从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程3、数据分析商业意义 数据分析是从海量数据中提取隐含在其中
2、的有用信息和知识的过程,从而企业赢得竞争优势64、数据分析流程75、数据分析实施的保证商业理解商业理解数据数据理解理解数据准备数据准备建立模型建立模型模型评估模型评估模型发布模型发布86、数据分析的系统分类 数据分析是一个交叉学科领域,受多个学科影响包括数据库系统、统计学、机器学习、可视化和信息科学。97、数据分析应用领域数据分析数据分析电信政务电子房地产工业生产零售生物、医学金融目前在零售行业应用较为广泛,其余行业处于刚刚起步阶段108、数据分析的应用领域营销u关联分析-市场篮子分析,用于了解顾客的购买习惯和偏好,有助于决定市场商品的摆放和产品的捆绑销售策略;u序列模式与市场篮子分析相似,不
3、过是用某时间点发现的产品购买或其他行为模式来预测将来购买产品或服务类别的概率;u聚类用于市场细分,将顾客按其行为或特征模式的相似性划分为若干细分市场,以采取有针对性的营销策略;u分类用于预测哪些人会对邮寄广告和产品目录、赠券等促销手段有反应,还可用于顾客定级、破产预测等。11数据分析在营销中的应用流程128、数据分析的应用领域营销9、数据分析的挑战挑战挑战数据的质量问题数据量庞大客户隐私问题数据所有权13目 录数据现状SPSS现状SPSS构成SPSS数据预处理141、SPSS软件简介u SPSS是“社会科学统计软件包”(Statistical Package for the Social Sc
4、ience)的简称,是一种集成化的计算机数据处理应用软件。u 1968年,美国斯坦福大学H.Nie等三位大学生开发了最早的SPSS统计软件,并于1975年在芝加哥成立了SPSS公司,已有30余年的成长历史,全球约有25万家产品用户,广泛分布于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研、教育等多个领域和行业。u SPSS是世界上公认的三大数据分析软件之一(SAS、SPSS和SYSTAT)15目前,世界上最著名的数据分析软件是SAS和SPSSSAS具有功能强大,灵活多样的特点,但其操作难度较大,一般人较难掌握SPSS操作相对简便,界面友好,简单实用,因而应用较为广泛123161、SP
5、SS软件简介2、SPSS特点集数据录入、资料编辑、数据管理、统计分析、报表制作、图形绘制为一体菜单式界面,便于操作与管理相关性分析、回归分析、方差分析、聚类分析、判别分析、主成分分析和因子分析等方法17操作简单操作简单功能齐全功能齐全分析分析系统系统目 录数据现状SPSS现状SPSS构成SPSS数据预处理181、SPSS数据文件的构成 由数据结构结构和数据内容内容构成 结构规定了数据文件的基本构成属性 变量名、变量类型、变量名标签、变量值标签、缺失值定义、度量尺度及数据显示属性如宽度列宽度和对齐方式等1920212、变量名的定义首字符必须是字母或汉字,后面可以是除(!、?*)之外的任意字符。变
6、量名的结尾不能是圆点、句点、下划线变量名的长度不能超过64个字符变量名必须唯一,并且不区分大小写SPSS的保留字不能作为变量名(ALL、NE、EQ、GTAND、NOT、WITH)如不指定变量名,则系统默认变量名以VAR开头后面跟5个数字 为了便于记忆和理解,变量名与其所代表的具体含义一致为了便于记忆和理解,变量名与其所代表的具体含义一致。223、变量类型的定义 数值型数值型:根据其功能和形式又可细分为(标准型、逗号型、句点型、科学计数型、美元型和自定义货币型)字符型字符型 日期型日期型 系统默认为标准数值型系统默认为标准数值型234、变量定义中需要注意的问题缺失值的定义缺失值的定义 离散的缺失
7、值 针对某几个数值进行确实处理 范围加上离散的缺失一定范围内的缺失处理245、SPSS数据的录入 当变量的属性定义完成后就可以开始进行数据的输入 切换窗口从Variables View 到 Date View2526Date Date ViewView窗口示意窗口示意 6、SPSS数据的编辑 保证录入的数据准确无误,需要对SPSS数据进行修改、删除、插入、复制等操作。277、创建和读取SPSS数据文件1.直接通过SPSS数据编辑窗口定义变量输入数据(如前所述)2.通过打开不同格式的数据文件,间接创建SPSS数据文件。支持*.doc,*.xls,*.txt等288、保存SPSS数据 经读取、修改
8、后把SPSS窗口的数据以数据文件的形式保存到外部的储介质中。29308、保存SPSS数据 9、数据的编辑需要注意的问题p 截止目前,spss在接受excel文件时,只支持03版本一下的文件。p SPSS文件不支持其保存成word、excel形式的文本,其分析结果只能通过copy来实现。p 在Word与excel中的区别 Excel不支持copy object方式,直接使用copy就可以。3110、SPSS软件常用统计图 SPSS拥有强大的制图制表功能,通过图表可以直观、简单的了解数据的内在关系32条形图条形图线图线图33饼图饼图箱形图箱形图10、SPSS软件常用统计图散点图散点图3410、SPSS软件常用统计图目 录数据现状SPSS现状SPSS构成SPSS数据预处理35SPSS数据预处理缺失值的替补数据的标准化数据的抽样361、缺失值的替补372、数据的标准化383、数据的抽样39谢 谢