1、第第1 1章章 数据分析认知数据分析认知目录Contents数据分析概述数据分析思维与分析技术数据分析流程数据分析工具数据分析概述01PART知识目标:了解数据分析的相关概念;能力目标:掌握数据分析的作用;素质目标:培养数据思维、数据敏感性。知识导入知识导入如何成为一名优秀的数据分析师?如何成为一名优秀的数据分析师?这是一个用数据说话的时代,也是一个依靠数据竞争的时代。目前世界500强企业中,有90%以上都建立了数据分析部门。IBM、微软、Google等知名公司都积极投资数据业务,建立数据部门,培养数据分析团队,这也使数据分析师成为当前最炙手可热的职业之一。数据分析师,是指在不同行业和企业中,
2、专门从事数据搜集、整理、分析,并依据数据做出研究、评估和预测,能够为企业创造价值的专业数据分析人员。要成为一名优秀的数据分析师,必须具备以下重要技能:u懂业务懂业务u懂管理懂管理u懂分析懂分析u懂工具懂工具u懂写作懂写作从现在开始,我们来带领大家一起踏上数据分析师的成长之路!从现在开始,我们来带领大家一起踏上数据分析师的成长之路!数据分析技术相关概念数据分析技术相关概念 数据分析的数据分析的“数据数据”是人们通过观察、实验或计算得出的结果是人们通过观察、实验或计算得出的结果。数据和信息是不可分离的,数据是信息的表现形式和载体,信息是数据的内涵。数据本身没有意义,需要利用数据分析技术来获取数据中
3、所包含的有价值信息。定性数据定量数据也称分类数据。它是一种非数值型的数据,一般表现为几种有限的类别。即为数值型数据,它是按照一定的测量单位对事物量化的结果 如果数据分析所用到的数据只有一个固定的值,那么分析是没有意义的。我们通常需要分析的是一组变化的数据,例如企业各年度的营业收入、班上同学的身高,这些数据不是一成不变的,我们称之为变量变量。一般来说,变量与数据是一一对应的。定性数据的变量为分类变量u 有序分类变量:有序分类变量是可以进行比较的,如喜欢的程度;u 无序分类变量:变量值之间没有顺序差别的,仅作分类,不能进行比较或者比较是没有意义的定量数据对应的变量为数值变量u 离散型变量:变量值可
4、以按一定顺序一一列举,通常以整数位取值的变量u 连续型变量:在一定区间内可以任意取值的变量 总体总体是指我们根据分析目的而确定的分析对象所包含的所有个体的集合。例如分析某工厂刚生产的一批零件的合格率,那么这批零件就构成一个总体,其中的每一个零件就是该总体中的一个个体。一般来说,总体具有同质性、大同质性、大量性量性和差异性差异性三个特点。总体 利用一些特定的方法从总体中抽取部分个体组成样本进行研究,并根据样本结果推断总体的情况。样本样本中包含的个体数量又称为样本容量。样本是总体样本是总体的代表的代表,我们对样本进行研究的主要目的是通过分析样本的结果去推断总体的情况。样本数据分析是指为了提取有用信
5、息和形成结论而采用适当的统计分析技术对收集来的大量数据加以详细研究和概括总结的过程。理解数据分析的概念可以从以下三个方面来把握:u数据分析的目的。u数据分析技术的选择。u对结果的解读。数据分析的作用数据分析的作用创造价值提高科学性了解企业企业管理者能够更加全面客观地了解企业自身情况。在“大智移云物”等新兴技术的支撑下,企业能够较为全面的收集企业各个方面的数据,并对其进行深入的研究分析,全方位地反映企业的真实运营情况。提高管理者决策的科学性。数据分析能对相关数据资料有针对性的研究与分析,挖掘数据其本质的内涵。管理者通过对数据分析结果的认知和把握,能够更加客观地制定相关的企业决策和发展的计划,实现
6、更为科学的管理。企业可以利用数据分析发现人们思维上的盲点,进而发现新业务机会,开拓新领域,开发新业务。对海量数据分析可以预测行业未来。在数据价值的基础上形成新的商业模式,创造新价值。数据分析思维与分析技术02PART知识目标:了解各种数据分析技术;能力目标:掌握各种数据分析思维;素质目标:培养数据思维、数据敏感性。010203数据分析最基本、最常用的思维方式。单独看一个数据可能不会有太大感觉,然而和另外一个数据对比起来就会有感觉。一种将研究对象进行科学的分解,使其本质属性和发展规律从复杂现象中暴露出来,理清研究思路,抓住主要矛盾,获得新思路或新成果的思维方法。面对工作任务或难题时能从多个侧面进
7、行思考,深刻分析导致问题出现的原因,系统制定行动方案,采取恰当手段使工作得以高效率开展,取得高绩效。05一种运动的、调整性的、不断择优化的思维活动。根据不断变化的环境、条件来改变思维程序、思维方向,对事物进行调整控制,达到优化的思维目标。04根据已知的科学原理和一定的事实材料对事物存在的原因、普遍规律或因果性做出推测性分析的思维方法。数据分析思维数据分析思维数据分析技术数据分析技术描述性统计集中性主要是通过平均数、中位数、众数等统计指标离散性可以通过方差、标准差等统计量来反映相关与回归确定两个或多个变量之间是否具有相关性以及相关程度大小假设检验时间序列分析随机变量间相互依赖的定量关系:自变量个
8、数,分为一元回归和多元回归;自变量与因变量之间的关系,分为线性回归和非线性回归方差分析又称“变异数分析”,主要用于两个及两个以上样本均数差别的显著性检验常用的假设检验方法有u-检验法t检验法、X2检验法(卡方检验)、F-检验法等12345按时间先后排列而成的一组数字序列,应用数理统计的方法加以整理、分析,以对未来事物的发展做出预测的过程数据分析流程03PART知识目标:了解数据分析流程;能力目标:掌握数据分析各流程内涵;素质目标:培养数据分析素养。分析目标数据收集数据预处理数据分析结果展现撰写报告了解数据分析的内容以及客户的需求明确分析的目的制定客户需求分析表编制数据分析方案数据作为数据分析的
9、基础,数据的质量决定了分析结果的可靠性。一般来说,数据收集的方法包括观察法、访谈法、问卷调查法和数据库获取法。数据预处理:数据数量是否满足分析的最低要求是否存在缺失值明显错误的数据进行计量单位转换等等根据分析目标,选择适当的分析技术和分析工具对预处理过的数据进行分析,得出结果的过程。为了使数据分析结果更加直观,便于理解,一般情况下,数据分析的结果主要是通过统计表和统计图来呈现。撰写分析报告主要是把分析的目的、分析的思路、分析的方法以及分析的结果通过文字、表格、图形等方式呈现,以方便需求者的使用和阅读。数据分析流程数据分析流程数据分析工具04PART知识目标:了解数据分析常用工具;能力目标:掌握Excel、spss软件的优缺点;素质目标:培养数据分析素养。数据分析工具数据分析工具 当前的数据分析软件市场百花齐放,其中最引人瞩目的五大数据分析软件分别Excel、SPSS、SAS、R和Python。这五大分析软件有各自的优缺点,适用于不同的数据样本。Excel软件主要功能SPSS软件界面
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。