1、菜鸟学习数据分析教程2023-5-12主 要 内 容1.1.分析分析那些事儿那些事儿2.2.方法方法结构为王结构为王成长之路成长之路3.3.数据数据搜集导入搜集导入4.处理清洗加工5.5.分析分析方法工具方法工具6.6.呈现呈现制表画图制表画图菜菜鸟鸟第一章、数据分析那些事一、数据分析是什么?(1)数据分析为何物?简述:收集数据-适当方法-提炼信息-描述现象发现规律预测未来,帮助判断、决策。(2)数据分析的作用?简述:现状分析、原因分析、预测分析。二、数据分析六部曲?先决条件 提供方向明确目的 数据库 其他媒介数据收集 清洗、转化、提取、计算数据处理 统计分析 数据挖掘数据分析 图表表格文字数
2、据展现 框架清晰 明确结论 提出建议报告撰写一般数据分析用一般数据分析用ExcelExcel可以完成,若高级数据分析,则需要使用数据分析工具,如可以完成,若高级数据分析,则需要使用数据分析工具,如SPSSSPSS Statistics、SAS等。第一章、数据分析那些事三、数据分析的三大误区?(1)分析目的不明确,为了分析而分析(结果:自己玩!)故:分析一定要结合业务实际问题,有目的的展开。(2)缺乏业务知识,分析结果偏离实际(结果:遭鄙视!)故:弄清业务逻辑,懂点营销和管理等理论。(3)一味追求高级方法,热衷研究模型(结果:削脚适履!)故:能简单处理的,不选复杂方法;不管是白猫还是黑猫,只要能
3、抓老鼠就是好猫”四、数据分析师的职业发展?(1)前景如何?展望未来:1.数据矿山越积越多;2.社会越发达,人们对数据越依赖;3.数据分析越发受管理层重视。管理大师彼得.德鲁克:“如果不能衡量,就无法管理”(2)职业要求?五“懂”:业务+管理+分析+工具+设计(3)基本素质?态度严谨负责,好奇心强烈,逻辑思维清晰,擅长模仿,勇于创新!,1.1.分析分析那些事儿那些事儿2.2.方法方法结构为王结构为王成长之路成长之路3.3.数据数据搜集导入搜集导入4.处理清洗加工5.5.分析分析方法工具方法工具6.6.呈现呈现制表画图制表画图第二章、结构为王思路方法第二章、结构为王思路方法一、数据分析的方法论是什
4、么?(1)数据分析的方法论?简述:论述分析的思路,指导数据分析者进行一次完整的数据分析。例如:我应该从哪几个方面展开分析?各方面包含什么内容和指标?(2)数据分析方法论与数据分析方法的区别?举例说明:一个是整体思路(类似宏观作战方案);一个是工具性解决办法(类似刺刀、冲锋枪、坦克、轰炸机等)。二、常用的方法论?7(2)逻辑树分析法(业务问题专题分析)逻辑树分析法是将一个已知问题当成树干,然后考虑这个问题和哪些问题有关。每想到一点,就给这个问题所在的树干加一个树枝,并标明树枝代表什么问题。逻辑树方法又称问题树、演绎树或分解树。第二章、结构为王思路方法要素化:把相同问题归纳总结成要素框架化:将各个
5、要素组成框架,遵守 不重不漏的原则关联化:框架内的各元素保持必要的相互关系,简单不孤立逻辑树适用遵循的原则缺点:缺点:涉及相关问题可能会有遗漏。例:利润分析例:利润分析利润增长缓慢收入收入成本成本其他其他客户少?质量变差?对手竞争?材料成本?人工成本?广告成本?避免办法:避免办法:头脑风暴/专家座谈等。(3)PEST分析法(主要用于行业分析)PEST是指对政治(Political)、经济(Economic)、技术(Technological)和社会(Social)这四类影响企业的主要外部环境因素进行分析。一般用于对宏观环境的分析,由于行业和企业自身的特点和经营方式,分析的具体内容可能会稍有差异
6、。经济环境政治环境社会环境技术环境包括一个国家的社会制度,执政党的性质、方针政策等。宏观指国家国民收入、国民生产总值及变化情况。微观指行业所在地区消费者的收入水平、消费偏好等。包括一个国家的或地区的居民受教育程度和文化水平、信仰风俗、价值观念等。技术环境除了要考察与企业所处领域直接相关的技术手段的发展变化外,还应了解:国家对科技开发的投资和支持重点、技术转移和技术商品化速度、专利及其保护情况、该领域发展动态和研究费用总额等。行业、企业第二章、结构为王思路方法(4)4P营销理论(公司整体经营状况)4P营销理论产生于20世纪60年代的美国,它随着营销组合理论的提出而出现。它将营销要素概括为四类:产
7、品(product)、价格(price)、渠道(place)、促销(promotion)。如果需要了解公司的整体运营情况,就可以采用4P营销理论进行分析指导。第二章、结构为王思路方法投入多少促销资源?效果如何?投放多少宣传广告?效果如何?例例 4P营销公司业务分析产品价格渠道促销公司销售收入怎样?增长还是减少?用户接受的合理价格是多少?用户购买支付方式怎样?公司在各地区有多少销售渠道?用户通过何种渠道购买?公司渠道政策是否具有吸引力?公司提供什么产品和服务?哪个销量好?与用户需求是否一致?购买产品的用户都是何人?(5)用户行为理论用户使用行为是指用户为获取、使用物品或服务所采用的各种行动,一般
8、按照以下过程:对产品有一个认知、熟悉的过程,然后试用,再决定是否继续消费使用,最后成为忠实用户。第二章、结构为王思路方法1.1.分析分析那些事儿那些事儿2.2.方法方法结构为王结构为王成长之路成长之路3.3.数据数据搜集导入搜集导入4.处理清洗加工5.5.分析分析方法工具方法工具6.6.呈现呈现制表画图制表画图第三章、数据收集导入第三章、数据收集导入一、数据类型(设置单元格格式)二、数据表类型(一维表和二维表)一维表特征:一条记录就看到完整的信息;一边有字段指标。二维表特征:需要纵横两个纬度看,才能得到完整的信息;两边有字段指标。(1)二维表变一维表?-数据透视向导(演示,见视频)(2)一维表
9、变二维表?-数据透视表(演示,见视频)第三章、数据搜集导入三、数据搜集导入(1)文本导入:满意度调查(演示)(2)网络:股票数据(演示)(3)调查数据:满意度调查问卷表设计(演示)1.1.分析分析那些事儿那些事儿2.2.方法方法结构为王结构为王成长之路成长之路3.3.数据数据搜集导入搜集导入4.处理清洗加工5.5.分析分析方法工具方法工具6.6.呈现呈现制表画图制表画图第四章、数据处理一、为啥要数据处理?(1)数据有多余、重复的、空白的(2)数据出错(不同于异常数据)(3)数据的组织格式或字段的再加工,得到适用于分析的内容格式。菜鸟总结:第四章、数据处理二、重复数据处理发现重复数据(1)使用C
10、OUNTIF函数(演示)重复次数COUNTIF(A:A,A2)第几次出现COUNTIF(A$2:A2,A2)(2)用菜单操作来筛选(演示)“数据”“排序与筛选”高级(3)使用条件格式(演示)“开始”“条件格式”“突出显示单元格规格”“重复值”(4)数据透视表(后边讲解)删除重复的数据(1)菜单-删除重复项(2)在发现的基础上,删除。第四章、数据处理三、缺失值处理(1 1)如何定位缺失值?)如何定位缺失值?编辑-查询和选择-定位条件Ctrl+G快捷键-定位条件Ctrl+F快捷键-查找Ctrl+H快捷键-替换(2 2)缺失值处理?)缺失值处理?模拟值(平均值、回归、插值、历史等)部分排除整条删除等
11、。Ctrl+Enter快捷键(小白举例)第四章、数据处理四、逻辑检查-逻辑函数逻辑函数逻辑函数第四章、数据处理五、加工数据1.字段分列(1)菜单法(演示)(2)函数法第四章、数据处理五、加工数据2.字段合并(1)“&”连接符 举例:10kg=10&kg(2)Concatenate(,)函数第四章、数据处理五、加工数据3.字段匹配举例:目的站,城市比对第四章、数据处理五、加工数据4.字段运算(1)简单 运算符“+”“-”“*”“/”()(2)常用函数Sum()、Average()、count()Today()、now()、datedif()DATEIF(start-date,end-date,u
12、nit)Unit有Y/M/D/MD/YM/YD六种格式 MD:为start-date,end-date日期中天数的差,忽略日期中的月和年 YM:为start-date,end-date日期中月数的差,忽略日期中的日和年 YD:为start-date,end-date日期中天数的差,忽略日期中的年第四章、数据处理入职日期入职日期2000-10-12000-10-1现在日期现在日期2011-11-72011-11-7工龄(年)工龄(年)4 4年年=DATEIF(B1,B2,=DATEIF(B1,B2,“Y”)&Y”)&“年年”工龄(年月)工龄(年月)4 4年年1 1月月=DATEIF(B1,B2,
13、=DATEIF(B1,B2,“Y Y”)&)&“年年”&DATEIF(B1,B2,”&DATEIF(B1,B2,“YMYM”)&)&“月月”)算工龄?算工龄?五、加工数据5.数据分组&数据表行列互换(1)数据分组举例:地区工资分组(2)行列互换 选择性粘贴第四章、数据处理第四章、数据处理错误值含义解决办法输入到单元格中的数据太长或单元格公式所产生的结果太大,使结果在单元格中显示不下。或是日期和时间格式的单元格做减法,出现了负值增加列的宽度,使结果能够完全显示。如果是由日期或时间相减产生了负值引起的,可以改变单元格的格式,比如改为文本格式,结果为负的时间量。DIV/0!试图除以0。这个错误的产生
14、通常有下面几种情况:除数为0、在公式中除数使用了空单元格或是包含零值单元格的单元格引用。修改单元格引用,或者在用作除数的单元格中输入不为零的值。VALUE!输入引用文本项的数学公式。如果使用了不正确的参数或运算符,或者当执行自动更正公式功能时不能更正公式,都将产生错误信息VALUE!。这时应确认公式或函数所需的运算符或参数正确,并且公式引用的单元格中包含有效的数值。例如,单元格C4中有一个数字或逻辑值,而单元格D4包含文本,则在计算公式=C4D4时,系统不能将文本转换为正确的数据类型,因而返回错误值VALUE!N/A 无信息可用于所要执行的计算。在建立模型时,用户可以在单元格中输入#N/A,以
15、表明正在等待数据。任何引用含有#N/A值的单元格都将返回#N/A。在等待数据的单元格内填充上数据。NAME?在公式中使用了Excel所不能识别的文本,比如可能是输错了名称,或是输入了一个已删除的名称,如果没有将文字串括在双引号中,也会产生此错误值如果是使用了不存在的名称而产生这类错误,应确认使用的名称确实存在;如果是名称,函数名拼写错误应就改正过来;将文字串括在双引号中;确认公式中使用的所有区域引用都使用了冒号(:)NUM!提供了无效的参数给工作表函数,或是公式的结果太大或太小而无法在工作表中表示。确认函数中使用的参数类型正确。NULL!在公式中的两个范围之间插入一个空格以表示交叉点,但这两个
16、范围没有公共单元格。比如输入:“=SUM(A1:A10 C1:C10)”,就会产生这种情况取消两个范围之间的空格。上式可改为“=SUM(A1:A10,C1:C10)”数据处理中,常出现的报错符号(补充部分)1.1.分析分析那些事儿那些事儿2.2.方法方法结构为王结构为王成长之路成长之路3.3.数据数据搜集导入搜集导入4.处理清洗加工5.5.分析分析方法工具方法工具6.6.呈现呈现制表画图制表画图第五章、数据分析方法工具方法方法说明说明举例举例对比分析法对比(目标与实际、不同时期对比、部门、单位、地区等)见P分组分析法分类标准(相似的归为一类,再对不同类别研究)地区收入水平结构分析法百分比市场占
17、有率平均分析法算数平均、调和平均、几何平均、众数与中位数(平均水平)平均工资交叉分析法常见的二维交叉表(便于观察对比)二维表综合评价分析法加强求和(涵盖信息全面,但意义模糊)上证指数杜邦分析法指标关系架构图(揭示盈利指标关系)见P漏斗分析法各环节转化概率网站转换率矩阵关联分析法两个关键纬度的指标度量方法见P高级分析方法方便以后检索学习见P第五章、数据分析方法工具菜鸟内容提纲一、对比分析法(1 1)定义)定义对比分析法是将两个或两个以上的数据进行比较,分析其中的差异,从而揭示这些事物所代表的发展变化情况和规律性。(2 2)特点)特点非常直观的看出事物某方面的变化或差距,而且可以准确、量化的表示出
18、变化的差距是多少。(3 3)分类)分类静态 在同一时间下,不同总体之间的比较,也叫横向比较。动态 在同一总体条件下对不同时期指标数值进行比较,也叫纵向比较。第五章、数据分析方法工具(4 4)注意事项)注意事项1.指标的口径范围、计算方法计量单位一致2.对比的对象要有可比性3.对比的指标类型必须一致。(5 5)常用例子)常用例子完成值目标1.与目标对比实际完成值与目标值进行对比,属于横比上个月本月2.不同时期对比选择不同时期的指标数值作为标准对比,属于纵比。同比、环比部门A部门B部门C部门D3.同级部门、单位、地区对比4.行业内对比对比找出自身发展方向,属于横比活动前活动后5.活动效果对比比较营
19、销活动前后效果对比,属于纵比第五章、数据分析方法工具二、分组分析法第五章、数据分析方法工具(1 1)定义)定义根据数据分析对象的特征,按照一定的指标,把数据分析对象划分为不同的部分和类型来进行比较研究。(2 2)目的)目的把总体中具有不同性质的对象区分开,把性质相同的对象合并在一起便于对比。分组分析一般都与对比分析结合使用。(3 3)步骤)步骤 1.确定组数 2.确定各组组距 组距组距=(最大值(最大值-最小值)最小值)/组数组数 3.根据组距大小,对数据进行分析整理,划归到相应组内。三、结构分析法第五章、数据分析方法工具(1 1)定义)定义运用计算平均数的方法来反映总体在一定时间、地点、条件
20、下某一数量特征的一般水平。(2 2)公式)公式结构相对指标(比例)结构相对指标(比例)=总体某部分的数值总体某部分的数值/总体总量总体总量*100%100%(3 3)典例)典例市场占有率=(某商品销售量/该种商品市场销售总量)*100%四、平均分析法第五章、数据分析方法工具(1 1)定义)定义根据数据分析对象的特征,按照一定的指标,把数据分析对象划分为不同的部分和类型来进行比较研究。(2 2)目的)目的1.利用平均指标对比同类现象在不同地区、不同行业之间的差异程度,比用总量指标更具说服力。2.利用平均指标对比某些现象在不同历史时期的变化,更能说明其发展趋势和规律。(3 3)公式)公式算术平均数
21、算术平均数=总体各单位数值的总和总体各单位数值的总和/总体单位个数总体单位个数 五、交叉分析法定义:定义:同时将两个有一定联系的变量及其值交叉排列在一张表内,使各变量值成为不同变量的交叉结点,一般用二维交叉表分析法。第五章、数据分析方法工具六、综合评价分析法第五章、数据分析方法工具(1 1)定义:)定义:将多个指标转化为一个能够反映综合情况的指标来进行分析评价,用于解决复杂的分析对象。(2 2)步骤)步骤1.确定综合评价指标体系2.搜集数据,并对不同计量单位的指标数据进行标准化处理3.确定指标体系中各指标的权重,保证评价的科学性4.对经处理后的指标进行汇总计算出综合评价指数5.根据评价指数对参
22、评单位排序,并得出结论(3 3)公式)公式1.评价过程不是逐个顺次完成,而是将多个指标评价同时完成2.在过程中,要根据指标重要性进行加权处理3.评价结果 不是含有具体意义的统计指标,而是以指数表示参评单位综合状况的排序。全部成本净资产收益率净资产收益率总资产收益率总资产收益率权益乘数权益乘数主要营业利润率总资产周转率净利润主营业务收入主营业务收入其他利润所得税营业成本主营业务收入资产总额流动资产长期资产第五章、数据分析方法工具七、杜邦分析法(1 1)定义:利用各主要财务指标间的内在联系,对企业财务状况及经济效益进行综合分析评价的方)定义:利用各主要财务指标间的内在联系,对企业财务状况及经济效益
23、进行综合分析评价的方法。法。八、漏斗图分析法定义:定义:漏斗图是一个适合业务流程比较规范、周期比较长、各环节流程涉及复杂业务比较多的分析。第五章、数据分析方法工具九、矩阵关联分析法第五章、数据分析方法工具(1 1)定义:)定义:将事物(产品、服务等)的两个重要属性(指标)作为分析的依据,进行关联分析,并找出解决问题的办法。(2 2)方法:)方法:以属性A为横轴,属性B为纵轴,按某一标准进行划分,构成四个象限,将要分析的事物对应投射到四个象限内。满意度重要性低高高高度关注区高度关注区优先改进区优先改进区无关紧要区无关紧要区维持优势区维持优势区(3 3)例子:满意度)例子:满意度*重要性重要性-改
24、进矩阵改进矩阵满意度重要性低高高ABCD(4 4)满意度)满意度*重要性重要性发展矩阵发展矩阵-增加增加“时间”纬度右图右图-某公司3年来用户对公司各指标满意情况变化。满意度重要性低高高AEBCDFGHIJ第五章、数据分析方法工具(5 5)满意度)满意度*重要性重要性改进难易矩阵改进难易矩阵-增加增加“改进难易程度”纬度左图左图-泡大代表改进难度大;气泡小代表改进难度小。第五章、数据分析方法工具十、进一步研究和学习第五章、数据分析方法工具分析工具-数据透视表(1)何为数据透视表?-数据透视表就是一个不破坏源数据的、操作灵活的、功能强大的分类汇总,透视表就是分类汇总功能的进一步的延伸。-数据透视
25、表是一种对大量数据快速汇总和建立交叉列表的交互式表格。它不仅可以转换行和列以查看源数据的不同汇总结果,还可以显示不同页面以筛选数据。(2)如何创建数据透视表?大致可分为两步:第一步是选择数据来源;第二步是设置数据透视表的布局-演示(3)数据透视表界面?第五章、数据分析方法工具(4)设置数据透视表选项 在“数据透视表工具”的“选项”选项卡中还可以设置其他常用数据透视表选项。(5)设计数据透视表 在“数据透视表工具”的“设计”选项卡中,可以设置数据透视表的布局、样式以及样式选项等,帮助用户设计所需的数据透视表第六章、分析结果展现表达形象化表达形象化一二三突出重点突出重点体现专业化体现专业化优点第六
26、章、分析结果展现一、用图表说话(1)图表优点(2)常用图表第六章、分析结果展现(3)菜鸟经验和制图步骤第六章、分析结果展现第六章、分析结果展现二、制表(1)突出显示单元格(客户交易活跃度表)(客户交易活跃度表)(2)项目选取(客户交易活跃度表)(客户交易活跃度表)第六章、分析结果展现二、制表(3)数据条(客户交易活跃度表)(客户交易活跃度表)(4)图标集(客户交易活跃度表)(客户交易活跃度表)(5)迷你图(客户交易活跃度表)(客户交易活跃度表)第六章、分析结果展现二、制图(1)平均线(工资表)(工资表)(2)双座标图(客户发货表)(客户发货表)第六章、分析结果展现二、制图(3)瀑布图(模拟表)(模拟表)第六章、分析结果展现二、制图(4)帕累托图(模拟表)(模拟表)第六章、分析结果展现二、制图(5)对称条形图(模拟表)(模拟表)第六章、分析结果展现二、制图(6)漏斗图(模拟表)(模拟表)第六章、分析结果展现二、制图(7)矩阵图(模拟表)(模拟表)第六章、分析结果展现四、编写报告对于分析报告而言,对于分析报告而言,需要需要画龙点睛画龙点睛的指的指出报告的出报告的结论以及结论以及的建议的建议!第七章、创造价值谢谢观看谢谢观看