1、谁说菜鸟不会数据分析?培训 2016.04目录A、数据分析哪些事儿B、数据处理C、数据分析D、数据展现E、报告撰写A、数据分析哪些事儿 数据分析是“神马” 数据分析六部曲 常用指标或术语数据分析是“神马” 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总、理解并消化,以求最大化地开发数据的功能,发挥数据的作用。A、数据分析哪些事儿 数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。菜鸟与数据分析师的区别菜鸟会想分析师会想这张曲线图真好看,怎么做的?数据变化的背后真相是什么?这些数据可以做什么样的分析?从哪些角度分析数据才系统?高级分析的方法在这
2、儿能用吗?用什么分析方法最有效?要做多少张图表?图表是否表达出有效的观点?除了为数据添加文字说明还需说什么?数据分析的目的达到了吗?数据分析报告要写多少页?数据分析报告有说服力吗?A、数据分析哪些事儿他们主要的区别就在于目的是否明确数据分析师的基本素质态度严谨负责好奇心强烈逻辑思维清晰擅长模仿勇于创新 不论说话还是写文章,都要有条理,有目的,不可眉毛胡子一把抓,不分主次。 模仿主要是参考他人优秀的分析思路和方法。但不能:一直在模仿,从未超越过。A、数据分析哪些事儿数据分析六步曲一般数据分析用Excel可以完成,若高级数据分析,则需要使用数据分析工具,如SPSS Statistics等。A、数据
3、分析哪些事儿倍数一般是表示数量的增长或上升幅度,而不适用平均数绝对数与相对数百分比与百分点频数与频率比例与比率倍数与番数同比与环比A、数据分析哪些事儿常用指标或术语B、数据处理初识EXCEL & 数据准备数据处理方式和技巧数据处理原则数据清洗常用数据处理公式初识EXCELB、数据处理 做数据分析讲究的是原则、思考方法和解决方案,任何软件都只是一种工具,我们只要掌握并精通一种工具不足够了。这比什么软件都只懂但都只是略懂皮毛要好很多。本培训所涉及内容,均以Excel 2010为例。数据准备:对数据表的要求B、数据处理序号序号要求要求1数据表由标明行和数据部分组成2第一行是表的列标题(字段名),列标
4、题不能重复3第二行起是数据部分,数据部分的每一行数据称为一个记录,并且数据部分不允许出现空白行和空白列4数据表中不能有合并单元桥存在5数据表与其他数据之间应该留出至少一个空白行和一个空白列6数据表需要以一维的形式存储,但是在实际操作中接触的数据往往是以二维表格的形式存在的,此时应将二维表转化为一维表的形式储存数据。7数据部分每一列的数据项,内容、格式统一。函数函数是指定的数据按照一定的规则转化为需要的结果,规则也就是我们所用到的公式。图表图表的主要目的是为了表现数据、传递信息。宏宏是一个指令集,用来告诉Excel完成用户指定的动作。宏类似于计算机程序,但它是完全运行于Excel中的。B、数据处
5、理数据准备数据处理方式和技巧数据处理方式和技巧F2编辑单元格填充柄Ctrl+D+007,变成007的有效输入。快速设置单元格格式:Ctrl+11/3的输入,0+空格+1/3B、数据处理数据错误识别错误符号错误原因#DIV/0!除数为0#N/A函数或公式中没有可用的数值#NAME?在公式中使用了不能识别的文本#NULL!使用了不正确的区域运算符或引用的单元格区域的交集为空#NUM!公式或函数中某些数字有问题#REF!单元格引用无效#VALUE!在公式中使用了错误的数据类型B、数据处理数据处理方式和技巧数据处理原则B、数据处理“三心二意”处理数据信心 什么是信心? 信心是指未看见任何未来时,你依然
6、 怀抱希望,坚持下去。细心 1%的错误=100%的失败平常心诚意合老板意 第一,老板永远是对的; 第二,如果老板错了,请参考第一条。数据清洗冻结窗格自动筛选快速隐藏Ctrl+箭头键F4的妙用,绝对引用和相对引用重复数据处理重复数据处理1、使用COUNTIF函数重复次数COUNTIF(A:A,A2)第几次出现COUNTIF(A$2:A2,A2)B、数据处理2、用菜单操作来筛选“数据”“排序与筛选” 高级3、使用条件格式“开始”“条件格式”“突出显示单元格规格”“重复值”B、数据处理常用数据处理公式或技巧查找和替换通配符 * ?IF函数AND和OR数据统计B、数据处理数据抽取抽取函数字段合并字段匹
7、配数据计算求和,平均值最大最小值B、数据处理常用数据处理公式或技巧常用数据处理公式或技巧日期的相关处理1、快速录入当前日期TODAY( )NOW( )2、单纯日数加减简单情况如A1中录入“2011-1-1”,B1中录入“A1+5”,结果:“2011-1-6”复杂情况A2“2011-1-1”,DATE(YEAR(A2)+3,MONTH(A2)+1,DAY(A2)+5)结果:2014-2-6B、数据处理常用数据处理公式或技巧3、利用函数DATEIF计算工龄DATEIF( start-date,end-date,unit)Unit有Y/M/D/MD/YM/YD六种格式 MD:为start-date,
8、end-date日期中天数的差,忽略日期中的月和年 YM:为start-date,end-date日期中月数的差,忽略日期中的日和年 YD:为start-date,end-date日期中天数的差,忽略日期中的年入职日期2007-10-1现在日期2011-11-7工龄(年)4年=DATEIF(B1,B2,“Y”)&“年”工龄(年月) 4年1月=DATEIF(B1,B2,“Y”)&“年”&DATEIF(B1,B2,“YM”)&“月”)B、数据处理C、数据分析 数据分析方法论 数据分析方法 数据分析工具C、数据分析C、数据分析数据分析方法论主要用来指导数据分析师进行一个完整的数据分析,它更多的是指数
9、据分析思路。方法论说明使用范围PESTPolitical, Economic, Social, Technological行业分析,统称外部环境4PProduct, Price, Place(渠道), Promotion公司整体经营情况分析逻辑树将问题分层罗列,逐步向下展开业务问题专题分析用户使用行为认知熟悉试用使用忠诚用户行为研究5W2HWhy, What, Who, When, WhereHow, How much用途广泛数据分析方法论数据分析方法5W2H分析法在职场中,有很多人逻辑思路很清晰,但是也有些人说话老是抓不住重点,费口舌讲了半天,大家还是听不懂他在说什么,这种人就是缺乏逻辑训练
10、。在所有逻辑思考方法中,5W2H分析法可以说是最容易学习 操作的方法之一。用户购买行为分析Why用户购买的目的是什么?产品在哪 方面吸引用户?What公司提供什么产品或服务?与用户需求是否一致?Who谁是我们的用户?用户有何特点?When何时购买?多久再次购买?Where用户在哪购买?用户在各个地区 构成怎样?How用户购买支付方式是怎样?How much用户购买花费时间、交通等成本各是多少?C、数据分析逻辑树分析法把一个已知问题当成树干,然后考虑这个问题和哪些问题有关。每想到一点,就给这个问题所在的树干加一个“树枝”,并标明这个“树枝”代表什么问题。C、数据分析问题陈述问题一用户购买的目的是
11、什么?产品在哪 方面吸引用户?问题二公司提供什么产品或服务?与用户需求是否一致?问题三谁是我们的用户?用户有何特点?问题四何时购买?多久再次购买?数据分析简单方法方法说明对比分析法与目标对比;不同时期对比;同级部门、单位、地区对比;行业内对比;活动前后效果对比分组分析法分组的目的在于便于对比,分组法必须与对比法结合起来结构分析法某部分数值占总体的比率,如市场占有率平均分析法算数平均、调和平均、几何平均、众数与中位数交叉分析法常见的二维交叉表C、数据分析数据分析综合方法 综合评价分析法1、确定评价的指标2、对指标数据进行标准化处理3、确定各指标权重4、汇总计算出综合评价分值5、根据分值排序,得出
12、结论数据标准化标准值=(原始值-min)/(max-min)权重确定方法目标优化矩阵纵向指标比横向重要时,输入1,否则为0C、数据分析杜邦分析法又称杜邦财务分析体系,可对财务状况进行综合分析评价,也可用于其他分析。C、数据分析漏斗分析法100%40%30%20%17%浏览商品40%放入购物车75%生成订单67%支付订单85%完成交易C、数据分析高级数据分析法根据分析三大误区1、分析目的不明确,为分析而分析2、缺乏业务知识,分析结果偏离实际3、一味追求使用高级分析方法,热衷研究模型C、数据分析数据分析工具数据透视表C、数据分析D、数据展现 图表 常用图表类型与作用 图表制作五步法 常用表格&图表
13、展示数据展现图表原则:让老板在30秒种内读懂你的数据D、数据展现图表的作用表达形象化突出重点体现专业化你这是要我在蚂蚁里面挑芝麻吗?常用图表类型与作用要表达的数据和信息饼图柱形图条形图拆线图气泡图其它成分(整体的一部分)排序(数据的比较)时间序列(走势、趋势)频率分布(数据频次)相关性(数据的关系)多重数据比较D、数据展现图表制作五步法D、数据展现确定所要表达的主题或目的确定哪种图表最适合你的目的选择数据制作图表检查是否真实有效地展示数据检查是否表达了你的观点15432了解自己的气质和特点确定哪款衣服最能展示你的特点试穿衣服检查是否合身照照镜子看是否突出自己的个性15432常用表格&图表展示让
14、图表“五脏俱全”2010年年XX公司产品销售情况公司产品销售情况(单位:百万元)*第三季度品牌A的产品包装发现有毒物质*资料来源:XX调研公司注脚:便于读者理解资料来源:增强数据可信度D、数据展现数据条&图标集D、数据展现迷你图D、数据展现饼图制作原则一些简单的原则:1.尽量不要用3D效果,如果要用尽量薄一些2.饼图的结构中,最多包含5种数据3.标注写在图中,不要标记在一边4.边界线使用白色,突出边缘感5.让数据从12点钟的位置开始排列,最重要的成分紧靠12点钟的位置D、数据展现复合饼图Q4签约店面61%未签约店面10%店面死亡(FY11)26%建店完成1%建设中0%申请通过1%审图通过1%审
15、图修改0%新建店面3%全国整体店面分类Q4签约店面, 1256未签约店面, 197店面死亡(FY11), 533建店完成, 21建设中, 3申请通过, 24审图通过, 26审图修改, 5新建店面 79全国整体店面分类复合饼图可以将分类数据中所占比例较小的分类合并成“其他”项,使图表反映的数据更能突出重点。D、数据展现柱形图数据对比分析时经常用到一些简单的原则:一些简单的原则:1.1.同一数据序列使用相同的颜色;同一数据序列使用相同的颜色;2.2.不要使用倾斜的标签,别让读者歪着脑袋看不要使用倾斜的标签,别让读者歪着脑袋看3.3.纵坐标轴一般刻度从纵坐标轴一般刻度从0 0开开始始02040608
16、0100120湖南广东江西晋蒙京津冀安徽陕西广西福建FY11建设完成情况FY11完成数量6710156699252553451湖南广东江西晋蒙 京津冀 安徽陕西广西福建FY11店面建设完成数量D、数据展现修剪超大值为了便于看到其它分类的情况,而针对某一超大值进行修改。D、数据展现73446505101520253035404550建店完成建设中申请通过审图通过审图修改FY11Q4店面建设状态店面建设状态734465建店完成建设中申请通过审图通过审图修改FY11Q4店面建设状态店面建设状态条形图-横坐标轴的标签文字过长时,可以采用条形图来代替柱型图D、数据展现一些简单的原则:一些简单的原则:1.
17、1.同一数据序列使用相同的颜色;同一数据序列使用相同的颜色;2.2.尽量让数据从大到小排序,方便阅读尽量让数据从大到小排序,方便阅读3.3.不要使用倾斜的标签不要使用倾斜的标签4.4.最好添加数据标签置最好添加数据标签置050100150广西福建安徽陕西江西湖南晋蒙京津冀广东FY11店面建设完成数量FY11完成数量3451525556676992101广西福建安徽陕西江西湖南晋蒙京津冀广东FY11店面建设完成数量拆线图D、数据展现一些简单的原则:1.拆线选用的线形要相对粗些,最好比网格线、坐标轴等要突出;2.线条一般不超过5条;3.不要使用倾斜的标签4.纵坐标轴一般刻度从0开始02040608
18、0100120广西福建安徽陕西江西湖南晋蒙京津冀广东FY11完成数量FY11完成数量3451525556676992101020406080100120广西福建安徽陕西江西湖南晋蒙 京津冀 广东FY11完成数量平均线图D、数据展现10194929088696765636256 565552 51493734 3432262318020406080100120广东江苏京津冀四川山东晋蒙湖南浙江湖北云贵河南江西陕西安徽福建黑吉辽宁甘青宁广西深圳重庆新疆上海全国店面建设情况Total平均值全国平均建设57家店面双坐标图D、数据展现67101566992525534511888905623633494
19、6562372632490%50%100%150%200%250%020406080100120湖南广东江西晋蒙京津冀安徽陕西广西福建上海山东四川河南新疆湖北甘青宁江苏浙江云贵辽宁重庆深圳黑吉FY11全国建设完成情况FY11完成FY11完成率双坐标图制作帕累托图绘制双坐标图,并将折线图起始坐标改为C21、布局坐标轴次要横坐标轴显示从左到右坐标轴2、选中横坐标,设置调整柱体间距D、数据展现用占位的方法制作瀑布图项目占位数成本总成本0500成本A300200成本B200100成本C50150成本D050堆积柱形图选择蓝色柱体,选择无填充,无边框D、数据展现旋风图成对条形图/对称条形图用于两组数据对
20、比1、制作条形双坐标图2、上下横坐标,都设置为最大100,最小-1003、不显示负数:在“坐标轴选项”“数字”“格式代码”中输入“0;0;0”或“0.0;0.0;0.0”或“0%;0%;0%”4、翻转:“坐标轴选项”,选择逆序刻度1、设置上方横坐标:主次刻度类型,坐标轴标签均选无2、设置纵坐标:主次刻度类型选无,坐标轴标签选低D、数据展现图表会说谎虚张声势的增长3D效果的作用顺序排列的误导一维图形的障眼法时间原因,不讲了D、数据展现图表美化三原则简约整洁对比D、数据展现E、专业的报告数据分析报告的种类1. 专题分析报告2. 综合分析报告3. 日常数据通报再次强调,对于分析报告而言,需要画龙再次
21、强调,对于分析报告而言,需要画龙点睛的指出报告的结论以及的建议点睛的指出报告的结论以及的建议数据分析报告是根据数据分析原理和方法,运用数据来反映、研究和分析某项事物的现状、问题、原因、本质和规律,并得出结论,提出解决问题办法的一种分析应用文体。E、专业的报告规范性原则重要性原则谨慎性原则创新性原则数据分析报告E、专业的报告作用作用种类种类展示分析结果专题分析报告验证分析质量综合分析报告提供决策依据日常数据通报数据分析报告的结构标题页目录页前方正文结论与建议附录E、专业的报告结构合理,逻辑清晰实事求是,反映真相用词准确,避免含糊篇幅适宜,简洁有效结合业务,分析合理注意事项提升工具框架构建工具-Mind Manager数据处理工具-UltraEdit数据分析工具-SPSS Statistics数据挖掘工具-SPSS Modeler展现类工具报告撰写工具-PowerPoint图表制作工具-Swiff Chart图表制作工作-Crystal XcelsiusE、专业的报告Thanks for your time!