1、数据分析分享数据分析分享 20192019年年3 3月月内容提纲一、数据分析那些事儿二、数据准备三、数据处理四、数据分析五、数据展现六、撰写报告p数据分析是什么p数据分析常见步骤p常用的指标&术语一、数据分析那些事儿数据分析是什么p 数据分析为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。数据分析数据分析描述性描述性探索性探索性验证性验证性初级数据分析初级数据分析对比分析法对比分析法平均分析法平均分析法交叉分析法交叉分析法高级数据分析高级数据分析相关分析相关分析因子分析因子分析回归分析回归分析菜鸟与老鸟的区别菜鸟会想菜鸟会想老鸟会想老鸟会想这张曲线图真好看,怎么做的?这张曲线图
2、真好看,怎么做的?数据变化的背后真相是什么?数据变化的背后真相是什么?这些数据可以做什么样的分析?这些数据可以做什么样的分析?从哪些角度分析数据才系统?从哪些角度分析数据才系统?高级分析的方法在这儿能用吗?高级分析的方法在这儿能用吗?用什么分析方法最有效?用什么分析方法最有效?要做多少张图表?要做多少张图表?图表是否表达出有效的观点?图表是否表达出有效的观点?除了为数据添加文字说明还需说什除了为数据添加文字说明还需说什么?么?数据分析的目的达到了吗?数据分析的目的达到了吗?数据分析报告要写多少页?数据分析报告要写多少页?数据分析报告有说服力吗?数据分析报告有说服力吗?数据分析常见步骤 先决条件
3、 提供方向明确目的明确目的 数据库 其他媒介数据收集数据收集 清洗、转化、提取、计算数据处理数据处理 统计分析 数据挖掘数据分析数据分析 图表表格文字数据展现数据展现 框架清晰 明确结论 提出建议报告撰写报告撰写p一般数据分析用Excel可以完成p若高级数据分析,则需要使用数据分析工具,如SPSS、SAS等数据分析的目标与要求p为什么要开展数据分析p数据分析反映什么现状p数据分析解决什么问题p希冀达到的效果和目的p常用的指标&术语p 平均数与中位数p 绝对数与相对数p 百分比与百分点p 频数与频率p 比例与比率p 倍数与番数p 同比与环比二、数据准备p忌用合并单元格 被合并的单元格给后续的数据
4、处理、分析带来 很多的麻烦p导入外部数据p数据类型 字符型数据、数值型数据p尽可能少动原始数据 数据组织要规范,原始数据就应该是一维表p单元格了解 主要了解单元格周围的小图标 鼠标放在单元格边框上可以拖动单元格,放在右下角可以向上/下或者左/右复制单元格,放右下角按住CTRL可以实现数值累加,放在右下角按住SHIFT可以插入、删除单元格。数据录入技巧p数据录入 批量录入相同数据(ctrl+enter)身份证号码输入(设置单元格属性为“文本”或者前面加 )分数输入(直接输1/3EXCEL默认为1月3日,应该写成0空格1/3)单元格里回车(alt+enter)查找*和?(+*,+?)数据录入技巧p
5、查找 模糊查找按CTRL+F进入查找,在查找里直接输查找内容为模糊查找。精确查找在查找里点开选项,将单元格匹配的勾打上为精确查找 值查找在查找里点开选项,查找范围选择值为值查找。(如果单元格里是公式那必须用值查找)数据录入技巧EXCEL快捷键操作打开工作簿Ctrl+O保存工作簿Ctrl+S增加一个新的工作薄Ctrl+N关闭当前工作薄Ctrl+W切换到上一个工作簿窗口Ctrl+Tab(F6)切换到下一个工作簿窗口Ctrl+Shift+Tab(F6)向后切换工作表Ctrl+PageDown向前切换工作表Ctrl+PageUpp工作簿操作EXCEL快捷键操作p基本操作撤销上步操作Ctrl+Z恢复上步
6、操作Ctrl+Y重复上步操作F4剪切Ctrl+X复制Ctrl+C粘贴Ctrl+V查找Ctrl+F替换Ctrl+H定位Ctrl+G F5插入批注Shift+F2打开“插入函数”对话框Shift+F3定义名称Ctrl+F3EXCEL快捷键操作p单元格操作1对字体进行加粗或取消加粗Ctrl+B对字体进行倾斜或取消倾斜Ctrl+I对字体加下划线或取消下划线Ctrl+U打开“单元格格式”对话框Ctrl+1设置单元格为“常规”数字格式Ctrl+Shift+设置单元格为两位小数的货币格式Ctrl+Shift+$设置单元格为不带小数的百分比格式Ctrl+Shift+设置单元格为两位小数的科学计数格式Ctrl+
7、Shift+设置单元格为含有年月日的日期格式Ctrl+Shift+#设置单元格为含有小时分钟以及上下午的时间格式Ctrl+Shift+设置单元格为两位小数且有千位分隔符的数字格式Ctrl+Shift+!EXCEL快捷键操作p单元格操作2快速到达列头或尾Ctrl+或快速到达行头或尾Ctrl+或列的单元格快速选取Ctrl+Shift+或行的单元格快速选取Ctrl+Shift+或快速到达左上角单元格Ctrl+HOME快速到达右下角单元格Ctrl+END选取左上角到当前单元格Ctrl+Shift+HOME选取当前单元格到右下角Ctrl+Shift+END自动求和Alt+=隐藏列Ctrl+0隐藏行Ctr
8、l+9EXCEL快捷键操作p输入操作相对引用与绝对引用转换F4输入当前日期Ctrl+;输入当前时间Ctrl+Shift+:向下填充输入Ctrl+D向右填充输入Ctrl+R单元格多个单元格输入相同数据(注:需要同时选中需要输入数据的单元格)Ctrl+enter插入超链接Ctrl+Kp数据清洗 数据清洗就是将多余、重复的数据筛选清除,将缺失的数据补充完整,将错误的数据纠正或删除。p数据加工 对原有字段进行抽取、计算或者转换,形成我们需要的新数据列。p 数据抽样 从调查对象总体中按照随机原则(RAND函数)选取一部分对象作为样本进行调查分析,以此推论总体状况。三、数据处理p常用功能 冻结窗口 筛选
9、分列 下拉菜单制作 格式刷使用数据处理技巧p重复数据处理 重复数据的定位与删除p处理缺失数据 缺失数据的定位与处理p检查数据逻辑错误 可以接受的数据缺失标准是10%以下 数据清洗p 重复数据的定位 用计数函数来识别重复数据 用菜单操作筛选重复数据 用条件格式标识重复数据p用多种方法删除重复数据 用菜单操作删除重复项 通过排序删除重复项 通过筛选删除重复项重复数据处理p 缺失值的处理方法 用一个样本的统计量的值(如平均值)代替 用一个统计模型计算出来的值代替 将有缺失值的记录删除 保留有缺失值的个案,在相应的分析中排除p 处理缺失数据的操作 定位输入 查找替换处理缺失数据p 利用IF函数检查错误
10、 嵌套函数p 利用条件格式标记错误p 在公式中查错 分步查看公式计算值检查数据逻辑错误 检查数据逻辑错误错误符号错误符号错误原因错误原因#数值太长,单元格无法容纳#DIV/0!除数为0#N/A函数或公式中没有可用的数值#NAME?在公式中使用了不能识别的文本#NULL!使用了不正确的区域运算符或引用的单元格区域的交集为空#NUM!公式或函数中某些数字有问题#REF!单元格引用无效#VALUE!在公式中使用了错误的数据类型p数据抽取 字段分列、字段合并、字段匹配p数据计算 简单计算、函数计算p数据分组p数据转换 数据表的行列互换 数据加工p数据分析方法论p数据分析方法p数据分析工具四、数据分析数
11、据分析方法论方法论方法论说明说明适用范围适用范围PESTPESTPolitical(政治)Economic(经济)Social(社会)Technological(技术)行业分析4P4PProduct(产品)Price(价格)Place(渠道)Promotion(推广)公司整体经营情况分析逻辑树逻辑树将问题分层罗列,逐步向下展开业务问题专题分析用户使用行为用户使用行为 认知熟悉试用使用忠诚用户行为研究5W2H5W2HWhy,What,Who,When,Where用途广泛How,How much数据分析简单方法方法方法说明说明对比分析法对比分析法与目标对比;不同时期对比;同级部门、单位、地区对比;
12、行业内对比;活动效果对比分组分析法分组分析法分组的目的在于便于对比,分组法必须与对比法结合起来结构分析法结构分析法某部分数值占总体的比率,如市场占有率平均分析法平均分析法算术平均、调和平均、几何平均、众数与中位数交叉分析法交叉分析法常见的二维交叉表p综合评价分析法数据分析综合方法 数据标准化标准值标准值=(原始值(原始值-min-min)/(max-minmax-min)权重确定法(客观、主观)目标优化矩阵目标优化矩阵纵向指标比横向重要时,输入1,否则为01、确定评价的指标2、对指标数据进行标准化处理3、确定各指标权重4、汇总计算出综合评价分值5、根据分值排序,得出结论人才评价人品动手能力 创
13、新意识 教育背景合计合计排序排序人品01122动手能力11131创新意识00113教育背景00004p漏斗分析法数据分析综合方法1、安装2、存活3、更新4、忠诚过5、忠诚64.2%70.21%55.82%20.15%p矩阵关联分析法1数据分析综合方法可分为静态矩阵和发展矩阵高低高满意度重要性高低高满意度重要性p矩阵关联分析法2数据分析综合方法可分为二维矩阵和三维矩阵高低高满意度重要性高低高满意度重要性气泡大小表示修改难度p 数据透视表p 函数数据分析工具术语术语内容内容轴轴数据透视表中的一个维度,如行、列等数据源数据源 创建数据透视表的数据表、数据库等字段字段数据信息的种类,相当于数据表中的列
14、字段标题字段标题描述字段内容的标志,可通过拖动字段标题对数据透视表进行透视分析透视透视通过改变一个或多个字段的位置来重新安排数据透视表汇总函数汇总函数Excel用来计算表格中数据的值的函数。默认汇总函数为求和或计数刷新刷新重新计算数据透视表,以反映目前数据源状态EXCEL函数 什么是函数 Excel函数即是预先定义,执行计算、分析等处理数据任务的特殊公式。以常用的求和函数SUM为例,它的语法是“SUM(number1,number2,.)”。其中“SUM”称为函数名称,一个函数只有唯一的一个名称,它决定了函数的功能和用途。函数名称后紧跟左括号,接着是用逗号分隔的称为参数的内容,最后用一个右括号
15、表示函数结束。什么是公式 函数与公式既有区别又互相联系。如果说前者是Excel预先定义好的特殊公式,后者就是由用户自行设计对工作表进行计算和处理的公式。以公式“=SUM(E1:H1)*A1+26”为例,它要以等号“=”开始,其内部可以包括函数、引用、运算符和常量。上式中的“SUM(E1:H1)”是函数,“A1”则是对单元格A1的引用(使用其中存储的数据),“26”则是常量,“*”和“+”则是算术运算符。EXCEL函数公式中的运算符1.算术运算符算术运算符号运算符含义示 例+(加号)加2+3=5-(减号)减3-1=2*(星号乘3*2=6/(斜杠)除6/2=3%(百分号)百分号50%(脱字号)乘方
16、43=43=64EXCEL函数公式中的运算符公式中的运算符2.文本运算符 “&”号,可以将文本连接起来.3.比较运算符比较运算符比较运算符运算符含义运算符含义示示 例例=(等号等号)相等相等B1=C1,若若B1中单元格内的值确实与中单元格内的值确实与C1中的值中的值相等相等,则产生逻辑真值则产生逻辑真值TRUE,若不相等若不相等,则产生逻则产生逻辑假值辑假值FALSE(小于号小于号)小于小于B1(大于号大于号)大于大于B1C1,若若B1中数值为中数值为6,C1中数值为中数值为4,则条件成则条件成立产生逻辑真值立产生逻辑真值TRUE,否则产生逻辑假值否则产生逻辑假值FALSE=(大于等于号大于等
17、于号)大于等于大于等于B1=C1(不等号不等号)不等于不等于B1C1=(小于等于号小于等于号)小于等于小于等于B1=C1EXCEL函数公式中的运算符公式中的运算符4.引用运算符引用运算符引用运算符引用运算符运算符含义运算符含义示示 例例:区域运算符区域运算符,产生对包括产生对包括在丙相引用之间的所有在丙相引用之间的所有单元格的引用单元格的引用(A5:A15),联合运算符联合运算符,将多个引用将多个引用合并为一个引用合并为一个引用SUM(A5:A15,C5:C15)(空格空格)交叉运算符交叉运算符,产生对两个产生对两个引用构有的单元格的引引用构有的单元格的引用用(B7:D7 C6:C8)例例:A
18、4=B4+C4+C4+E4+F4,可写为可写为:A4=SUM(B4:F4)EXCEL函数公式中的运算顺序公式中的运算顺序 如果在公式中要同时使用多个运算符如果在公式中要同时使用多个运算符,则应该了解运算符的优先级则应该了解运算符的优先级.算术运算符的优先算术运算符的优先级是先乘幂运算级是先乘幂运算,再乘、除运算再乘、除运算,最后为加、减运算。相同优先级的运算符按从左到右的次最后为加、减运算。相同优先级的运算符按从左到右的次序进行运算。序进行运算。公式中出现不同类型的运算符混用时公式中出现不同类型的运算符混用时,运算次序是:引用运算符运算次序是:引用运算符算术运算符算术运算符文本运算符。如果需要
19、改变次序文本运算符。如果需要改变次序,可将先要计算的部分括上圆括号可将先要计算的部分括上圆括号。优先级次优先级次符号符号说明说明1 1:,:,(空格空格)引用运算符引用运算符2 2-算术运算符:(负号(取得与原值正负号相反的值)算术运算符:(负号(取得与原值正负号相反的值)3 3%算术运算符:百分比算术运算符:百分比4 4 算术运算符:乘幂算术运算符:乘幂5 5*和和/算术运算符:乘和除算术运算符:乘和除6 6+和和-算术运算符:加和减算术运算符:加和减7 7&算术运算符:连接文本算术运算符:连接文本8 8=,=,=,=,0,1,0)返回结果为1.EXCEL函数 SUMIF用途:根据指定条件对
20、若干单元格、区域或引用求和。语法:SUMIF(range,criteria,sum_range)参数:Range为用于条件判断的单元格区域,Criteria是由数字、逻辑表达式等组成的判定条件,Sum_range为需要求和的单元格、区域或引用(当省略第三个参数时,则条件区域就是实际求和区域)。COUNTIF用途:统计某一区域中符合条件的单元格数目。语法:COUNTIF(range,criteria)参数:range为需要统计的符合条件的单元格数目的区域;Criteria为参与计算的单元格条件,其形式可以为数字、表达式或文本。其中数字可以直接写入,表达式和文本必须加引号。n 图表文字p 表格也疯
21、狂p 图表的选择p 图表制作五步法p 给图表换装p 别让图表犯错p 图表的美化五、数据展现p 突出显示单元格p 项目选取p 数据条p 图标集p 色阶p 迷你图表格也疯狂图表的选择建议采用图形建议采用图形要表达要表达的数据和的数据和信息信息饼图饼图柱形图柱形图条形图条形图折线图折线图其他其他成分成分(整体的一部分)排序排序(数据间比较)时间序列时间序列(走势、趋势)频率分布频率分布(数据频次)相关性相关性(数据间关系)旋风图多重数据比较多重数据比较图表制作五步法p确定所要表达的主题或目的p确定哪种图表最适合你的目的p选择数据制作图表p检查是否真实有效地展示数据p检查是否表达了你的观点平均线图给图
22、表换装96.6264.3010203040506070809010010000110000041000021000061000081100003100005100004100009302100007100020浏览器自有渠道忠诚浏览器自有渠道忠诚流失率(流失率(%)平均值83.57双坐标图给图表换装瀑布图给图表换装414 247 83 62 19 3 总日活跃积分渠道自有渠道联盟渠道市场推广商务合作浏览器日活跃用户构成浏览器日活跃用户构成单位:万旋风图给图表换装297247896.1372.3528.5763621454.189.9235.66忠诚用户数(万)日活跃MAC总量(万)有效&补量M
23、AC(万)更新率(%)忠诚流失率(%)总卸载率(%)积分渠道联盟渠道矩阵图给图表换装ABCDEFGHXX产品各指标满意度&重要性满意度重要性高高低漏斗图给图表换装p 让图表“五脏俱全”标题、图例、单位、脚注p 要注意的条条框框p 图表会说谎别让图表犯错让图表“五脏俱全”2019年年XX公司产品销售情况公司产品销售情况(单位:百万元)*第三季度品牌A的产品包装发现有毒物质*资料来源:XX调研公司注脚:便于读者理解资料来源:增强数据可信度要注意的条条框框p 避免生出无意义的图表p 不要往图表里塞太多信息p 只选对的,不选复杂的p 一句话标题p 不要使用倾斜的标签p 折线图的线条一般不超过5条饼图制
24、作原则一些简单的原则:尽量不要用3D效果,如果要用尽量薄一些 饼图的结构中,最多包含5种数据(超过则改用复合饼图)标注写在图中,不要标记在一边 边界线使用白色,突出边缘感 不要使用爆炸式“饼图分离”(强调某片扇区可单独分离)图表会说谎p 虚张声势的增长或虚假的稳定 纵坐标轴的正确设定p 3D效果的伪装p 逆序排列的误导图表美化的三个原则:简约 整洁 突出重点图表的美化图表美化的技巧:学会“做减法”找出隐形的线 图表的数字格式 如何突出对比 合理使用颜色图表的美化p数据分析报告的写作原则 规范性、重要性、谨慎性、创新性p数据分析报告的作用 展示分析结果、验证分析质量、提供决策依据p数据分析报告的
25、种类p数据分析报告的结构p撰写报告时的注意事项六、撰写报告p 专题分析报告 内容单一、深入分析p 综合分析报告 全面性、联系性p 日常数据通报 进度性、规范性、时效性数据分析报告的种类写报告常用软件项目项目 Word Word ExcelExcel PowerPointPowerPoint优势l 易于排版l 可打印装订l 可含有动态图表l 结果可实时更新l 交互性强l 可加入丰富元素l 适合演示汇报l 增强展示效果劣势l 缺乏交互性l 不适合演示汇报l 不适合演示汇报l 不适合大篇文字适用范围l 综合分析报告l 专题分析报告l 日常数据通报l 日常数据通报l 综合分析报告l 专题分析报告p最经典的结构:总-分-总 标题页 直接、确切、简洁 目录 前言 分析背景、分析目的、分析思路 正文 结论与建议 附录数据分析报告的结构p 结构合理,逻辑清晰p 实事求是,反映真相p 用词准确,避免含糊p 篇幅适宜,简洁有效p 结合业务,分析合理撰写报告时的注意事项交流与分享交流与分享吾听吾忘吾见吾记吾做吾悟谢谢!
侵权处理QQ:3464097650--上传资料QQ:3464097650
【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。