《Excel-电商数据分析》教学课件—02数据分析方法论.pptx

上传人(卖家):晟晟文业 文档编号:4767981 上传时间:2023-01-08 格式:PPTX 页数:46 大小:616.93KB
下载 相关 举报
《Excel-电商数据分析》教学课件—02数据分析方法论.pptx_第1页
第1页 / 共46页
《Excel-电商数据分析》教学课件—02数据分析方法论.pptx_第2页
第2页 / 共46页
《Excel-电商数据分析》教学课件—02数据分析方法论.pptx_第3页
第3页 / 共46页
《Excel-电商数据分析》教学课件—02数据分析方法论.pptx_第4页
第4页 / 共46页
《Excel-电商数据分析》教学课件—02数据分析方法论.pptx_第5页
第5页 / 共46页
点击查看更多>>
资源描述

1、数据分析方法论2.1基本方法&2.2高级方法1对比法23CONTENTS拆分法排序法4分组法6降维法7增维法8指标法9图形法5交叉法10SWOT分析法11描述性统计法12数据标准化(指数化)基本方法数据分析有法可循,在分析数据时使用分析方法可以快速有效地分析数据,从数据中获取信息。常用的基本方法有对比法、拆分法、排序法、分组法、交叉法、降维法、增维法、指标法和图形法。根据业务场景选择一种或一种以上的分析方法可以让分析更加高效。各基本方法的使用场景如表所示。分析方法使用场景对比法发现问题拆分法寻找问题的原因排序法找到分析的重点分组法洞察事物特征交叉法将两个及以上的维度进行比较,并通过交叉的方式分

2、析数据降维法解决复杂问题增维法解决信息量过少的问题指标法基本方法,可支持多字段图形法基本方法,对分析字段有数量限制对比法PART ONE对比法是最基本的分析方法也是数据分析的“先锋军”,分析师在开展分析时首先使用对比法,可以快速发现问题。进行商业分析时有三个必备的维度,分别是过去的自己、同期的对手和同期的行业,通过这三个维度的对比可以了解数据意义,否则数据就是一座孤岛。对比法分为横向和纵向两个方向。横向对比是指跨维度的对比,用于分析不同事物的差异,比如在分析企业销售业绩的时候,将不同行业的企业销售业绩一起进行对比,这样可以知道某家企业在整个市场的地位。如我国500强企业排行榜单,就是将不同行业

3、的企业产值进行对比。纵向对比是指在同一个维度不同阶段的对比,比如基于时间维度,将今天的销售业绩和昨天、上个星期同一天进行对比,可以知道今天销售业绩的情况。例:小李是某网店运营,刚接手一家新网店,欲确定该店铺的主营品类,已知该店铺经营A、B、C、D四个品类,各品类销售数据如右表所示。解:将表转变成柱形图,如右表所示,通过对比A、B、C、D四个品类销售额的最大值,要做市场规模则选择销售额高的品类,要便于生存则选择销售额低的品类。A品类B品类C品类D品类1580万元780万元 605万元1685万元各品类的销售额拆分法PART TWO拆分法拆分法是最常用的分析方法之一,在许多领域应用非常广泛,杜邦分

4、析法就是拆分法的经典应用。拆分法是将某个问题拆解成若干个子问题,通过研究该若干子问题从而找到问题的症结点并解决问题。比如在研究销售业绩下降问题时,可以将销售业绩问题拆分成转化率、客单价和访客数这三个子问题,通过分析这三个子问题从而解决销售业绩问题。解:如图所示,销售额下降的问题可拆分成三个子问题,分别是访客数、转化率和客单价的变化,对上表的数据运用对比法发现主要是访客数的变化引起的销售额大幅下降。可再进一步拆分访客数,访客数可分为付费访客数和免费访客数,对问题的原因进行进一步剖析,直到找到问题的根源。拆分法可分为完全拆分法和重点拆分法。完全拆分法,也称为等额拆分法,是将父问题100%进行拆解,

5、拆解出来的子问题的和或者集合(算法)可100%解释父问题。如销售额=访客数转化率客单价,等式两边完全相等。重点拆分法,也称为非等额拆分法。只拆分出问题的重点,子问题只解释了父问题的80%左右。如做好网店=点击率+转化率+退款率,确实要做好一家网店只要做好点击率、转化率和退款率这三个指标就够了,但做网店运营不完全是这三个环节。抓住重要环节,有时面对一些复杂的问题,就需要采用重点拆分法。日期访客数转化率客单价销售额周一10003.5%1003500昨日20003.4%1006800上周一25003.5%1008750例:某网店的销售额大幅下降,店铺核心数据如表所示,运营欲找出销售额下降的原因排序法

6、PART THREE排序法排序法是基于某一个指标或度量值的大小,将观测值进行递增或递减排列,每一次排列只能基于某一个指标。排序法是从对比法中衍生的一种常用方法,百度搜索风云榜、阿里排行榜等业内知名榜单就是重采用排序法的产品,通过查看排序后的榜单,用户可以快速获取目标价值信息。例:某运营收集了数个品类的数据,如表所示,欲通过排序法列出品类榜单品类交易指数在线产品数(个)T恤2017855135570连衣裙4355121868084裤子2266441053642衬衫1959211556930表1 未排序的品类行业数据解:排序法只能基于某一个度量进行排序,表1中有两个度量,因此可以做出两个表单。表2

7、为基于交易指数的榜单,排名越靠前代表该品类的市场规模越大。排名品类交易指数在线产品数(个)1连衣裙43551218680842裤子22664410536423T恤20178551355704衬衫1959211556930表3为基于产品数的榜单,排名越靠前代表该品类的市场竞争越大。排名品类交易指数在线产品数(个)1T恤20178551355702裤子22664410536423连衣裙43551218680844衬衫1959211556930分组法PART FOUR分组法来源于统计学,用于发现事物的特征,是非常重要的分析方法。分析时可以按类型、结构、时间阶段等维度进行分组,观察分组后的数据特征,从

8、特征中洞察信息。例:基于下表的信息,分析裤子和职业套装的差异父类目子类目销售额(元)裤子休闲裤747991311裤子打底裤89942330裤子西装裤/正装裤4952899裤子棉裤/羽绒裤1800685职业套装休闲套装216517887职业套装职业女裙套装24072258职业套装医护制服1649589职业套装 其他套装5952780解:基于题目可以得知需要对父类目进行统计分组。分组结果如下表所示父类目销售额(元)裤子844687225职业套装248192514通过观察分组结果可知裤子的市场份额远大于职业套装的市场份额交叉法PART FIVE交叉法是对比法和拆分法的结合,将有一定关联的两个或两个以

9、上的维度和度量值排列在统计表内进行对比分析,在小于等于三维的情况下可以灵活使用图表进行展示。当维度大于三维时选用统计表展示,此时也称之多维分析法。比如在研究市场定价时,经常将产品特征和定价作为维度,销售额作为指标进行分析。例:下表所示是不同性别的消费者在不同品类上的消费金额数据,利用交叉法分析不同性别的差异。性别品类消费金额(元)男零食68男耳机180女零食155女耳机42解:将左表转变成二维交叉表,如表2-10所示,可以直观地观察到男性和女性用户在消费偏好上的差异,男性更愿意在耳机上消费,女性则更愿意在零食上消费。性别 品类零食耳机男68180女15542降维法PART SIX降维法是在数据

10、集指标过多及分析干扰因素太多时,通过找到并分析核心指标提高分析精度,或者通过主成分分析、因子分析等统计学方法将数据由高维转换成低维的方法。比如在分析店铺数据时,根据业务问题的核心提取主要的24个核心指标进行分析。例:根据下表的数据指标字段评估店铺的综合情况。转化率销售额客单价访客数动销率连带率好评率纠纷率上新率解:对数据指标字段进行分类,将店铺的评估分成产品运营能力、店铺获客能力和店铺服务能力。动销率连带率上新率反映店铺产品运营能力的指标如下表所示反映店铺获客能力的指标如下表所示转化率销售额客单价访客数反映店铺服务能力的指标如下表所示好评率纠纷率基于各能力维度下的指标,综合评估各能力的分数。可

11、使用数据归一化的方法或者熵值法计算分数,达到综合评估的目的。1.数据归一化是将数据映射到0,1的区间,在2.2.3小节中详细介绍。2.熵值法的核心思想是用信息的无序度来衡量信息的效用值。信息的无序度越低(越不稳定)增维法The user can demonstrate on a projector or computer,or print the presentation and make it into a film to be used in a wider fieldPART SEVEN增维法是在数据集的字段过少或信息量不足时,为了便于分析师分析,通过计算衍生出更加直观的指标。比如在分析

12、关键词时,将搜索人气除以商品数量得到的新指标,定义为关键词的竞争指数。例:如表所示,计算关键词的竞争度,公式如下:竞争度=搜索人气点击率支付转化率在线商品数基于业务经验,得到的指标为正指标,数值越大越好关键词搜索人气点击率在线商品数支付转化率竞争度永生花32914152.95%1651186.92%0.021永生花花瓣耳环11736132.03%31993.99%0.193永生花礼盒10274162.75%557748.55%0.026永生花DIY材料包9245222.64%41983.71%0.182永生花玻璃罩7977138.58%237186.89%0.032指标法The user ca

13、n demonstrate on a projector or computer,or print the presentation and make it into a film to be used in a wider fieldPART EIGHT指标法是分析的基本方法之一,通过汇总值、平均值、标准差等一系列统计指标研究分析数据。指标法更适用于多维的数据。例:下表所示为淘宝搜索某关键词按人气排名前5的商品数据,通过指标法描述这个数据。排名售价销售额评价人数DSR_物流分DSR_描述分DSR_服务分16801156001514.614.744.7623680629280164.984.9

14、84.98321803727809024.954.954.964218037496023634.924.934.94521993804279584.954.974.95解解:使用指标法描述数据后的结果,如下表所示。售价销售额评价人数DSR_物流分DSR_描述分DSR_服务分计数555555缺失值000000平均值21843746098784.884.914.92汇总109191873047439024.4124.5724.59标准差9491624698350.140.090.08描述数据的相关度量图形法The user can demonstrate on a projector or com

15、puter,or print the presentation and make it into a film to be used in a wider fieldPART NINE图形法是分析的基本方法之一,通过柱形图、折线图、散点图等一系列统计图形直观地分析数据。图形法适用于低维的数据。例:下表所示为淘宝搜索某关键词按人气排名前220的商品数据,通过图形法分析相关售价的分布排名售价销售额评价人数DSR_物流分DSR_描述分DSR_服务分16801156001514.614.744.7623680629280164.984.984.98321803727809024.954.954.962

16、20150547800332064.754.634.74某关键词按人气排名前220的商品数据解:下图所示是基于售价分组后绘制的直方图,可以直观地观察各个价格区间包含商品的个数,商品售价分布主要集中在118,588,1058,1528两个区间。图形法有画图空间、图形和图注三个要素。画图空间是图形的容器,图形呈现在画图空间之中,如二维空间、三维空间。图形是要表达信息的可视化结果,如线形、柱形。图注是对图形的标注。如上图所示,图注包含图标题、数据标签、坐标轴、坐标轴标题、图例。图1 价格区间分布图图2 图形的图注示例SWOT分析法The user can demonstrate on a proje

17、ctor or computer,or print the presentation and make it into a film to be used in a wider fieldPART TENSWOT分析法,即态势分析法,来源于市场营销方法论,是首先将与研究对象密切相关的各种主要内部优势、劣势和外部的机会和威胁等,通过调查列举出来,并依照矩阵形式排列,然后用系统分析的思想,把各种因素相互匹配起来加以分析,从中得出一系列相应的结论,而结论通常带有一定的决策性。SWOT分析法是常用的分析方法,有助于分析师了解企业当前所处的内外环境,可以让分析师更准确地通过数据做判断。1内部因素分析 内

18、部因素由优势(Strengths)和劣势(Weaknesses)组成,对企业内部的管理、团队、产品和市场营销情况进行分析,通过了解企业的内部情况,分析师可以更好地解读数据中蕴藏的信息。例:如下表所示,对某电商公司的内部因素进行分析。优势(Strengths)劣势(Weaknesses)1店铺开发能力强2服务消费者的能力强3能够把控品质4公司的财务状况非常好1公司管理方面不是很完善2库存能力不强,常断货3公司内部人员竞争4店铺定位不明确5开发消费者能力弱2外部因素分析 外部因素由机会(Opportunities)和威胁(Threats)组成,对企业外部的环境、政策和竞争对手进行分析,通过了解企业

19、的外部情况,分析师可以充分地了解企业的情况。例:如下表所示,对某电商公司的外部因素进行分析。机会(Opportunities)威胁(Threats)1市场标杆很少,明确定位的店铺很少2市场需求大幅增长3普遍不重视用户体验4个性化1竞争2同质化严重3盗图4大商家新入驻3基于内外因素的应对策略 在充分了解企业的内外部情况后,将内部的优势、劣势和外部的机会、威胁进行交叉。当企业的优势遇到机会,应当采取发展的策略;当企业的优势遇到威胁,应当采取拓展的策略;当企业的劣势遇到机会,应当采取争取的策略;当企业的劣势遇到威胁,应当采取保守的策略。例:如下表所示,根据某电商企业的内外部因素进行策略分析。优势(S

20、trengths)劣势(Weaknesses)机会(Opportunities)SO(发展)WO(争取)1结合市场情况,在自身开发能力的基础上,找到明确的定位,增加消费者黏性,提高复购率2提升消费者体验3开发更多新品迎合市场需求1提升管理能力,让指令可以上行下达2合理使用ERP软件进行管理,严格把控库存仓位3设定良性竞争机制4精准定位消费者人群5制订推广方案,吸引更多新消费者威胁(Threats)ST(拓展)WT(保守)1提升店铺形象(口碑)2开发团队把控市场需求走向,规避同质化3结合公司的自主开发,提升公司版权保护意识4精准定位消费者1保持店铺的独特风格,不被外界影响2加强CRM管控描述性统

21、计法The user can demonstrate on a projector or computer,or print the presentation and make it into a film to be used in a wider fieldPART ELEVEN描述性统计法是运用描述性统计指标对数据集进行研究,来源于统计学。在获得数据集后,一般要对数据集进行观察,了解数据集的字段、数据分布等。当数据指标较少时可选用图形法进行直观的观察,数据指标较多时无法使用,此时需使用描述性统计法。本节以淘宝网某关键词排名前5的商品数据为数据集,利用Excel工具实现指标计算。如图所示,

22、数据区域为A1:G6。排名售价销售额评价人数DSR_物流分DSR_描述分DSR_服务分16801156001514.614.744.7623680629280164.984.984.98321803727809024.954.954.964218037496023634.924.934.94521993804279584.954.974.95淘宝某关键词排名前5的商品数据1五数概括法 五数概括法是指用五个指标反映数据集的分布情况,五个指标分别是最小值、1/4位数(Q1)、中位数(Q2)、3/4位数(Q3)和最大值。(1)最小值指数据集中最小的一个值。计算方法:在Excel中键入“=MIN(ar

23、ray)”,其中array为要进行计算的区域。例1:求上表中销售额的最小值。解:在C7单元格中键入“=MIN(C2:C6)”,得到结果为:115600。(2)1/4位数指数据集中所有数值由小到大排列后第25%的数字。计算方法:在Excel中键入“=QUARTILE.INC(array,quart)”,其中array为要进行计 算的区域,quart为要计算的指标,quart为1表示计算1/4位数。例2:求上表中销售额的1/4位数。解:在C8单元格中键入“=QUARTILE.INC(C2:C6,1)”,得到结果为:244190。(3)中位数指数据集中所有数值由小到大排列后第50%的数字。计算方法:

24、在Excel中键入“=QUARTILE.INC(array,quart)”,其中array为要进行计算的区域,quart为要计算的指标,quart值为2表示计算中位数。例3:求前表中销售额的中位数。解:在C9单元格中键入“=QUARTILE.INC(C2:C6,2)”,得到结果为:374960。(4)3/4位数指数据集中所有数值由小到大排列后第75%的数字。计算方法:在Excel中键入“=QUARTILE.INC(array,quart)”,其中array为要进行计算的区域,quart为要计算的指标,quart值为3表示计算3/4位数。例4:求前表中销售额的3/4位数。解:在C10单元格中键入

25、“=QUARTILE.INC(C2:C6,3)”,得到结果为:504853.5。(5)最大值指数据集中最大的一个值。计算方法:在Excel中键入“=MAX(array)”,其中array为要进行计算的区域。例5:求前表中销售额的最大值。解:在C11单元格中键入“=MAX(C2:C6)”,得到结果为:629280。五数概括法的计算结果如下表所示类型计算结果最小值1156001/4位数244190中位数3749603/4位数504853.5最大值629280如下图所示,将这5个数值绘制成箱线图,可以直观地看到数据集的分布情况。在某些场景下,为了分析的可靠性,会从数据集中抽取分布在1/4位数3/4位

26、数的数据作为观测值,也就是分别将两端的数据过滤掉,避免极端情况的影响。例如在计算行业平均销售件数时,排除爆款群和销量极低的产品,这样计算出来的平均数更具有代表性,更接近于大多数的产品。基于五数概括法绘制的箱线图2计数、汇总和平均值计数、汇总和平均值是最常用的描述性统计指标。(1)计数计数(Count)亦称数数,算术的基本概念之一,指数事物个数的过程。在统计指标中计数是指统计数值或者观测值的数量。计算方法:在Excel中键入“=COUNT(array)”,其中array表示要进行计算的区域。例1:求右表中销售额的计数。解:在C11单元格中键入“=COUNT(C2:C6)”,得到结果为:5。(2)

27、汇总汇总是数据的求和。计算方法:在Excel中键入“=SUM(array)”,其中array表示要进行计算的区域。例2:求右表中销售额的总数。解:在C11单元格中键入“=SUM(C2:C6)”,得到结果为:1873047。(3)平均值平均值是指算术平均值,又称均值。计算方法:在Excel中键入“=AVERAGE(array)”,其中array表示要进行计算的区域。例3:求右表中销售额的平均值。解:在C11单元格中键入“=AVERAGE(C2:C6)”,得到结果为:374609.4。3标准差标准差是用于反映数据离散程度的指标。标准差又分总体标准差和样本标准差,当数据是总体时采用总体标准差,如计算

28、企业的所有产品的销售额标准差,计算行业爆款的标准差则采用样本标准差,如计算行业前10产品销售额的标准差。总体标准差计算方法:在Excel中键入“=STDEV.P(array)”,其中array代表要进行计算的区域。样本标准差计算方法:在Excel中键入“=STDEV.S(array)”,其中array代表要进行计算的区域。例:求下表中销售额的标准差。解:先明确何为总体,如果标准差是要反映表2-22中5个产品的标准差,那这5个产品就是总体;如果用此标准差反应该品类的标准差,此时该品类的所有产品就是总体。本例求表中销售额的标准差,不考虑整个品类,则用总体标准差,在C11单元格中键入“=STDEV.

29、P(C2:C6)”,得到结果为:162468.6。4变异系数变异系数和标准差一样也是用于反映数据离散程度的指标,但不同的是变异系数不被数据量纲影响。公式为:变异系数公式为:变异系数=标准差标准差/平均值平均值例:求下表中销售额的变异系数。解:在 C 1 1 单 元 格 中 键 入“=ST D E V.P(C 2:C 6)/AVERAGE(C2:C6)”,得到结果为:0.433701。不同分组的变异系数可进行对比,数值越大离散程度则越大。数据标准化(指数化)The user can demonstrate on a projector or computer,or print the prese

30、ntation and make it into a film to be used in a wider fieldPART TWELVE在数据分析之前,通常需要先将数据标准化(Normalization),利用标准化后的数据进行数据分析,属于数据清洗中的方法。数据标准化也就是统计数据的指数化。数据标准化处理主要包括数据同趋化处理和无量纲化处理两个方面。数据同趋化处理主要解决不同性质数据问题,对不同性质指标直接加总不能正确反映不同作用力的综合结果,须先考虑改变逆指标数据性质,使所有指标对测评方案的作用力同趋化,再加总才能得出正确结果。数据无量纲化处理主要解决数据的可比性。数据标准化的方法有很

31、多种,常用的有“最小最大(Min-Max)标准化”、“Z-score标准化”和“按小数定标标准化”等。经过上述标准化处理,原始数据均转换为无量纲化指标测评值,即各指标值都处于同一个数量级别上,可以进行综合测评分析。1Min-Max标准化Min-Max标准化方法是对原始数据进行线性变换的方法。设MinA和MaxA分别为属性A的最小值和最大值,将A的一个原始值x通过Min-Max标准化映射成在区间0,1中的值x,其公式为:新数据=(原数据-最小值)/(最大值-最小值)例:采用Min-Max标准化方法将下表的数据标准化。产品访客数支付转化率客单价A766312.92%40.92B615614.38%

32、26.45C25623.44%238.65D24459.65%55.77E18814.94%106.69解:产品B的新访客数映射到(6156-256)/(7663-256),其中,6156是产品B原访客数,256是访客数中最小的值,7663是访客数中最大的值。如下图所示为Excel中的公式:=(B2-MIN(B$2:B$6)/(MAX(B$2:B$6)-MIN(B$2:B$6)其中,“$”表示绝对引用,在列名前加“$”表示对列绝对引用,在行号前加“$”表示对行绝对引用。在Excel中运用min-max的公式2Z-score标准化Z-score是指基于原始数据的平均值(Mean)和标准差(Sta

33、ndard Deviation)进行数据的标准化。将A的原始值x使用Z-score标准化到x。Z-score是指标准化方法适用于属性A的最大值和最小值未知的情况,或有超出取值范围的离群数据的情况,其公式为:新数据=(原数据-平均值)/标准差例:采用Z-score标准化方法将表2-24的数据标准化。解:产品B的新访客数为(6156-3680.2)/2774.18,其中,6156是产品B的访客数,3680.0是访客数的平均值,2771.18是访客数的总体标准差。右 图 所 示 E x c e l 中 的 公 式 为:“=(B 2-AVERAGE(B$2:B$6)/STDEV.P(B$2:B$6)”。在Excel中运用z-score的公式感谢观看

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(《Excel-电商数据分析》教学课件—02数据分析方法论.pptx)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|