第5章-Python数据分析案例实战-客户价值分析课件.pptx

上传人(卖家):晟晟文业 文档编号:4424244 上传时间:2022-12-08 格式:PPTX 页数:62 大小:2.13MB
下载 相关 举报
第5章-Python数据分析案例实战-客户价值分析课件.pptx_第1页
第1页 / 共62页
第5章-Python数据分析案例实战-客户价值分析课件.pptx_第2页
第2页 / 共62页
第5章-Python数据分析案例实战-客户价值分析课件.pptx_第3页
第3页 / 共62页
第5章-Python数据分析案例实战-客户价值分析课件.pptx_第4页
第4页 / 共62页
第5章-Python数据分析案例实战-客户价值分析课件.pptx_第5页
第5页 / 共62页
点击查看更多>>
资源描述

1、 随着电商行业竞争越来越激烈,推广费用也是越来越高,加之电商法的出台,刷单冲销量的运营思路已不再适应企业需求,而应将更多的思路应转向客户客户,做好客户运营客户运营才是企业生存的王道王道。运营好客户,我们首先就要了解客户、分析客户,找出哪些是重要保持客户重要保持客户、哪些是发展客户发展客户、哪些是潜在客户潜在客户,根据不同类别的客户采取不同的营销模式:如分类营销、一对一多样化营销、个性化营销等模式,从而使企业的利润最大化。应用场景:某淘宝店铺客户多,消费行为复杂,客户价值很难人工评估。RFM模型重要保持客户发展客户潜在客户系统系统结构图结构图客户价值分析客户价值分析获取获取Excel数据数据数据

2、数据抽取抽取数据探索分析数据探索分析数据规约数据规约数据数据清洗清洗数据转换数据转换客户聚类客户聚类客户价值分析客户价值分析获取数据获取数据数据分析数据分析数据数据处理处理业务流程图业务流程图用户数据是否缺失、异常抽取近两年数据YN标准化处理客户聚类客户价值分析填充、删除处理系统预览系统预览客户群0客户群1客户群2客户群3755人273人560人2人系统预览系统预览开发环境及工具开发环境及工具 操作系统:Windows 7、Windows 10 开发工具:Pycharm 第三方模块:pandas、numpy、matplotlib、sklearn项目文件结构项目文件结构RFM模型聚类分析聚类算法

3、RFMRFM模型模型RFM模型最近消费时间间隔 Recency消费频率 Frequency消费金额 MonetaryRFM聚类分析聚类分析 聚类聚类类似于分类分类,不同的是聚类划分的类是未知的未知的,也就是说我们不知道应该属于哪类,而是通过一定的算法自动分类算法自动分类。而在实际应用中,聚类就是将数据数据集集中某些方面相似的数据相似的数据进行分类分类组织组织的过程。应用领域应用领域聚类分析主要应用领域:聚类分析主要应用领域:商业商业生物保险行业因特网电子商务K-meansK-means聚类聚类算法算法传统的聚类算法包括五类:划分方法 层次方法 基于密度方法 基于网络方法 基于模型方法K-mea

4、ns聚类算法K-meansK-means聚类聚类算法算法 k k均值聚类均值聚类是给定一个数据点集合和需要的聚类数目k,k由用户指定,k均值算法根据某个距离函数反复把数据分入k个聚类中。01 创建k个点作为起始质心,可以随机选择(位于数据边界内)02 当任意一个点的簇分配结果发生改变时03 对数据集中每一个点04 对每个质心05 计算质心与数据点之间的距离06 将数据点分配到距其最近的簇07 对每一个簇,计算簇中所有点的均值并将均值作为质心伪代码K-meansK-means聚类聚类算法算法终止条件可以是以下任意一个:没有(或最小数目)对象被重新分配给不同的聚类。没有(或最小数目)聚类中心再发生

5、变化。误差平方和局部最小。SklearnSklearn模块模块 K-meansK-means聚类聚类 PandasPandas模块模块SklearnSklearn模块模块 SklearnSklearn模块模块(全称Scikit-learn)是Python的第三方模块,它是机器学习领域当中知名的Python模块之一,它对常用的机器学习算法进行了封装,包括回归回归(Regression)、降维降维(Dimensionality Reduction)、分类分类(Classfication)和聚类聚类(Clustering)四大机器学习算法。Sklearn具有以下特点:简单高效的数据挖掘和数据分析工具

6、 让每个人能够在复杂环境中重复使用 Sklearn模块是Scipy模块的扩展,是建立在NumPy和Scipy基础上的模块SklearnSklearn模块模块 SklearnSklearn模块的安装模块的安装 使用pip命令安装 Python版本为2.7以上、NumPy版本1.8以上、SciPy版本0.13.3以上。首先,安装NumPy和SciPy,如果已经安装NumPy和SciPy,那么安装scikit-learn可以在命令提示符下(cmd)使用安装命令:pip install scikit-learn 在Pycharm开发环境下安装K-meansK-means聚类聚类 调用调用KMeansK

7、Means类类 from sklearn.cluster import KMeans 客户价值分析系统主要是通过Scikitlearn的cluster模块提供的Kmeans函数来处理K-means聚类问题的,首先调用Kmeans类。K-meansK-means聚类聚类 基本语法基本语法 kmodel=KMeans(n_clusters=8,init=k-means+,n_init=10,max_iter=300,tol=0.0001,precompute_distances=auto,verbose=0,random_state=None,copy_x=True,n_jobs=None,alg

8、orithm=auto)常用参数及说明常用参数及说明参数参数说明说明n_clusters整型,默认值8,表示生成的聚类数init3个可选值分别为 k-means+、random或者提供一个数组。默认值为 k-means+n_init整型,表示算法的运行次数,默认值为10max_iter整型,默认值300,表示每执行一次k-means算法的最大迭代次数tolfloat类型,表示算法收敛的阈值,默认值为0.0001precompute_distances3个可选值分别为auto、True或者False。该参数用于提前计算好样本之间的距离。默认值为autoverbose整型,默认值=0常用参数及说明

9、常用参数及说明参数参数说明说明random_state整型,表示随机数生成器的种子。默认值为Nonen_jobs整型,表示指定计算所用的进程数。默认值为1属性说明属性说明 cluster_centers_:返回返回ndarray。表示分类簇的均值向量。表示分类簇的均值向量 labels_:返回返回ndarray。表示每个样本所属的簇的标记。表示每个样本所属的簇的标记 inertia_:返回返回ndarray。表示每个样本距离它们各自最近表示每个样本距离它们各自最近簇的中心之和簇的中心之和pandaspandas模块模块 Pandas是Python的一个核心模块,主要用于数据处理与数据分析,它提

10、供了快速、灵活、明确的数据结构,能够简单、直观地处理关系型、标记型数据。数据抽取数据抽取 数据抽取是从数据源中抽取数据的过程。淘宝电商存在大量的历史销售数据,我们从中抽取近两年的数据20172017年年1 1月月1 1日日20182018年年1212月月3131日日 业务数据库1业务数据库2业务数据库n抽取数据数据仓库仓库数据探索分析数据探索分析 数据探索分析主要分析与客户价值RFM模型有关的数据是否存在数据缺失、数据异常的情况,分析出数据的规律。主要使用:describedescribe函数函数开发步骤开发步骤 导入模块导入模块pandaspandas 使用使用pandaspandas读取读

11、取ExcelExcel数据数据 使用使用describedescribe函数函数统统计数据计数据 计算空值数计算空值数(缺失数据缺失数据)导出结果导出结果最终实现效果最终实现效果开发步骤开发步骤 数据规约数据规约 数据清洗数据清洗 数据转换数据转换数据规约数据规约 数据数据规约规约是指在接近或保持原始数据完整性的同时将数据集规模减小,以提高数据处理的速度。58列买家会员名买家会员名订单付款时间订单付款时间买家实际支付买家实际支付金额金额数据采集时间数据采集时间编写编写相关代码相关代码aa=rTB201812.xlsdf=pd.DataFrame(pd.read_excel(aa)df1=df订

12、单付款时间,买家会员名,买家实际支付金额,数据采集时间指定指定ExcelExcel文件文件读取读取ExcelExcel文件文件选取需要的数据选取需要的数据数据清洗数据清洗 通过前面的数据探索分析,我们发现在淘宝电商历史销售数据中存在一些缺失值缺失值,例如“订单付款日期订单付款日期”为空、“买家实际支付金额买家实际支付金额”最小值为0,下面将这部分数据清理掉,关键代码如下:#去除空值,订单付款时间非空值才保留#去除买家实际支付金额为0的记录df1=df1df1订单付款时间.notnull()&df1买家实际支付金额!=0数据转换数据转换 数据数据转换转换是将数据转换成“适当的”格式,以适应数据分

13、析数据分析和数据挖掘算法挖掘算法的需要。下面将清理后的数据进行标准化处理。最终实现效果最终实现效果客户聚类客户聚类 客户客户聚类聚类主要使用Python第三方模块SklearnSklearn模块模块中提供的K-meansK-means聚类方法对客户数据进行分类。根据业务需要,这里分为4 4类类。开发步骤开发步骤 导导入数据入数据 数据塞进数据塞进模型模型 客户聚类客户聚类最终实现效果最终实现效果客户价值分析结果解析客户价值分析结果解析客户价值分析结果解析客户价值分析结果解析常见错误与解决常见错误与解决 1 1、缺少、缺少模块导致程序运行错误模块导致程序运行错误 2 2、模块版本不适合导致程序运

14、行错误、模块版本不适合导致程序运行错误常见错误与解决常见错误与解决 3 3、ExcelExcel文件打开时程序运行错误文件打开时程序运行错误注意事项注意事项 4 4、数据结果保存、数据结果保存ExcelExcel文件时文件时 注意:index参数,是否输出索引安装缺失的安装缺失的模块模块安装缺失的模块安装缺失的模块 在Available PackagesAvailable Packages窗口的搜索框中输入模块名称,比如xlrd,模块搜索到后勾选安装复选框,然后单击Install PackageInstall Package按钮即可安装该模块。模块安装版本选择模块安装版本选择 在File菜单中选择Settings打开Available Packages窗口,在该窗口中找到Specify versionSpecify version复选框复选框,在下拉列表中选择0.21.00.21.0版本

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公、行业 > 各类PPT课件(模板)
版权提示 | 免责声明

1,本文(第5章-Python数据分析案例实战-客户价值分析课件.pptx)为本站会员(晟晟文业)主动上传,163文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。
2,用户下载本文档,所消耗的文币(积分)将全额增加到上传者的账号。
3, 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(发送邮件至3464097650@qq.com或直接QQ联系客服),我们立即给予删除!


侵权处理QQ:3464097650--上传资料QQ:3464097650

【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。


163文库-Www.163Wenku.Com |网站地图|