今天为大家分享的项目作品来自参与用户凤城,其主题是基于人、货、市场的电子商务。
平台数据分析
,分析的思路非常清晰,可视化报告的部分做的也不错,对数据分析新手来说非常具有学习价值。场景介绍业务背景:小峰是一名新的BI工程师。试用期结束,导师给了小峰一份电商数据,让他给出一个合理的分析结果。
目的:小峰通过分析两年来电商平台的销售和发展情况,找出平台发展的相应结论,并给出相应的改进建议。
分析工具:FineBI
分析思维
首先我们明确本次分析的目的是分析电商平台的相关数据,找出问题并给出相关建议,决定从传统的人、货、市场的角度进行分析。
领域维度我们分析平台销售的健康度和分布。可以得出平台销售额的分布特征和增长趋势。
然后通过对商品的分析,了解平台、品类销售、产品价格所处的位置,从而优化ABC分类,了解平台产品的定位。同时我们也知道产品体验需要通过评分来优化,尝试定位产品评价低的原因。
然后通过对会员的分析,了解会员的增长趋势和会员的分布情况,发现大量会员也分布在巴西沿海。同时也通过AARRR模型和RFM模型了解会员的转化率和消费属性,确定重要价值客户的占比和地域分布位置,有利于精准营销。
同时,通过对会员订单的分析,了解会员的消费时间、消费方式、平均支付时间。同时,通过会员的评分,了解会员的潜在诉求。
其他分析——物流分析,最后分析了平台的物流情况,发现物流不准时的比例高,物流时间长,但同时物流成本占订单成本的比例高,人的消费与接受的服务不成比例。同时,通过低评价的不准时比例和物流时间验证了猜测,确定了低评价现象与物流服务有关。
最后,针对上述结论和现象提出了一些改进建议。
整体分析脑图如下:
数据整理
有九个基本数据表,如下图所示。AAARR模型表,巴西各州辅助表,表关系和区域经纬度表是我通过其他途径获得的辅助数据表。
主要的自助数据集宽度表有:订单核心维度聚合宽度表和RFM模型表。
数据整理过程:
第一步:获取:登录kaggle下载公共数据集,需要翻墙并拥有kaggle账号。(想去Kaggle参加比赛的朋友可以找我要翻墙的工具)
第二步:清洗:为了保证源数据的准确性,对上述9个EXCEL基础数据进行重复和异常值处理(如数据查重、前后时间值、金额加减等。),由EXCEL配合相应函数完成。因为比较简单,这里不做过多描述。
第三步:导入传递到FineBI,为每个EXCEL表创建一个张宽表作为维度表,方便操作。(方便添加字段或维护单个表格),为后续制作大而宽的表格奠定了数据基础。
第四步:制作主宽表(1)聚合订单核心各维度的宽表。
a、以Olist_order_dataset为核心表,链接维度表,创建订单核心各维度的聚合宽度表。各表之间的血缘关系如下。
b、选择订单核心表,通过左右合并依次与各个维度表合并。
c增加过滤,过滤掉2017年到2018年的数据。
d、新增栏目是否按时通过物流预计到达时间与实际到达时间的对比。
E.添加新老成员。
F.订单核心的每个维度的聚合宽度表已经创建,其雪花模型如下所示。
步骤4 (2):制作主宽度表(2) RFM模型表
A.首先,获取订单核心的每个维度的聚合宽度表的对应字段。
b,添加一个新列,从现在起的消费时间天数,然后计算平均消费时间天数,并以此来判断R值。
同样,会员消费频率计算出的是平均会员频率,这个比值计算出的是F值。通过会员消费金额计算平均会员消费金额,并以此计算M值。
c、合并R、F、M,拼接R、F、M。
用IF函数定义中文的RFM
至此,相关数据处理完毕,数据整理告一段落。
完成分析报告
A.整体框架:根据故事的叙述做整体排版,具体为以下几个板块,任务背景,明确目的-->“场”分析-->“货”分析-->“人”分析-->其他分析-->总结建议。
B.图表选择:您可以查看此图表进行图表选择:
c、分析思路及相应结论
实地分析:通过季度销售趋势图和环比,以及各状态的金额分布分析,了解平台的销售趋势和分布情况,了解平台销售是否健康,销售的重点领域。
1)发现相较2017年,2018年的销售金额和销售量呈环比上升趋势,最近两季度略微下降,趋向平稳。平台客单价在175Reals/单浮动。说明平台整体的态势还是向上发展的。 2)了解到订单来源主要来自巴西沿海各州,其中圣保罗州,里约热内卢州,米纳斯吉拉斯州为订单量产出州TOP3,而反观巴西内地产出偏低,小风猜测这也许巴西经济中心集中在沿海各州有关。商品分析:品类销售帕累托分析,散点图探究品类宽度和销售关系,然后价格带分析了解平台产品定位。通过评估比例了解产品满意度,通过分析产品完整性验证猜测。
1)发现health_beauty,watches_gifts,bed_bath_table这三个品类为该平台热卖品类,且18年销售均大于17年,呈上升趋势 2)通过散点图分析,确认了宽度越宽的品类往往销售额也越高 3)列出TOP10销售的产品,得到平台价格带定位在0-100 ,主要面向低端客户群体 4)1-2分的低评占了评价的18%,平台服务有很大提升空间,探索其低分原因不是由产品本身不完整性导致的人:分析平台会员趋势了解平台会员健康状况,通过地图分布了解会员分布,通过AARRR模型了解会员转化率,通过环比图了解新老会员销售情况。使用RFM模型对成员进行分层,确定重要价值客户的分布。利用会员行为分析,了解会员下单的时间、付款方式、平均付款时间,还可以了解会员的低分和评论时间趋势。
1)发现2017年至2018年会员总体呈上升趋势,但2018年第三季度呈现下滑状态。 2)通过会员各州分布和城市分布发现,会员主要集中在圣保罗州,里约热内卢州,主要分布城市为sao paulo riode janeiro 3)一般电商模型为AARRR模型,发现平台转化率在98%左右。 4)发现重要价值客户占会员体系的17%,而重要价值客户也凭借着自己的高客单,高销量为销售额提供了主要贡献。 5)会员下单主要集中在11点,16点,20点,喜欢用credit_card作为支付手段,平均付款时间在6.46小时。 6)发现会员评分4-5分约占78%,总体好评居多,但1-2分也占据着13%,存在一定风险,可以适当优化,会员评论时间集中在11-12,21-23时间段。其他分析:通过分析物流准时率、物流时间占订单时间的比例、平均物流天数、物流运费金额占总金额的比例来评估客户物流服务的投入产出比,通过低评级不准时率和物流时间来验证猜测。
1)顾客对物流服务的投入产出比低下,造成较大不满 2)低评确实是由物流因素引起相应建议:
d、整体色彩布局偏暗,浅色的布局已经很难处理了。后来再试一次,统一调整字体和字号,让画面看起来更整洁美观,在结论处对应指标做颜色标记,比如红色表示指标好,绿色表示指标差。整个优化采用局部美化,完成时整体优化的方式。
配色网站推荐:材质调色板:,平板UI颜色:
E.作品展(有些比较模糊,原图太大放不下,只能压缩,我们就随便看看,有兴趣的可以下载PDF看)
摘要
经验分享:带着目的去分析,一步一步按照分析框架去做,享受分析过程。
本文地址:[https://chuanchengzhongyi.com/kepu/7aed78e92e3ec119.html]