淘宝电商用户行为数据分析及可视化-基于MySQL/Tableau

avatar
作者
猴君
阅读量:2
前言

一、数据源

数据来源于阿里天池竞赛:阿里移动推荐算法数据集_数据集-阿里云天池

竞赛数据包括两个部分。

 第一部分是脱敏后的用户在移动端行为数据(D),对应文件是tianchi_mobile_recommend_train_user.zip,包含如下字段:

第二个部分是脱敏后的商品子集(P),文件名为tianchi_mobile_recommend_train_item.csv,包含如下字段: 

 我下载的是zip文件,有1225万条数据,数据量大,所以选取了前10万条做数据分析。

二、数据清洗

导入数据到mysql

使用Navicat工具对数据进行操作,首先将数据导入mysql数据库中,注意所有的字段都按照默认格式varchar导入,导入成功后再设计表,按照需求修改字段格式。数据概览如下:

重复值

SELECT *,COUNT(user_id) from data GROUP BY user_id,item_id,behavior_type,user_geohash,item_category,time having count(user_id)>1

 有重复,但根据业务理解不需要处理,结果如下:

 异常值

查看time范围,检查是否有时间之外的数据出现,结果显示没有异常值。

select min(time), max(time) from data

 缺失值

查看各字段的数量,无缺失值。

select count(user_id), count(item_id), count(behavior_type),  count(item_category),count(time)  from data; 

三、数据分析

 1.整体活跃度,基于AARRR模型

1.1各字段统计数据

select count(distinct user_id) user,count(distinct item_id) item,count(distinct behavior_type) behavior_type from data;

 该数据集包含899位用户,80961种商品,4种用户行为。

 1.2用户获取Acquisition

本项目数据从11月18日开始,到12月18日结束,11月18日前无可分析数据。在靠近11月18日的当日新增用户中很大一部分并非当日新增,而是18日前就已经活跃用户。日期靠后的数据,越能体现出当日新增真实值,具体值需要等待后续数据。 

1.3 用户激活Activation

本项目数据源共100000条,pv为94543 ,uv为898, 人均页面访问数为105.28。

浏览页跳失率为26.92%,关键页跳失率73.08%。

 

 时间维度用户行为

从时间维度的日期、时段、星期,来观察用户行为。

从11月30日开始,pv、cart值增大,12月4日、6日出现小范围减小;12月12日当天pv、cart、buy值激增,达到高点,次日骤降,回归平均水平。

从日时段来看,用户在10点到24点较为活跃。从17点开始逐渐增高,晚上21点—22点达到最高值。

  

基于以上数据,12·12活动一般选择在11月底、12月初开始预热,至少提前1-2周进行;网站的客服、维护尤其要注意晚上20点—23点这一时段;日常的推新、促销选择在周四——周六这一时间段进行。

1.4 用户留存 Retention

这里主要考察次日留存率、3日留存率和7日留存。可以看到进入12月后,留存率有所增长,表明双十二的预热起到一定效果。

1.5 用户推荐Referral

本项目中的收藏col与加购cart的行为不是相互独立的,都是确定购买buy意向的行为,没有先后之分。因此,从浏览pv、加购cart、购买buy这一路径来简要分析。

从浏览到加购的转化率为2.81%,用户花了大量时间寻找合适的产品。可优化网站筛选、关键词搜索功能,推荐更适合用户的商品,方便用户迅速获取信息。

从加购到购买的转化率约为35.9%。可针对加购未购买产品细分,采用提供优惠券、推荐同款商品等促销方法。

1.6 用户收益Revenue

用户购买次数在1-5次,更高次数的用户很少,整体复购率为52.89%,相对可观,可将运营重点放在培养用户忠诚度上,从质量、价格、服务、物流等方面做出改进,鼓励用户更高频次的消费 

2.商品销售情况

从购买次数,分析商品类别、商品id的受欢迎程度。

成交品类较高的是1863、4324、5232三大类。

按照成交量与浏览量的高低,把商品类别分为四大类。 

pv低buy低,多数商品集中在这一类,商品存在替代性,可增加该类商品的客流量,以提高成交量;
pv低buy高,商品是有竞争力的,可在活动中作为主打商品,提高复购率,同时增加宣传,打开市场、吸引新用户,营造品类口碑;
pv高buy低,购买存在较大随机性,可在商品的描述、价格等方面做出改变,提升商品竞争力;
pv高buy高,用户有较高需求,可提炼商品卖点、精简描述,方便用户更快做出购买决策。

 

3.用户价值,基于RFM模型

仅在会员(购买过商品的用户)范围内,进行价值划分,R/F等级为1-5,由于本项目的数据不涉及M(Monetary),所以只做4类划分。

通过RFM模型,了解每位顾客的特性,实现差异化营销。

重要价值用户,R高F高。经常在网站购物,并形成习惯,做好维护即可。
重要深耕用户,R高F低。这类用户粘性不强,近期有消费行为,可能是针对需要的商品直接下单,不会过于频繁地进行其他商品的浏览、购买。可推荐更符合用户喜好、性价比高商品,吸引其进行购买,逐渐建立消费习惯。
重要唤回用户,R低F高。最近没有购买行为,可以通过短信等场外提醒,引导其入场参与优惠活动,尽快完成下次购买行为。
重要挽留用户,R低F低。该类用户容易流失,占比40.02%,可提升空间大,运营活动可重点针对这部分用户,通过拼团打折、积分兑换、捆绑销售等活动唤起用户注意力,提升用户兴趣。

四、总结

关注活动前后指标数据,优化推荐策略和搜索功能

  • 新增用户的数据不够理想,应观察各渠道的用户获取情况,以及竞争平台近期是否在举行促销活动。
  • 用户的活跃度应该结合平台的活动时段分析,考察是否符合预设目标值,同比环比等。本篇分析发现周末晚间20点-22点是用户活跃高峰期,应针对高峰期进行有效的营销活动,从而更容易触达用户。
  • 用户对推荐商品的满意度不够高,需要优化推荐策略和搜索匹配度,为用户减少搜索和选择的时间,加速完成购买行为。
  • 较多的用户是经过比较长的路径才到达购买页面。可在收藏、加购页面增加更多优惠提醒,精准的发放优惠券、满赠券来鼓励加入购物车的访客提交订单付款成功。还可与其他知名平台合作,加大优惠力度,增加免密支付、极速支付、月付等方式提高下单效率。

针对用户群体特征采取差异化营销

  • 重要价值用户:通过提供优惠回馈性服务和个性化服务,鼓励持续购买的热情。
  • 重要发展用户:在优化推荐策略的基础上逐渐提高忠诚度。如果是新客户,则需要建立关系,提供新人优惠券鼓励消费。
  • 重要保持用户:活跃度低的用户可通过短信等场外提醒来引导其入场参与优惠活动,并提供更新产品来鼓励他们再次购买。还可以鼓励其对之前购买的商品做评价以提高商品热度和可信度。
  • 重要挽留用户:可主动联系客户询问流失原因。可通过促销热点商品、拼团打折、积分兑换等活动唤起用户注意力,提升用户兴趣。

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!