淘宝用户行为分析及用户价值分析报告

淘宝用户行为分析及用户价值分析报告

分析大纲

一、数据理解

二、定义问题

  1. 用户消费行为
    购买漏斗分析:
    日UV?日pv?人均页面访问数?跳失率?用户激活转化率?用户付费转化率?
    用户消费时间分析:
    用户消费活跃时间点?活跃日期?用户行为趋势?
  2. 复购率是多少?
  3. 漏斗流失情况如何?
  4. 用户价值情况?
  5. 商品价值分析?
    最受欢迎的商品?复购率最高的商品?找到商品购买次数、浏览次数、收藏次数和加入购物车次数进入Top20排行榜的商品?商品复购比较高的商品?

三、数据清洗

  1. 数据整理
  2. 删除重复值
  3. 缺失值处理
  4. 数据标准化
  5. 异常值处理

四、数据可视化及分析

  1. 基于AARRR模型进行用户行为分析
    用户角度
    (1)用户总行为漏斗分析
    独立访客数(UV)
    页面访客数(PV)
    人均页面访问数(PV/UV)
    跳出率
    用户激活转化率
    用户行为流失率

    用户行为比例

    用户浏览-购买转化率

    (2)独立访客漏斗模型计算

    用户付费转化率

(3)用户复购率

  1. 不同时间尺度下用户行为模式分析
    (1)分析九天中每天的用户行为
    (2)分析一天内用户每小时的行为
    (3)用户行为趋势分析
    商品角度

  2. 不同商品种类的用户行为

    (1)热度最高的前20个商品

    (2)商品被浏览、收藏、购买、加入购物车排行榜

    (3)购买行为相关分析

    (4)商品购买转化率分析

    (5)商品复购分析

    ​ a. 商品复购排行榜

    ​ b. 商品复购率

  3. 基于RFM模型进行用户价值情况分析
    (1)R-最近购买时间
    (2)F-消费频率
    (3)建立RFM模型

五. 结论与建议

代码实现

python淘宝用户行为分析及用户价值分析.ipynb

数据分析报告

数据集来源于阿里天池数据竞赛数据集。本数据集是天猫2017年11月25日至2017年12月3日用户消费行为记录抽样,即数据集的每一行表示一条用户行为。本次分析选取了前100万条用户行为记录进行分析(行为包括点击、购买、加购、喜欢)。

本次分析通过对淘宝用户行为数据进行分析,通过行业的指标对淘宝用户行为进行分析,其中基AARRR漏斗流失分析进行用户行为分析、基于RFM模型进行用户价值情况分析,从而探索淘宝用户的行为模式并得出结论,为以下问题提供解释和改进建议:

1.分析用户消费行为,通过分析常见电商分析指标,确定各个环节的流失率,找到需要改进的环节;

2.研究用户在不同时间尺度下的行为规律,找到用户在不同时间周期下的活跃规律;

3.对用户群体进行分群,对不同价值对用户给出不同对营销建议。

1.基于AARRR模型进行用户行为分析

从用户角度来分析

(1)用户总行为漏斗分析

独立访问用户数: 9739

页面总访问量(PV): 999530

人均页面访问数(PV/UV): 102.6

跳出率:0%,也就是只点击一次浏览的用户为0个。

用户行为比例:

image-20200408174546388

点击占用户总行为数的89.61%,占行为数据的绝大多数。

用户浏览-购买转化率(商品购买量/浏览量):2.27%。

用户行为转化率:

1
2
3
浏览详情页-(加入购物车+收藏)流失率: 0.9067310827166394
(加入购物车+收藏)-购买流失率: 0.7562817980487221
浏览详情页-购买流失率: 0.9772686671817569

Snipaste_2020-04-08_22-52-35

(2)独立访客漏斗模型计算

共9739位用户,付费用户数为6689,用户付费转化率为68.7%。

(3)用户复购率

用户复购率为66%。《精益数据分析》中提到如果年重复购买率达到60%及以上,则说明公司进入忠诚度模式,应将经营中心放在客户忠诚度上,即鼓励忠诚客户更加频繁地消费,但是这里只有9天的数据分析,数据量较少的情况下不足以直接支撑这个观点。

2.不同时间尺度下用户行为模式分析

(1)分析九天中每天的用户行为

image-20200408175143202

(2)分析一天内用户每小时的行为

image-20200408175155466

可以看到晚上19-23点为用户活动高峰期,这个情况符合人群的休息的时间,人们更加偏好在睡前登录淘宝。

(3)用户行为趋势分析

image-20200408175333004

可以看到12月2日和3日用户点击和加入购物车涨幅最大。这两天是周末,但对比同为周末的11月25日和11月26日,增长明显,因此排除内在因素日期规律,考虑外在刺激的可能性。 了解到2017年在12月淘宝有一个双12活动,并且预热从12月1日开始,可能是由于活动预热导致用户点击和加入购物车活动增多。

从商品角度分析:

3.不同商品种类的用户行为

(1)热度最高的前20个商品

可以看到用户行为最活跃的前20个商品

image-20200408175412335

(2)商品被浏览、收藏、购买、加入购物车排行榜

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
pv前20名商品排行榜
behavior_type buy cart fav pv
item_id
812879 1 13 5 285
3845720 0 4 3 222
138964 1 6 4 221
3708121 1 5 2 193
2032668 2 7 6 191
2331370 0 14 7 186
2338453 3 9 4 180
1535294 7 20 5 169
4211339 0 8 3 166
3371523 0 1 0 161
3031354 7 14 0 159
59883 0 5 1 158
987143 0 8 4 157
3920968 0 7 2 153
862880 0 0 0 153
2818406 0 8 11 151
1591862 0 0 0 148
3563468 7 9 3 147
2367945 0 0 0 145
525953 0 0 0 141
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
buy前20名商品排行榜
behavior_type buy cart fav pv
item_id
3122135 17 7 1 16
3237415 11 4 1 42
2124040 11 0 0 4
2964774 11 7 0 81
4401268 10 0 1 29
1910706 8 1 0 12
3991727 8 2 1 18
1004046 8 4 0 13
5062984 7 5 1 56
3147410 7 3 1 31
4296993 7 0 0 1
121226 7 0 0 21
3189426 7 1 1 41
184189 7 5 1 36
3563468 7 9 3 147
1180858 7 0 0 3
3031354 7 14 0 159
1034594 7 0 0 4
3551756 7 0 0 1
1595279 7 8 0 34
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
cart加入购物车前20名商品排行榜
behavior_type buy cart fav pv
item_id
1535294 7 20 5 169
3031354 7 14 0 159
2331370 0 14 7 186
1636256 3 13 1 25
812879 1 13 5 285
4091349 3 11 6 116
2279428 0 11 8 125
2402579 3 11 3 37
2560262 5 10 4 108
4649427 0 10 2 130
2364679 0 10 8 101
1402604 2 10 3 89
2338453 3 9 4 180
3563468 7 9 3 147
3964583 6 9 2 54
1583704 1 9 7 120
265985 3 9 0 43
2443940 0 9 1 32
1164931 0 9 1 79
344968 1 9 1 27
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
fav收藏前20名商品排行榜
behavior_type buy cart fav pv
item_id
3330337 1 7 11 110
2308741 0 0 11 0
2818406 0 8 11 151
1517532 0 2 9 1
2783905 1 4 9 96
2887571 0 6 9 72
2778083 0 4 8 106
2279428 0 11 8 125
2364679 0 10 8 101
3159978 0 5 8 114
600756 0 2 8 52
2331370 0 14 7 186
2453685 1 8 7 140
1583704 1 9 7 120
2828948 1 5 7 103
3739137 0 0 6 0
448625 0 2 6 45
3814465 0 5 6 46
185319 0 2 6 80
4091349 3 11 6 116

购买量的Top20商品id有:3122135、3237415 、2124040 、2964774、4401268、1910706、3991727 、1004046、5062984、3147410、4296993、121226、3189426、184189、3563468 11、80858 、3031354、1034594、3551756、1595279。

浏览量Top20商品id有 812879、3845720、138964、3708121、2032668、2331370、2338453、1535294 、4211339、3371523、3031354、59883、987143、3920968 、862880、2818406、1591862、3563468、2367945、525953。

对比分析收藏量和购买量可以看到收藏转化为购买的转化率不高。通过观察浏览量排行榜可以发现浏览量排名高的商品最终购买转化率并不高,购买量都为个位数,甚至有些购买量为0,这就需要考虑这些产品是不是占用了流量资源。这里的数据日期是在11.25-12.3日期间的,这些浏览量高购买量却不高的产品有可能是为双十二囤货预热,所以不能直接将这些产品是不是归类为占用了流量资源,应该结合加入购物车和收藏率来看这些数据一定程度上这里的数据可以说明用户对这些产品感兴趣,所以应该对这类产品进行部署营销策略,想办法提高转化率。而另一方面购买转化率高的商品浏览量却没有很高,需要对这些凸显出问题的产品进行调整。

(3)购买行为相关分析

商品浏览量和购买量相关分析

image-20200408175608460

商品收藏和购买相关分析

image-20200408175632039

商品收藏和购买相关分析

image-20200408175704174

进一步地,从散点图可以看出,大部分商品点击量和购买量都比较低,有一定的相关性,同时发现点击量大但购买量小的商品较多,即偏右中的点,存在特殊离群值即浏览量高购买量低、购买量高浏览量低的情况,对这两种情况的商品应该加以关注,寻找原因。对浏览量高购买量低的商品应该重点关注,因为浏览量高购买量低产品消耗了巨大的流量但没有转化,这是一个严重的问题。但是,这里的数据日期是在11.25-12.3日期间的,对这些浏览量高购买量却不高的产品也有可能是为双十二囤货预热,一定程度上这里的数据可以说明用户对这些产品感兴趣,所以应该对这类产品进行部署营销策略,想办法提高转化率。另一方面对购买量高浏览量低的商品加大推广力度,比如通过重新考虑宝贝标题、将商品放到合适的位置等操作提高这些商品浏览量。

(4)商品购买转化率分析

品牌点击-购买转化率Top20排行榜

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
品牌点击-购买转化率Top20排行榜
behavior_type buy cart fav pv top_transfer
item_id
3122135 17 7 1 16 1.062500
2124040 11 0 0 4 2.750000
3237415 11 4 1 42 0.261905
2964774 11 7 0 81 0.135802
4401268 10 0 1 29 0.344828
1910706 8 1 0 12 0.666667
1004046 8 4 0 13 0.615385
3991727 8 2 1 18 0.444444
3551756 7 0 0 1 7.000000
4296993 7 0 0 1 7.000000
1180858 7 0 0 3 2.333333
1034594 7 0 0 4 1.750000
1095113 7 7 0 16 0.437500
121226 7 0 0 21 0.333333
3147410 7 3 1 31 0.225806
11517 7 5 0 32 0.218750
1595279 7 8 0 34 0.205882
184189 7 5 1 36 0.194444
3189426 7 1 1 41 0.170732
5062984 7 5 1 56 0.125000

以购买量和购买转化率为排序指标,得到Top20的商品转化率排行榜,这些转化率高的产品可以考虑加大推广力度和搜索。比如放到合适的位置如店铺主屏,吸引更多用户点击,进一步提高购买量和销量。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
品牌点击-(收藏+加入购物车+购买)转化率Top20排行榜
behavior_type buy cart fav pv Cart_Fav_buy_transfer
item_id
1517532 0 2 9 1 11.0
3551756 7 0 0 1 7.0
4296993 7 0 0 1 7.0
3765807 4 2 0 1 6.0
4888961 0 6 0 1 6.0
3485113 2 3 0 1 5.0
3116097 2 3 0 1 5.0
1645555 1 4 0 1 5.0
4528741 1 1 3 1 5.0
4232657 0 5 0 1 5.0
2641905 5 2 1 2 4.0
855191 4 0 0 1 4.0
2829426 2 2 0 1 4.0
3931489 2 2 0 1 4.0
2337513 2 2 0 1 4.0
123444 2 0 2 1 4.0
1602360 1 1 2 1 4.0
2679327 1 1 2 1 4.0
3321180 1 2 1 1 4.0
374553 1 2 1 1 4.0

以购买情况和【收藏+加入购物车】转化情况为排序指标,得到品牌点击—【收藏+加入购物车+购买】转化率Top20排行榜。在双十二活动前,这些商品可以作为提高购买转化率的重点关注商品,因为从【收藏+加入购物车】到最终购买流失率更低。这些转化率高的产品很大程度上能够说明在大概率上容易得到客户认可,那么在提高曝光量的同时可以考虑通过客服直接推荐等方式达到最终提高成交量的目的。

1
2
3
4
5
6
7
8
9
10
11
12
13
top10潜力商品排行榜
behavior_type buy cart fav pv potential_index
item_id
812879 1 13 5 285 285.000000
138964 1 6 4 221 221.000000
3708121 1 5 2 193 193.000000
2032668 2 7 6 191 95.500000
2338453 3 9 4 180 60.000000
1535294 7 20 5 169 24.142857
3031354 7 14 0 159 22.714286
3563468 7 9 3 147 21.000000
2453685 1 8 7 140 140.000000
4443059 3 5 2 134 44.666667

以浏览量除以购买量为指标来看潜力商品,我们看到浏览数最高的商品为812879,但是购买量很少,转化率很低,说明这些吸引用户更多注意力的商品没有很好的转化为实际销量,还有很大的优化空间。

(5)商品复购分析

​ a. 商品复购排行榜

image-20200408213231341

​ b. 商品复购率

1
2
3
被用户购买过的商品: 756047
被用户购买超过一次的商品: 133913
商品复购率 0.17712258629423833

image-20200408213214628

在本次统计的数据中,只购买一次的产品有4429种,购买超过两次的产品有2260种,商品中用户购买的共有6689种商品。大多数用户消费1次,购买一次的商品占到66.21%,说明商品售卖主要依靠长尾商品的累积效应,而非爆款商品的带动。

4.基于RFM模型进行用户价值情况分析

由于数据集里没有用户购买金额数据,因此通过 R 和 F 的数据对客户价值进行打分。根据打分将客户分层为价值客户、发展客户、保持用户、潜在用户。

image-20200408213549345

价值客户:近期交易的高频率用户占比28.99%。对于高价值客户采取一些客户关怀活动,频率不要太过频繁,这部分是平台忠实客户做好维护;

保持客户:无近期交易的高频率用户占比0.33%。针对这群近期没有消费过,有可能发展为流失的重要客户,需要做好客户的唤回,通过发一些电子优惠券之类的营销活动吸引用户回来;

发展客户:近期交易的低频率用户占比69.19%。发展用户这个群体具有巨大的潜力,针对这个群体平时推荐常浏览的同类商品,提高用户购物频率,转化成忠诚用户;

潜在/挽留客户:无近期交易的低频率用户占比1.5%。考虑到这部分客户很有可能是已经或者即将流失的客户,需要找到流失原因,尽可能挽回这部分客户,并且应对有相似特征的群体进行预警,针对其原因进行改善。

建议

这里我调研了一些资料,结合自己的理解给出了一些建议。

1.通过AARRR模型分析用户使用的各个环节提出建议

第一环节:用户获取(Acquisition)
1)充分利用站内资源
淘宝平台有各种活动比如双十一、双十二、女王节、生活节等等,站在本次数据集11.25-12.3的这个时间节点分析,可以抓住双十二活动拓展页面浏览去获取用户(流量)
2)跨行合作
异业合作获取流量,通过不同行业的互补,将营销活动渗透到站外的用户群。跨界合作能为平台对外扩展,获取更多外部流量。
3)产品功能辅助流量增长
“周期长、品类多、阶段性主推”这往往是电商大型促销活动的特点。可以通过淘宝产品的功能比如预售预约提醒、分享好友获取奖品、优惠券等方法让用户在每个时间段内都能回流。

第二环节:用户激活(Activation)
那么如何提高用户活跃度呢?可以考虑通过以下方法:
1)促销力度+噱头玩法
对于现在商品满减优惠券满天飞的电商环境里面,顾客视乎是已经熟视无睹,甚至有点麻木,所以这时候更需要配合一些噱头玩法,才能增强用户占便宜的心理。
比如:
新用户专属福利:开启新用户身份识别,上线仅新用户可见的超低价商品,如新人1元包邮等,可有效转化新用户。
秒杀的氛围:即“限时低价”,将其氛围做足,迫使用户快速下单。
2)精准推荐系统
根据浏览的历史,推荐喜欢的内容,淘宝有猜你喜欢和主屏推荐区。
通过将这个功能模块加入营销活动中,可以个性化地推介用户感兴趣的商品,增强商品转化。据估计,该模块的成交可以占到整个卖场成交的10-20%之间,不容忽视。
3)商品精细化运营
货品应当是一个动态调整的过程,让用户的成交情况来决定商品的去留,这需要运营实行商品的赛马机制,做好实时数据监控,不达标的商品及时更替,也可以保证转化率的提升。

第三环节:用户留存(Retention)
1)针对大型促销活动
基本都会划分为三个阶段:
预热期:预约造势,通过sns、定金裂变等玩法吸引用户关注
正式期:前面如果证实是好的激励体系,可以让活动健康持续发展
高潮期:进一步引爆高潮,使用的激励方式,成长值会员体系、签到体系、积分任务体系等
2)把握促销节奏
就双十二而言,其促销节奏分为两个维度:价格以及品类。总之将两个唯独结合,让用户在任何时间看到促销页面,提高用户的回访率。

第四环节:用户收益(Revenue)
把有限的推广资金用在刀刃上。
1)优惠券
精准投放:根据用户购买属性圈定偏好品类,定向发放优惠券。(基本电商都有实现) SNS游戏发卷:在优惠券使用日期开始前推送信息,让用户及时跳转券购页形成精准转化。
高门槛优惠券:券的使用门槛需要比平台/品类客单价高一点点。
2)满减策略
引导顾客多购买别的商品。
对比普通促销全场商品5折的做法使用阶梯促销满减:199减100;399减200;599减300,通过这种方式刺激用户凑单,增加销售额。

第五环节:用户传播(Referral)
提高K因子,即提高用户传播的次数和被传方的转化率。可以通过一系列的奖励机制刺激用户分享和传播,帮助活动或者商品获得更多的曝光。

2.通过RFM模型进行用户分层提出建议

由于数据集里没有用户购买金额数据,因此通过 R 和 F 的数据对客户价值进行打分。根据打分将客户分层为价值客户、发展客户、保持用户、潜在用户。针对不同价值的客户,应该采取不同的业务策略,有针对性的进行业务突破,具体的建议如下所示:

针对价值客户:该群体的用户特征是最近有买过,购买次数多。针对这个客户群体需要进行重点维护,可以考虑的业务策略有进行VIP服务,个性化精准推荐营销,可以给与更多的优惠和VIP特权等;

针对发展客户:该群体的用户特征是最近有买过,购买次数少。针对这个客户群体需要刺激客户购物,可以考虑提供积分会员,唤起客户的购物热情;

针对保持用户:该群体的用户特征是最近没有买过,购买次数多。针对这个客户群体需要进行唤回,因为有可能发展为流失的重要客户。可以考虑信息推送,以之前购买商品作为引导进行唤回;

针对潜在/挽留客户:该群体的用户特征是最近没有买过,购买次数少。针对这个客户群体需要进行挽留。针对重要挽留客户除了普通的推送召回,可以采取电联的方式,提高留存率,并给予一定的优惠,如客户回归优惠,礼包等;针对潜在客户可以考虑以普通的促销折扣,召回方式来维持此类客户,由于该类客户的价值最低,理论上可以分配较少的资源。

作者

terese

发布于

2020-04-04

更新于

2022-10-05

许可协议