利用python可视化分析优衣库销售数据分析报告
优衣库是经营休闲、运动服装设计、制造和零售的日本公司,由柳井正创立。定位为“快时尚”的优衣库。目前为全球知名服装品牌之一,除了日本之外目前在全球十七个地区展开业务。线上线下融合营销,反常规O2O模式深得用户心。
分析总思路
一、定义问题
数据分析框架:5W2H
1.who:顾客群体分布?
2.when:整体销售情况随时间变化情况?什么时候销售量更多?
3.what:什么产品销售量最好?不同产品的销售情况?
4.where:顾客主要分布区域?
5.why:为什么存在这些情况?
6.how:顾客偏爱哪一种购物方式?
7.how many:挣了多少钱?利润是多少?
相关分析:
销售额和其他变量的关系
年龄和销售额的关系
销售额和产品成本之间的关系
二、数据处理
数据表清洗
数据预处理
数据分组
三、数据可视化及分析
1.who:顾客群体分布
客户年龄阶段分布
客户性别比例
探究性别和产品销量、销售金额的关系
2.when:整体销售情况随时间变化情况?什么时候销售量更多?
探究销售金额和购买时间的关系
探究购买产品数量和购买时间的关系
探究顾客人数和购买时间的关系
3.what:什么产品销售量最好?不同产品的销售情况?
对比分析不同产品的产品销量
对比分析不同产品的销售总金额
4.where:产品销量和销售金额与地域的情况?
对比分析不同城市销售额的情况
对比分析不同城市销售量情况
5.why:为什么存在这些情况?(即每个问题后的小结)
6.how:顾客偏爱哪一种购物方式?
探究不同性别对线上线下购买方式的偏好
探究不同年龄层对线上线下购买方式的偏好
探究不同城市对线上线下购物方式的偏好(对比销售量)(对比销售额)
7.how many:挣了多少钱?利润是多少?
营收情况:销售总金额、订单总数、售出产品总数量、单笔订单平均销售金额、单个产品平均单价
单个产品利润分布情况
全部产品成本分布情况
销售产品的利润分布情况:
1.探究不同城市销售产品的利润情况
2.探究线上线下销售渠道销售产品的利润情况
相关分析
探究销售额、利润、产品成本之间的相关性
探究不同城市和门店中成本和销售额的相关性
四、总结和建议
代码实现
数据分析报告:
1.who:顾客群体分布?
客户年龄阶段分布:
客户性别比例:
性别和产品销量、销售金额的关系:
优衣库的顾客女性比例是64.1%,女性在产品销量、销售金额是男性的两倍。
2.when:整体销售情况随时间变化情况?什么时候销售量更多?
销售金额和购买时间的关系:
购买产品数量和购买时间的关系:
顾客人数和购买时间的关系:
从图中可以看出,无论是销售量,销售金额还是顾客人数,周中的都是比周末要多,但考虑到一周七天中只有两天是周末,平均来看,周末的日均销售情况是更好的。这是正常的情况,周末是大众的休息时间,更有空购买衣服。
3.what:什么产品销售量最好?不同产品的销售情况?
1 | 不同产品的产品销量、销售总金额情况,quant:购买的产品数量,revenue:销售金额 |
对比分析不同产品的产品销量:
对比分析不同产品的销售总金额:
通过看各个商品种类的平均销售额和交易次数分布图,可以看出 T 袖占了主要份额。T恤,当季新品,配件无论在销售量和销售额上分别位列第一第二第三位,这之外的袜子、短裤虽然销量大于其他几种产品,但由于其单价比较低,在销售额中反而垫底。袜子、短裤应该是实行了薄利多销的策略。
4.where:产品销量和销售金额与地域的情况?
1 | 不同城市的产品销量、销售总金额情况,quant:购买的产品数量,revenue:销售金额 |
对比分析不同城市销售量情况:
对比分析不同城市销售额的情况:
深圳、杭州、武汉的销售量和销售额都高于其他城市,分别是一、二、三名,看起来销售情况更好。这些城市的人群可能对优衣库认可度更高。
5.why:为什么存在这些情况?(即每个问题后的小结)
6.how:顾客偏爱哪一种购物方式?
探究不同性别对线上线下购买方式的偏好(对比销售量):
探究不同年龄层对线上线下购买方式的偏好(对比销售额):
购物方式有线上线下两种,我们从顾客的性别,年龄层,所在城市分析其购物偏好方式
1.从性别的角度看,无论男性还是女性都偏爱线下的直接到门店购买,而其中女性的消费在金额和数量上都比男性多很多
2.从年龄的角度看,无论哪个年龄层都偏爱线下直接到门店购买,优衣库的线上和线下交易量都主要集中在 25-39 岁之间,他们的消费情况高于其他年龄层。这部分顾客的线上交易额都远高于线下。
探究不同年龄层对线上线下购买方式的偏好(对比销售量):
探究不同年龄层对线上线下购买方式的偏好(对比销售额):
探究不同城市对线上线下购物方式的偏好(对比销售量):
探究不同城市对线上线下购物方式的偏好(对比销售额):
可以看到没有深圳、杭州、成都、北京、南京的线上数据,可能是数据缺失,需要确认数据来源是否可靠。城市上,深圳、杭州的线下销售量和销售额都远高于其他城市。重庆、西安、上海线下交易远高于线上交易,猜测是这些城市门店较多,线下购物十分方便;武汉线上购买和线下购买二者几乎持平;广州很特别,更偏向网上下单然后门店自提的方式,线下的购物消费情况是线上的一半。大致得出结论,广州的顾客更偏爱线上购买优衣库的商品,武汉的顾客线上线下几乎没差别,而其他几个城市都更喜欢线下购物。
7.how many:挣了多少钱?利润是多少?
销售情况:
1 | 销售总金额: 3556433.51 |
通过计算得到,销售总金额约为36万,订单总数量为4万多,单笔订单平均销售金额为96.6元,单个产品平均单价为 85.9元
全部产品成本统计分析:
1 | count 22292.00 |
单个产品利润分布情况:
毛衣、配件和裙子的平均利润远高于其他商品,t 恤以较低的利润贡献了最大的销售额。 T 恤的销量最高,单件利润集中在 0-100 元之间,应该是优衣库利润的中坚力量。
相关分析:
销售额、利润、产品成本之间的关系?
显然,产品成本和产品单价成强正相关;产品单价和利润成强相关性;销售额和利润的关系从热力图中可以看出来相关关系呈正相关,且相关性比较强,成本与销售额也是成正相关越高越高,销售额越高,但相关关系并不是非常强;而利润和成本之间的相关关系是最弱的。
不同城市销售产品的平均利润情况:
线上线下销售渠道销售产品的利润情况:
探究不同城市和门店中成本和销售额的相关性:
四、总结与建议
利用python可视化可视化分析整体销售情况(包括产品销售数量、销售金额、顾客人数等)与时间(周中和周末)变化的关系,分析不同类别的产品的销售情况,得出配件销售数量最多,毛衣销售额最高的结论,提出适当增加配件库存量的建议。
从用户角度分析,优衣库的顾客女性比例是64.1%,女性在产品销量、销售金额是男性的两倍。从年龄层看,优衣库的线上和线下交易量都主要集中在 25-39 岁之间,说明优衣库的购买主要人群25-39 岁的人群,这部分顾客的线上交易额都略高于线下;而 40 岁以上的顾客,线下交易数量远远大于线上。还能看到女性和男性都普遍喜欢线下交易,但线上交易的销售额都略高于线下。因此优衣库产品主要人群为25-39岁客户,多为女性。
从购买时间看,无论是销售量,销售金额还是顾客人数,周末的日均销售情况更好。周末是大众休息的时间,所以日均销售情况更好。
从不同地区来看,深圳、杭州、武汉的销售量和销售额都高于其他城市,分别是一、二、三名,看起来销售情况更好。这些城市的人群可能对优衣库认可度更高,也有可能是优衣库在这些城市业务更广,门店更多。
从顾客购买方式偏好来看,线下交易数量远远大于线上,但整体消费金额不及线上。无论哪个年龄层都偏爱线下直接到门店购买。广州的顾客更偏爱线上购买优衣库的商品,武汉的顾客线上线下几乎没差别,而其他几个城市都更喜欢线下购物。据此提出提升线下门店购物体验,比如货物陈列以促进消费或简化线上购物流程等。
从影响销售额因素相关分析来看,产品成本和产品单价、产品单价和利润、销售额和利润成强正相关。成本与销售额也是成正相关越高越高,销售额越高,但相关关系并不是非常强。利润和成本之间的相关关系是最弱的。
从产品销售情况来看,销售总金额保留一位小数为35.6万,订单总数量为4.1万 ,单笔订单平均销售金额为96.6元,单个产品平均单价为 85.9元。分析产品销售,其中 T 袖占了主要份额。T恤,当季新品,配件无论在销售量和销售额上分别位列第一第二第三位,这之外的袜子、短裤虽然销量大于其他几种产品,但由于其单价比较低,在销售额中反而垫底。袜子、短裤可以实行了薄利多销的策略。通过分析发现亏损商品主要来源于牛仔裤和毛衣,T 恤为优衣库利润的中坚力量。
利用python可视化分析优衣库销售数据分析报告
https://teresesong.github.io/2020/03/21/2020-03-21-python可视化分析优衣库销售数据分析报告/