【读书笔记】精益数据分析第一部分
第一部分 别再欺骗自己了
第一部分词云
用wordcloud生成第一部分词云,屏蔽了其中的一些词。
第一部分思维导图
幕布:《精益数据分析》读书笔记
第一部分自考问题
1.作者对本书的定位是?期望我们收获什么?
2.什么是好的数据指标?
3.找出正确的数据指标需要牢记在心的五点?
4.8个需要提防的虚荣数据指标(模式)
5.市场细分、同期群分析、A/B测试和多变量分析
6.什么是虚荣指标,如何规避它?
7.定性指标和定量指标的区别,探索性指标和报告性指标的区别,先见性指标和后见性指标的区别,相关性指标和因果性指标的区别?
8.什么是A/B测试,为什么多变量测试更常用?
9.细分市场和同期群之间的区别?
10.对你所跟踪的数据指标进行评估找出并写下你一丝不苟地遵循并每天回顾的三到五个关键数据,回答以下问题:
❑ 哪些是好的数据指标?
❑ 哪些指标帮助你进行商业决策,又有哪些是虚荣指标?
❑ 你能剔除那些不能为你带来任何价值的指标吗?
❑ 是否存在你尚未想到但可能更有意义的指标?
划掉那些不好的指标,并把新发现的指标加到你的列表里。在阅读本书的过程中,都要坚持这样的思考和行动。
11.唐纳德理论的四个象限的重要应用?
12.同期群?同期群分析?同期群分析的好处?
13.精益画布的九个模块?
11.创业之初,最需要问自己的三个问题?
12.创业者需要避免的数据圈套?
第一章 我们都在说谎
1.创业者尤其容易说谎,所以需要数据进行制衡。数据分析能够避免创业过程中的自欺欺人,辅助决策,实现增长。第一章给了Airbnb的成功例子进行佐证。
2.“精益”是很好的创业方法,“数据分析法”则保证了数据的收集与分析。二者均可从根本上改变你对企业开创与发展的看法。它们不仅仅是一种方法,还是一种思维模式。精益分析思维指提出正确的问题,并重点关注那项可达成你期望结果的关键指标。
3.这本书的定位是希望通过本书,为读者提供一些指导、工具以及证据,从而使数据成为读者创业中的核心竞争力,助读者成功。最终目的就在于教读者如何利用数据更快、更好地创业。
第二章 创业的记分牌
1.数据分析离不开对企业关键指标的跟踪。这些指标与你的商业模式(即营收来源、支出成本、客户数量以及客户获取策略的效果等)有关。
2.对于创业公司而言,之所以进行数据分析,是为了在资金耗尽以前,找到正确的产品和市场。
3.什么是好的数据指标?比较性的、简单易懂的、比率。
一个好的数据指标之所以能改变商业行为,是因为它与你的目标是一致的:保留用户,鼓励口碑传播,有效获取新用户,或者创造营收。
4.找出正确的数据指标需要牢记在心的五点
定性指标与量化指标
虚荣指标与可付诸行动的指标
“活跃用户占总用户数的百分比”(活跃用户占比)。这个指标揭示了产品的用户参与度,因而显得格外关键。
另一个值得关注的指标是“单位时间内新用户的数量”(或“新用户增速”),它对比较不同营销手段的优劣往往很有帮助。
探索性指标与报告性指标
“我们不知道我们不知道的”与创业的关系最紧密;它意味着在一系列探索之后,我们得到了一个能撼动市场的新产品。
史蒂夫·布兰克所说:创业公司应该把时间花在探索并得出一个可扩展、可复制的商业模式上。
数据分析在唐纳德理论的四个象限中都有重要的应用,能够:
❑ 检验我们手头上的事实和假设(如打开率或转化率),以确保我们不是在自欺欺人,我们的商业计划是切实可行的;-我们知道我们知道的
❑ 为业务预测表、瀑布式开发流程图和董事会议提供数据;-我们知道我们不知道的
❑ 验证我们的直觉,把假设变成证据;-我们不知道我们知道的
❑ 帮助我们发现黄金机遇,大展宏图。-我们不知道我们不知道的
先见性指标与后见性指标
先见性指标可用于预测未来。
后见性指标能提示问题的存在,比如用户流失(即某一时间段内离开某产品或服务的客户量)。
创业之初,你所拥有的数据不足以预测未来,这时可以先关注后见性数据。在这个阶段,后见性数据还比较管用,可为你产品的表现提供一个基准。如果要启用先见性数据指标,你需要首先进行同期群分析并比较客户对照组在不同时间段的表现。
一个真正的数据指标必须是可付诸行动的。后见性和先见性的数据都可以指导行动,区别只是先见性数据能预示将来会发生什么,缩短迭代周期,精益求精。
相关性指标与因果性指标
没有足够大的用户样本,对于大多数创业公司而言,你需要尽量简化你的测试,在很小的样本容量下进行试验,并比较这些测试为你的生意带来的改变。
数据分析启示:
了解你的用户;使用定性数据来理解你为用户创造的价值是什么;
5.市场细分、同期群分析、A/B测试和多变量分析
细分市场就是找出一群拥有某种共同特征的人。对群体进行原因分析,找出关键因素,对症下药。
- 市场细分
比如说,通过一系列的技术、人口信息对访客进行细分,然后比较各个细分市场之间的差异。如果有特别多的高参与度,找出原因,利用成功要素复制到其他人群。
- 同期群分析
同期群:相同时间内具有相似或特定属性 /行为的群体。(时间+特定属性)
将70年代出生的人划分为一个群组
同期群分析:将用户进行同期群划分后,对比不同同期群组用户的相同指标就叫同期群分析(不同同期群+相同指标)
eg:70年代出生的人的离婚率
80年代出生的人的离婚率
90年代出生的人的离婚率
5月1日~5月7日的注册用户的次日留存
5月8日~5月15日的注册用户的次日留存
同期群分析(Cohort Analysis)是提高APP用户留存的关键
同期群分析(Cohort Analysis)能帮助我们实时监控真实的用户行为、衡量用户价值并制定有针对性的营销方案
同期群分析(Cohort Analysis)有利于我们更深层地分析用户行为,并揭示总体衡量指标所掩盖的问题。在营销方式和活动效果不断变化的当下,学会运用同期群分析有利于我们预测未来收入和产品发展趋势。
比较不同群体的同期群试验被称为纵向研究,因为数据是沿着客户群体的自然生命周期收集的。
同期群分析主要目的是分析相似群体随时间的变化(比如用户的回访)。
每一组用户构成一个同期群,参与整个试验过程。通过比较不同的同期群,你可以获知:从总体上看,关键指标的表现是否越来越好了。
分析同一时期的用户,可以对比新老客户的表现,在注册后,客户消费的递减量等等。
同期群分析使你能够观察处于生命周期不同阶段客户的行为模式,而非忽略个体的自然生命周期,对所有客户一刀切。同期群分析适用于营收、客户流失率、口碑的病毒式传播、客户支持成本等任何你关注的数据指标。
同期群的概念还可以表现为,根据用户的体验划分数据。根据用户在网店上的“店龄”来划分,如表2-3。
- A/B和多变量测试
假设其他条件保持不变,仅考虑体验中的某一属性(如链接的颜色)对被试用户的影响,就是A/B测试。A/B测试需要用户流量巨大的网站才能进行测试得到答案。如果没有庞大的用户流量,进行一连串的单独测试会延长你走向成熟的周期。与其如此,不如采用多变量分析法同时对多个属性进行测试,其原理为,用统计学方法剥离出单个影响因子与结果中某一项指标提升的相关性。
横向研究指在同一时间段对不同被试群体提供不同的体验。
6.8个需要提防的虚荣数据指标(模式)
点击量。更应统计点击的人数。
页面浏览量(PV值)。除非你的商业模式直接与PV值挂钩(即展示广告),你还是更应统计(访问的)人数。
访问量。
独立访客数。
只能显示有多少人访问了网页,却不能告诉你这些人在页面上做了什么?他们为什么停留?是否离开了?
粉丝/好友/赞的数量。
网站停留时间(time on site)/浏览页数(number of pages)。
用这两个指标来替代客户参与度或活跃度并非明智之举,除非你的商业模式与这两个指标相绑定。而且,它们并非一定能说明问题。比如,客户在客服或投诉页面上停留了很长时间,不见得是什么好事。
收集到的用户邮件地址数量。
更好的做法是:向一部分注册用户发送测试邮件,看他们是否会按照邮件中的提示去做。
下载量。
你需要衡量的是:应用下载后的激活量、账号创建量等等。
7.精益数据分析周期
精益数据分析的核心在于如何找到一个有意义的指标,然后通过试验改善它,直到令你满意;之后,转而解决下一个问题,或步入创业的下一个阶段。最终,你将找到一个可将续、可复制、持续增长的商业模式,并且学会如何迭代它。
第三章 你把生命献给谁
1.精益画布
精益画布是呈现在一张纸上的可视化简明商业计划书,体现你正在进行的、可付诸行动的商业计划。
精益画布是一个规范的框架,能帮你选择和掌控创业过程。
(1) 问题:人们都知道有“问题”存在,可你真正找它了吗?
(2) 客户群体分类:你的目标市场是什么?如何把信息定向传达给特定群体?
(3) 独特卖点:你能以清晰、独特、令人记忆深刻的方式说明为何你的产品更加优异或者卓尔不群吗?
(4) 解决方案:你能为现存问题找到正确的解决方案吗?
(5) 渠道:如何将产品或服务送到客户手中,又如何收取客户支付的款项?
(6) 收入分析:营收来自哪里?交易为一次性营收(直接交易,如购买一份食物)还是常续性营收(间接交易,如订阅杂志)?
(7) 成本分析:公司的直接、可变和间接成本都是哪些?
(8) 关键指标:哪些数据指标能让你了解公司的经营状况?
(9) 门槛优势:什么是你的“力量倍增器”,助你在竞争中横扫对手、所向披靡?
一个创业者如果想要生存下来,产品的需求、打造产品的能力、实现产品的欲望缺一不可。千万别从事自己不喜欢的事业。
巴德·卡德尔用一张极其简单的图概括了人们该如何选择职业
将选择求职的方法应用到选择创业方向上,问问自己是否有能力,是否真的喜欢做这件事,以及最本质的确定是否能赚到钱。
在网站http://leancanvas.com上创建你的第一张精益画布。
第四章 以数据为导向与通过数据获取信息
1.单纯依靠机器的优化与进化具有相似的局限性。如果优化只是为了取得局部的极限,那代价可能是错失一个更大、更重要的机会。人的职责就是在数据优化的背后做个聪慧的设计者。
2.莫尼卡·罗加蒂是LinkedIn公司的一位数据科学家,她根据经验总结出了10条创业者需要避免的数据圈套。
(1)假设数据没有噪声。在分析前先检查数据是否真实、有效、实用。
(2)忘记归一化。
(3)排除异常点。有些影响判断结果的异常点应该被排除。
(4)包括异常点。某些可能具有参考价值的异常点直接被排除是不妥的。
(5)忽略季节性。在寻找规律时未能考虑一天中不同时间、一周中星期几、一年中不同月份对数据的影响,会导致得出错误的结论,导致作出糟糕的决策。
(6)抛开基数谈增长。基数小,注册一个账户也算是用户量翻倍。
(7)数据呕吐。不知道什么重要数据指标,一大堆指标只会让人眼花缭乱。
(8)谎报军情的指标。当你把数据警报的阈值设置的过于敏感,警报就会一直响起,你就会渐渐无视各种异常。
(9)“不是在这儿收集的”综合征。将你的数据与其他来源的数据合在一起能带来很多独到的见解。高质量客户的邮编地址是否集中于寿司店多的地区?
(10)关注噪音。“人类与生俱来的模式识别能力,容易使我们误以为无规律的事物是有规律的,”莫尼卡提醒创业者,“把虚荣指标放在一边,退后一步,站在更高的角度看问题。”
3.精益创业与大愿景
如何平衡直觉和数据分析决策创业公司事务,把精益创业当作达成创业愿景的必经过程。
提醒创业早期的创业者:找到一个可持续的商业模式。