数据分析师八大能力培养

今天开始看 天善学院,数据分析师八大能力培养

https://edu.hellobi.com/course/272/lessons

这个课程感觉很不一样,不讲工具技术的使用,更多的是从企业角度观察数据分析这个岗位。

以下是零碎笔记,内容已经打散重组。

前置知识 #

给出一句话,一个场景:“这些7分的90后太拽了”。

这是评价,是感受,不是结论,而且不客观。没有来源,没有采集方式,没有评价标准。

从Data到DataAnalysis #

什么是数据:

  • 有数据来源。才哪里来
  • 有采集方式。如何搜集。
  • 有记录格式。如何记录,单位,字段。

因为现实生活中获取真实数据需要花费很大成本,或者不可行,所以要利用技术,利用业务手段去找出规律,预测和总结。

数据分析是一个: 假设-检验-总结-再假设的过程。 数据分析的本质,是把思维建立在事实基础上,通过分析和推理接近答案。

从DA到DA岗位 #

简单说:

  • 数据分析有用
  • 不是所有企业都需要分析师岗位,数据分析师多有用取决于岗位产生的价值
  • 技能不是关键,分析产生的价值是关键

要了解数据分析在企业的应用,从企业部门说起。

必要性。举例,如果超市要做策划,需要考虑很多问题,策划,系统,供应,业务,宣传等。其中用到数据分析。

数据分析的价值。学习数据分析技能,比如 esp(excel sql python)是一个人的事;从事数据分析师一群人的事,需要理解和谁打交道,要做什么工作。

之所以叫数据分析部门,而不是esp部门,是因为不光是跑数的问题。数据分析的价值是作用决定,而不是技能决定的。

企业不需要esp,需要的是钱:现在的,未来的,包括融资等。相比之下,产品完成之后,销售,营销,供应链,运营才是企业真正关心的问题。

数据分析是企业的刚需,数据分析岗位不是。所以很多传统企业,数据分析岗位是附在某些部门下面,比如销售部门的数据分析,运营部门的数据分析,负责各方数据。

数据分析的工作地位,是岗位发挥的作用决定的。比如:

  1. 公司本身是计算广告行业,岗位就是产品
  2. 辅助其他部门,降低成本,提升利润。推荐系统,外呼系统等
  3. 岗位服务其他部门,去争取资源,减少负担,减轻责任,一个中立的岗位
  4. 按照需求表,跑数据

数据分析就像是给企业看病。有病人,有医生。

病人有的理解配合,有的不配合不尊重数据分析。 医生有的崇拜模型,算法狂热,大数据迷信。不考虑实际情况,只要数据资源。有的知识摆指标,不分析问题。

反例,增长黑客的AARRR,五棍流。经典名言: 运营就是一句话,AARRR够啦 开场插起五根棍,哪根短了就搞他 新客少了狂派券,活跃不足转盘拉 要是手头没经费,写篇文案忽悠下

数据分析是一套组合拳,想解决问题要先理解问题,不要着急翻书,不着急建模。

到底哪八大能力 #

岗位需要的八大能力,也就是接下来的章节:

日积月累:搜集信息,理解业务背景

分析前: 把问题转化为需求,定义问题选择方法

分析过程:梳理流程,认清现状。明确评判标准。寻找问题解决问题。评估方案给出建议。

分析总结: 阶段性汇报

岗位要做的四大基本工作

临时性取数,报表,专题分析,建模

课程五个案例

销售,活动策划,用户运营,小贷风控,企业招聘案例。感受数据分析如何助力业务,帮助决策。

推荐了 人人都爱数据科学家Python科学实战

1 搜集信息能力 #

不同岗位负责不同业务 #

理解业务是最重要的基础。不同岗位负责业务不同。

业务能力等级 #

业务能力的等级:

  • 理解。理解业务

  • 操作。动手操作一遍

  • 设计。针对需求设计流程

  • 创新。对现有流程进行改进

  • 创造。创造不存在的东西

理解业务 #

分析师到理解就可以了,不需要过于深入。

要避免的误区:一定要下场。看机器学习,不需要懂业务,只需要懂代码。

  • 为什么不需要下场。做得好不等于分析的好。比如帮助销售,关注的是销售计划,fab,工具使用等。
  • 不理解业务,入门都入不了,给不出专业建议
  • 技术手段也不是万能药。模型,3w神经网络,回归模型,sql等高阶知识,期望值高受挫越大

如果不懂业务,可能会出现一些场景:

客户订单客单价。看销售业绩昨天没达标,原因是客户少。

经典废话,一线工作人员销售看得出来,业绩结果对分析师来说是数字,对销售来说就是钱。

别人买的好,爆款。

销售也想卖,但是没货,没库存。

客户少,做客单价。

为啥人少,能卖就不错了,价高成交率下降。

最终,分析师只是一个跑数工具,没有专业性,对业务没有帮助。工作是理所应当的。

如果不懂业务,进行数据分析会有坑:

案例,卖运动服,运动休闲款,怎么推演需求场景。

没有数据,要采集数据。比如:除了销售数据,还有什么字段。分场景广告有没有跟踪,顾客留言,特定的柜台合作渠道有没有差别。可不要只有pos机流水数据。要根据线索,采集信息,工作才能开展。

案例,互联网金融公司,想引入数据分析,介入人工智能客服,提升客服效率。

三问:客服有销售任务吗。客服有多少人。客服考核kpi是什么。要理解业务模式,如果不是能挣钱的部门,维护产品核心部门,都倾向于降低成本投入。工作的价值要抵得上降低成本的回报。

案例,手机销量受因素影响,做一个综合模型预测备货。

因为市场部权限高,预测不准随意修改了指导方案。给市场部看到,市场部可以提意见但是要留字据。要理解组织架构,分析部开发部知识一个小部门话语权不高。

单纯数据分析岗,碰不到业务,业务知识不会有人教,这需要从业经验积累。

看业务只能看到结果,广告,销售过程看不到。

直接沟通,业务部门和分析师的关注点不同。业务部门说出来的不一定是你关注的。

所以,必须要自己懂业务。

如何懂业务 #

关注:

  • 哪些业务流程会产生数据。
  • 哪些业务流程会使用数据。
  • 哪些业务流程会影响数据。

理解了数据的来源才能分析。

了解了业务用途才能方便助力。比如做销售计划,使用哪些话术

了解业务效果,才能形成分析思路。比如销售改不了价格,靠话术和技巧,完成任务需要毅力和技巧,需要外貌好看等,找到更多指标。为什么银行柜台需要100w存款,筛选家庭背景好的。

谁(业务部门) 做什么(主要业务动作) 有什么(产生什么数据) 看什么(哪些环节需要数据) 为什么(哪些行为对数据有影响)
业务部门1

以下零碎笔记

理解业务的起点,了解最基础的业务形态

  • 甲方
    • 互联网,找大厂。产品,运营,市场,开发。数据。
    • 传统企业,自身集中核心业务。销售,市场,财务,营运。
  • 乙方。数据分析师核心地位
    • 服务,服务咨询,it咨询,财务调研广告
    • 产品。crm,erp,bi,舆情

要克服不想,不敢沟通的心态。

理解业务的七步成诗法

  1. 业务模式。摸清业务模式,照猫画虎,挣得什么钱。
  2. 四大角色。储备知识,深入讨论的基础。
    1. 产品
    2. 渠道
    3. 用户
    4. 运营
  3. 部门。突破的关键看看请谁,为什么,提这个需求。这些部门kpi是什么,这是工作的核心动力。
  4. kpi。突破的关键看看请谁,为什么,提这个需求。

以经验换情报,锁定部门和kpi,围绕困难点,切磋思路,挖掘真实需求。

理解业务模式

我们挣得什么钱,挣钱模式差异,决定了业务模式的差异。

  • 现金公司。销售产品和服务,卖一份产品,挣一分钱。关键:销量 收入 毛利
  • 圈资金。做产品是为了融资,上市套现。关键:市场潜力,增长速度,估值
  • 骗现金。没有明确的产品,忽悠下家加入。

大部分传统公司都是赚现金公司:

  • b2b 产品服务
  • b2b2c 商场
  • b2c 耐用 快消

现金关注利润。

  • 利润=收入-成本

  • 收入=客户*付费率*客单价

  • 成本=生产成本 销售成本 营销成本 运作成本

  • 提升收入,增加客户数量,高端客户,增加频次

大部分互联网公司是圈资金企业:

增长速度,用户趋势,业务前景,预期收益

关注的是成长:

  • 整体市场空间,占有率,集中度
  • 成长速度,成长质量 用户量 活跃率 转化率
  • 技术壁垒 人才资源 用户池

利润知识一个指标,所以补贴烧钱。

目前,多种模式结合。要理解这种复杂的商业模式,要关注部门的任务。比如腾讯的那个部门,kpi是什么

四大角色

名称可能不同,但角色是有的:产品 渠道 用户 运营。

为什么要理解四大角色:

深入理解业务,弄清任务和分工。

产品看什么:

  • 设计前
    • 有哪些新的需求。有哪些改进点有哪些优化点
    • 同一个产品,分析重复购买和使用量。
    • 多个产品,交叉购买分析
  • 设计中
    • 概念 功能 规格 体验等一系列测试
    • 市场调查,产品测试,了解实物产品使用,体验情况
    • 互联网产品访问行为分析 abtest
  • 设计后
    • 商业效果 销量
    • 市场反馈 口碑
    • 预期实现 用户群
    • 热销榜

一个产品有三类数据: 标签数据,销售数据,使用行为数据

影响产品表现的分析切入点:

  • 长期。用户群体洞察:产品线布局
  • 中期。单品竞争力: 功能 设计
  • 短期。营销和运作:营销包装 渠道支持 宣传配合

渠道。

销售,商务,新媒体广告位等。

为了更好地卖,需要

  • 选择更好的渠道,优化渠道组合
  • 寻找标杆,培养队伍,复制经验
  • 激励士气,鼓舞人心
  • 监督执行,检查效果,末尾淘汰
  • 重奖成功者

渠道有什么

  • 建立接触点。位置标签,销售线索来源从哪里来
  • 展示产品。门店陈列,装修风格,网络广告
  • 促成交易。话术,网络推广词,落地页
  • 跟进订单。跟进数量,时机,跟进形式标签,成果

关注业绩,拆分业绩。 客户数,转化率,客单价。

进行销售分析,做什么,做多少,做到没有。

用户。

产品服务的使用者。

用户消费。首次消费,重复消费

用户转介绍。口碑传播,带动消费

用户互动。线上,线下互动。

用户有什么:

  • 企业用户
    • 企业规模,经营状况,资金情况
    • 需求部门,需求周期,预算范围
    • 采购流程,采购周期,决策机制 比价标准
    • 合同流程 履约情况
  • 个人用户
    • 物理特征 性别 年龄 地域
    • 社会属性,家庭 婚姻
    • 职业特征,从业 收入
    • 需求特征,消费品类 消费习惯

然而,法规保护,个人不想提供。比如换一个身份购买。

用户数据怎么采集,很难:

  • 用户自己填。老子打死不填。可以提交给服务窗口
  • 渠道来填。怎么有利怎么填,数据不真。不会产生直接利益,自己人也会图省事。保留服务记录
  • 第三方提供。合法的无所谓,有用的都犯罪。通过联盟合作授权获取,和渠道合作。花钱买数据
  • 采集数据。爬虫抓取。犯法。花钱买数据,比如填信息给额度优惠。
  • 网站埋点。幸存者偏差,比如优惠吸引,用户围绕优惠互动,没有优惠就流失了,不是正常用户。记录用户行为

所谓大数据,都是运作出来的。比如银行知道你的流水,蚂蚁花呗就不知道。

对数据分析的启示

  • 好数据是运营做出来的
  • 多和渠道 运营沟通合作,相互帮助,提升数据质量,比如接待时候就打好标签。
  • 不要迷信数据,要把问题缩小到用数据解决的范围内

用户分析切入点

做好用户分层,打标签。

  • 潜在客户。低潜力,高潜力
  • 客户。低价值。高价值。生命周期。互动频率。响应度

认识用户的忌讳:

  • 把自己当用户。我体验发现xxx
  • 把客户单该用户。比如小孩想买,家长不给买,爷爷奶奶偷着买,要考虑复杂决策的场景
  • 把想象当成用户。想象中用户是xx品味和阶层
  • 把id当用户。客户喜欢一次买两瓶。是因为新顾客买两瓶立减。

运营。

帮产品做商品管理,产品运营。改善产品体验,优化使用过程。

帮渠道销售前宣传,品牌推广打响知名度,提升档次。销售中,促销吸引购买拉动业绩。售后,小恩小惠提升忠诚度,促进持续消费。

帮用户。提供服务窗口,线下售后服务中心专卖店。线上服务号,app,网站,社群

不同部门,不同服务对象的运营。负责用户 产品 销售。

总结就三件事:

  • 传递信息,能直接推送到用户。
  • 拉动业绩,促销资源。
  • 服务用户,能用户互动。

做好三件事,需要考虑的因素:

  • 用户群特征和需求。用户画像
  • 接触用户的渠道或者用户行为路径,事件节点和机会点。用户行为
  • 响应和转化。用户行为
  • 传递信息:题材和文案包装。拉动业绩:促销方案和方式。服务用户:服务内容。方案评估

大量的分类标签

  • 传递信息。
    • 话题 风格 投放时机 阅读行为标签
  • 拉动业绩
    • 产品动销标签,活动时机,活动主题,促销形式,促销偏好
  • 服务用户
    • 用户分级,需求偏好,行为偏好,行为预测

看什么,和任务有关

  • 传递信息
    • 信息到达率,响应率。知名度,美誉度
  • 拉动业绩
    • 短期业绩提升
    • 长期业绩提升
    • 成本控制
    • ROI
  • 服务用户
    • 用户数量
    • 用户使用率
    • 用户满意度

这三类培训都是专门的课,比如逼格高的文案课。拉动业绩。现场培训

分析指标,标签库,不同的模型

总之,理解业务层面,要了解业务流程。

组织架构和kpi

如何认识组织架构。在岗最简单,看钉钉 oa啥的

不管名字怎么变,找到对应的角色。

入职,了解信息搜集能力。

入职了就内部观察。

面试,打标。

业务模式,可以自己走

  • xxx 行业 十大品牌,找到同行
  • xxx行业 盈利 收入 投资情况,赚什么钱
  • xx行业 发展问题
  • xx行业 201x 展望
  • xx行业 机遇

了解到行业在面对什么,经历什么,看到专有名词就记下来,逐个攻破

入职之后,尽快搞清架构图。如果能接触到监控报表,经营图标,搞定kpi,至少搞明白本部门kpi

从讲的上话的人搞起,搞清楚kpi,做什么。

表中的部门搞清楚。

如果能接触到数据库,看数据是由哪些系统产生的,需求方式谁,使用人事谁,反推业务流程产生什么数据

数据字典,功秋万代。

报表,日报。

还没入职,面试。靠猜,了解业务模式。

自己走一遍流程。

针对渠道的的: 门店,app走起,天猫走起

针对运营的: 服务号,公众号,微博

针对产品的,现场体验,看看身边的使用者,上门

沟通需要过程,设立一个进度表。慢慢推进。

行业特点,运作方式,行业基本数据,排名,走势

企业特点,已经发生的公布的数据 政策 行动

以上是公开的

行业的经营数据,个人隐私,竞争对手相关的计划等。这些是秘密。

说大不说小,不说具体企业。说公开的。

2 沟通需求能力 #

很忙,很多人投诉,销量好,赶紧做等都是数据需求,给数据。

在处理数据的时候,就可以打标签了。

列出数据,分析问题,分析过程,分析结论

问一个问题,先问是什么,沉住气。弄清基本情况。

谁,什么部门提需求,需求发时间,期望需求完成时间,需求的背景,需求的标题(方便归类合并)

为什么要忙,不走流程,需求单。

这和医院看病要先花钱挂号,合理安排资源,过滤无效不重要请求。

需求:

  • 是什么,评估类。比如 各渠道表现如何,推广效果如何,用户群体特征
  • 为什么,原因类。为什么销量不好,为什么推广效果不好,为什么女性用户偏多
  • 会怎样,预测。预计活动有多少人,会有多少人来。

标准。比如这个月比上个月指标低,标准是什么

需求:

  • 是什么
    • 评价的维度,评价标准,评价权重
  • 为什么
    • 问题是否真实存在。是否有假设。考虑与行动有关的关键因素
  • 会怎样
    • 预测的前提要清晰。假设获得业务方认可。考虑与行动有关的关键因素。

需求单需要正是确认,如果有修改需要注明。如果对方不谢,自己写让对方确认,留字据。

需求排班管理

不是随便丢需求,要合理调度。

我们需要一个排期表。需要

编号。需求部门。需求人。提出时间。期望完成时间。需求目的。复杂度评估。预计工时。

自己也要统计每天关注的问题,每周,每月

升级需求:

临时性取数 统计数据 指标体系 监控报表 分析专题

  • 从一个指标,到一组指标。信息补全
  • 从原始数据,到一个统计结果。比如名单完成率,方便统筹
  • 从孤立的结果,到一系列监控指标
  • 记录经验的管用范围。比竞品好不好,给产品加标签定量分析
  • 主动探索经验背后的逻辑。做促销,分析促销的力度,参与群体,响应群体。
  • 当经验解决不了,一步步探索可行性。经验不管用,就可以分析标签属性
  • 不管什么情况,不要放弃获取更多数据的机会
  • 在业务认可的背景下,争取资源做产品。把常用模板模型固定起来。

基本原则:

  • 有数据清单,就一定能做统计
  • 统计指标为某个事情服务,就一定有关联指标
  • 只要不是一次性发生的,就可以做报表监控
  • 有了监控报表,解读波动需求,引发专题分析
  • 专题分析有分析成果,选择成果做成产品
  • 数据不满足,能多获取就多获取

如果业务部门不理睬

定期搜集行业数据,发布,业务部门会谈需求

常规报表和kpi绑定

项目结束的背会会,数据分析可以做背书

大屏展示。

模型。

逻辑模型 pest aarrr

推演模型 业绩=abc

查询模型 rfm

算法模型。

  • 时间序列,可以在excel可操作。

有已知,明确的结果。预测(回归,神经网络),分类(决策树,相似度模型),二元响应(逻辑回归)。

无明确的结果。分类(k均值聚类),关联关系(关联分析)。

预测向量 肉眼观测,推算模型,时间序列。

针对已经入职的数据分析师。

编排自己的需求管理表。

需求沟通,需求管理。

根据xx部门业务,xx需求,是什么 为什么 怎么样 数据制作相关分析报告。

  • 是什么:监控了哪些指标,发现了什么问题

  • 为什么:找到了哪些原因,改进了多少

  • 会怎样,预测了什么业务的走势,准确度如何,预测以后做了什么改进

  • 搭建了xx企业销售监控指标体系。

  • 提供30分销售月报,季度专题分析报告

  • 发现并诊断5次重大销售波动,提供优化建议3次

  • 3次新商品上市销售专题分析,提供销售方案优化建议3次以上

3 定义问题能力 #

定义问题,设计方案。

内行服务外行,不要轻易相信外行的要求,要理解处境,分析需求。

  • 清晰的描述问题
    • 清晰描述问题,分析事情本身
    • 划分清楚问题边界,数据分析能不能解决
    • 细分问题类型
    • 明确输出产物

了解问题的背景,需求。

4 实例流程建立指标 #

业务发展流程,了解业务流,是分析问题的起点。

事情发生形态,管理流,了解可以怎样影响结果,灌流过程,才能分析

记录事情的数据,数据流。

实例流程,建立指标体系。

部门领导解决问题的两种基本方式:

  • 分块解决,分解目标,各部门承担
  • 线性配合,活跃用户 用户运营 产品运营 活动运营

如果构建指标:

具体到一个部门可以负责,可衡量的kpi。拆解目标,可分解可考核。

aarrr,适合创业公司,圈钱公司的指标体系。盈利不是那么重要。

增长速度,增长质量,盈利能力,传播能力

增长速度(市场推广,销售)

增长质量(运营:产品 用户 社群 内容 活动)

利润:商品运营,销售

传播能力,用户 内容 社群,市场推广

aarrr更常见的形态,转化漏斗。

互联网企业应用比较多,都有记录。可拆解。

销售流程类指标构建

客户,付费,客单价。

真正影响销售结果的东西,你看不到,只能看到促成。

toB的销售流程:

  • 产品培训,公司培训,技能培训
  • 整理名单,分析需求,指定计划
  • 邀约 沟通 示范 促成
  • 跟进

toC的销售流程:

  • 产品培训 公司培训 技能培训
  • 产品铺货,门店陈列,宣传预热
  • 迎客,沟通,示范,促成
  • 跟进

数据少。如果中间过程没有数据,没办法分析。

乱瞎填。数据造假。

乱管理。

靠的是渠道管理+数据简化

加强渠道管理,弱化数据要求。

了解销售过程,多做标签。比如话术 培训 fab 渠道 邀约方式 标签。

用于运营,crm指标体系

数据不好拿。

用户运营流程

  • 监控用户状况 设定目标 圈定目标用户 分析需求
  • 设计用户任务 设计用户奖励
  • 选择沟通渠道 选择沟通内容 投放信息
  • 跟踪数据

有了指标能做什么。注意幸存者偏差。

消费和互动数据基于交易,相对靠谱。

常规的 消费率,客单价,页面访问,跳出等指标。

对目标有用的特征: 30天未消费,xx品类爱好者(连续消费x次,累积消费单品x元)

对页面大表情,促销类,产品类,对访问行为贴标签(促销爱好者)

解决问题的关键2 问题找指标

吸引新用户,激活沉睡用户,延长活跃程度,挽留流失用户。

案例,短信通知,落地页,全流程。 可以分析转化路径。

商品管理类指标

一边卖一边补货。

商品管理:

进。宽度sku,深度数量。

销。热销 滞销 动销率 售罄率 销售分布

存。库龄,看库存数量。库存周转率。库存结构。

推荐了一本书,数据化管理,将商品管理

权威准确标准版,国建2025电商行业指标体系规范。企业流程不同,目标不同。

5 定义标准 判断分类 #

对标准敏感,凡是有归类 ,有好坏判断的,都涉及标准。

越接近结果,越具体,越容器找到含义,容器切分。

等不到结果就得管控过程。管控到什么程度,需要有个微妙的平衡,要综合考虑。

用多少指标衡量问题,业务复杂,技术含量高,素质高,可以多做指标,否则少。

为了指标好理解,还需要分级,权重,多个指标压缩。

平均法,简单,公平。要注意极值。

中位数。

分摊法和平均法使用。看个人贡献比例,多劳多得。还要看以往均值和增速,避免摊派太多。

二八法则,十分位法。

二位

三维。rmf 杜邦分析 漏斗。 量收利, 注册活跃转化。

多维指标,进行权衡。可以考虑数量达标,权重。

77 讲 不同分析方法的适用场景。

从跑表的到行业专家: 针对xx问题考查xx指标,发现指标有xx异动,可以用xx措施解决。

问题,指标,标准,解决。

问题。报表给谁看,谁看。

指标。针对xx问题一共xx个指标。

标准。对比社区发现问题。

解决。通报,竞品分析。

6 寻找原因 探索答案 #

甩锅路径: 环境 对手 队友

外部环境。PEST