数据分析概要【数据分析---偏企业】

avatar
作者
猴君
阅读量:0
各位大佬好 ,这里是阿川的博客,祝您变得更强

在这里插入图片描述 个人主页在线OJ的阿川

大佬的支持和鼓励,将是我成长路上最大的动力在这里插入图片描述

阿川水平有限,如有错误,欢迎大佬指正在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

数据分析概要前必看
Python初阶
Python–语言基础与由来介绍
Python–注意事项
Python–语句与众所周知
数据分析系列文章偏学术
数据分析—技术栈和开发环境搭建
数据分析—Numpy和Pandas库基本用法及实例
数据分析—三前奏:获取/ 读取/ 评估数据
数据分析—数据清洗操作及众所周知
数据分析—数据整理操作及众所周知
数据分析—统计学基础及Python具体实现
数据分析—数据可视化Python实现超详解
数据分析—推断统计学及Python实现
数据分析—线性及逻辑回归模型
数据分析—AI交互及爬虫
大数据导论知识
【大数据导论】—大数据序言
【大数据导论】—大数据、人工智能、云计算、物联网、区块链序言
【大数据导论】—大数据基础知识

目录

数据概念

数据

  • 客观事件进行记录可以鉴别符号
  • 构成信息基本单位

在这里插入图片描述

数据类别

  • 数值型数据
    数字组成的变量
    在这里插入图片描述

  • 类别型数据
    由各种字符串分组标签组成
    在这里插入图片描述

数据四大优势

  • 反复读取和使用
  • 客观
  • 量化
  • 机器可处理
    在这里插入图片描述

数据分析概念

只要是基于量化的信息提升生产力就是数据分析
在这里插入图片描述

数据岗位区别

基于业务

  • 数据专员
  • 数据运营
  • 数据分析师

基于开发

  • 数据工程师
  • 数据产品经理

基于算法

  • 算法优化师
  • 算法科学家
  • 算法工程师

在这里插入图片描述

数据分析适用场景

四大类

  • 数据去量化企业当前的经营现状或者业务事实
    在这里插入图片描述

  • 探究各种数据上差距异常,寻找背后的成因
    在这里插入图片描述

  • 搞清楚成因后给出具体的行动策略
    在这里插入图片描述
    方法
    在这里插入图片描述
    在这里插入图片描述

  • 计算使当前策略投入产出比最高过程参数
    在这里插入图片描述
    方法
    在这里插入图片描述

数据分析步骤

  • 思考 问题
  • 处理 数据
  • 输出 结论

在这里插入图片描述

  • 其中思考问题
    在这里插入图片描述

    • 发现问题

    • 定义问题

    • 选择问题

    • 确认问题

      • 目的
      • 背景
      • 思路
        在这里插入图片描述
        解决方法例子
        在这里插入图片描述
        注意 一定要检查数据准确性,若数据过于异常,还要检查一下数据的处理与计算
    • 拆解问题
      初学阶段学习大量经典分析框架,再搭建自己的分析矩阵
      成熟分析师搭建自己的分析矩阵,对问题全方位地拆解高效地找到答案
      在这里插入图片描述

    • 量化问题

      • 数据格式
        • 日期
        • 字符串
        • 数字
          在这里插入图片描述
          注意统一统计口径,即什么时候一个数据才算有效数据

其中处理数据

  • 收集数据
    • 内部数据
      • 直接写SQL
      • 从平台下载
      • 提数据需求
        • 从生产环境同步
        • T+1更新
    • 外部数据
      • 来源:各大网站和APP
      • 获取方式:爬虫和API

爬虫常用工具八爪鱼后羿采集器或者Python中的爬虫工具包
在这里插入图片描述

  • 处理数据
    将各种脏数据通过筛选、清洗和计算处理成干净数据
    在这里插入图片描述

  • 制作图表
    清洗过的标准数据借助工具处理成我们需要的各种图表
    在这里插入图片描述

  • 上传发布
    将我们的图表发布成一个个可以访问页面
    在这里插入图片描述

  • 输出结论
    一句话一幅图
    在这里插入图片描述

数据分析框架

在这里插入图片描述
其中五大基础理论

一、大数定律

大量重复某一实验时最后的频率会无限接近于事件的概率,即数据的样本量越大预测和计算的概率就越准确
在这里插入图片描述

启发:对小样本量的分析结果保持客观的怀疑与观察,并尽可能地在大样本量下进行分析
二、罗卡定律
凡有接触必有痕迹不要放弃挖掘更多数据
在这里插入图片描述

启发:用户的一切行为都会留下数据,尽可能的拿来分析找到数据背后隐藏的价值
三、幸存者偏差
统计样本覆盖,会很大程度上直接影响分析的结果,即各种分析对象取全量尽量取全量
在这里插入图片描述

启发:分析时要提前检查取样偏差,分析的样本要越能代表整体越好

四、辛普森悖论
两组分别讨论都满足某一性质的数据,一旦合并计算得出完全相反的结论
在这里插入图片描述

启发确保数据同一量级和权重下进行分析
五、帕累托最优
进行资源分配中不增加资源通过调整分配方式,使整体的效率最大化
在这里插入图片描述

启发:在不投入资源的情况下,也总有优化现状的方法

其中一法则四方法
MECE法则
要求拆解出的各个部分都要满足相互独立完全穷尽
在这里插入图片描述

时间流程法
根据时间顺序问题进行拆解
在这里插入图片描述

经典AARRR模型
A—获取
A—激活
R—留存
R—收益
R—传播
在这里插入图片描述

该模型可以根据公司的具体业务进行细分
经典两大框架

  • PDCA
    强调做事情一定要先规划再执行
    P—计划
    D—执行
    C—检查
    A—处理
    在这里插入图片描述

  • 精益创业
    强调根据想法快速构建产品,并基于数据反馈快速迭代创业
    在这里插入图片描述

模型框架法
基于几个完全平行的维度,对问题进行划分

  • SWOT法

    • SO战略
      依靠内部优势
    • WO战略
      利用外部机会
      克服内部弱点
    • ST战略
      利用内部优势
      抵制外部威胁
    • WT战略
      减少内部弱点
      回避外部威胁
      在这里插入图片描述
  • RFM法
    根据不同的维度,对客户划分成8个区间
    在这里插入图片描述

量化公式法
解决涉及到指标计算的问题
在这里插入图片描述

将问题量化成指标步骤

  • 根据拆解的维度找到对应的数据指标
  • 基于现有的数据指标进行发散的思考
    在这里插入图片描述

常见的指标三类
属性:描述分析对象有哪些特征
绝对值:衡量一件事最后的结果
转换率:衡量一个环节的完成度
在这里插入图片描述

穷尽要素法
整体分为不同的构成部分
在这里插入图片描述

例如:电商平台将消费人群划分成八大人群
在这里插入图片描述
其中业务诊断

业务诊断通常用时间流程法、模型框架法、量化公式法、穷尽要素法四大分析方法一起上,对问题进行拆解、量化、取数、分析
在这里插入图片描述

其中业务增长

  • 收集外部数据
  • 估算市场空间
  • 推算竞品规模
  • 计算增长空间
  • 确定增长目标
  • 研究主流打法
  • 设计增长策略
  • 构建增长引擎
  • 计算增长成本
  • 核心指标选取
  • 业务动作梳理
  • 指标体系搭建
  • 数据实验设计
  • 专项策略输出
  • 梳理可行方案
  • 数据实验迭代
  • 达到增长目标
    在这里插入图片描述

数据分析中的可视化

取数作图
在这里插入图片描述

  • 可视化原理

  • 经历的环节

  • 数据工具

    • Excel 小量级一次性数据处理
    • Tableau、Power BI等BI工具 批量数据读取与分析
    • Python 复杂的数据清洗、爬虫和算法建模
      在这里插入图片描述

    注意:若不灵活学习和使用新工具,最终都会限制自身的发展
    在这里插入图片描述

数据表达
基于数据化表、图、文说明事实表达观点,从而更好地说明现状阐述事实,使人能基于数据准确地知道到底发生了什么用数据说服他人认同我们自己想表达的观点
在这里插入图片描述
在这里插入图片描述
数据表达的原则

  • 客观
  • 直观
  • 高效
    在这里插入图片描述

数据表达的载体和形式
在这里插入图片描述

  • 基于PPT汇报总结

  • 基于文档专业分析

  • 基于图文沟通对话
    表达格式:观点+数据+补充信息+图表
    在这里插入图片描述
    其中
    在这里插入图片描述

    1. 提炼文字观点

      • 打破认知
      • 语出惊人
    2. 制作完善图表

      • 根据问题和观点选择合适的图表类型

      • 为图表准备数据
        对观点拆解量化,然后梳理出数据,并且收集处理为数据库中的标准数据

      • 通过工具制作图表

      • 优化视觉图形组合
        制作出有效信息密度更大高效图表
        在这里插入图片描述
        在这里插入图片描述
        图形总结

        • 比数字规模,上柱状图

        • 多对象,上条形图
          在这里插入图片描述

        • 数据趋势,上折线图

        • 多个对比对象,上多个折线图
          在这里插入图片描述

        • 各类占比分析,上饼图/环形图

        • 多对象占比,上树图
          在这里插入图片描述

        • 两个度量上对比一个维度,上散点图
          在这里插入图片描述

        • 单一度量分布,上直方图

        • 地理位置相关,上地图
          在这里插入图片描述

      即图表类型分类主要是从规模、趋势、占比、关系、分布
      在这里插入图片描述

    3. 提出关键数据

      • 日期时间准确
        时间日期要准确说明年月日
      • 简化数字
        对于大数据和小数点过长的数据,要四舍五入,并给出合适量级的单位
      • 少用术语
        要视对象使用术语和缩略语,不要跟业务拽专业指标,也不要跟技术说行业黑话
      • 多说大白话
        语言表述越直白越简单越好不要兜圈子
        在这里插入图片描述

学习经验分享

  1. 充分理解别人学习框架
  2. 已有框架能不能解决问题
  3. 果断学习新知识解决问题
  4. 学会后归纳到自己的框架里
  5. 甚至放弃原有框架重新搭建一个
    在这里插入图片描述

在进行数据分析时,反复问自己三个问题:
一、输出结论能不能理解
二、做出的图表够不够直观
三、给出的策略可不可执行
在这里插入图片描述

注意:在数据分析领域中面对众多方向先学自己用得上的技能和知识

数据分析与问题本身关系

  • 只有乐于解决问题
  • 才会善于解决问题
  • 当善于解决问题
  • 就没有难解的问题
    在这里插入图片描述

注意:在解决问题中一定不能只看量化的数据大量非量化的业务细节和信息,甚至连一线执行时的情绪都是不可忽略的,它们往往才是最终决定你的分析和策略是否能真正落地实现价值的关键
在这里插入图片描述

好的,到此为止啦,祝您变得更强

在这里插入图片描述
想说的话

学习来源B站戴师兄(反反复复学习了3遍哈并且做了相应的笔记/相应的练习 然后才进行的这篇博客的书写)实不相瞒,写的这篇博客要写八个小时以上(加上自己学习和纸质笔记,共十小时吧),很累希望大佬支持一下

在这里插入图片描述

道阻且长 行则将至
个人主页:在线OJ的阿川大佬的支持和鼓励,将是我成长路上最大的动力 在这里插入图片描述

广告一刻

为您即时展示最新活动产品广告消息,让您随时掌握产品活动新动态!