zoukankan      html  css  js  c++  java
  • 学习笔记之Data analysis

    Data analysis - Wikipedia

    • https://en.wikipedia.org/wiki/Data_analysis
    • Data analysis is a process of inspecting, cleansingtransforming, and modeling data with the goal of discovering useful information, informing conclusions, and supporting decision-making. Data analysis has multiple facets and approaches, encompassing diverse techniques under a variety of names, while being used in different business, science, and social science domains. In today's business, data analysis is playing a role in making decisions more scientific and helping the business achieve effective operation.[1]
    • Data mining is a particular data analysis technique that focuses on modeling and knowledge discovery for predictive rather than purely descriptive purposes, while business intelligence covers data analysis that relies heavily on aggregation, focusing mainly on business information.[2] In statistical applications, data analysis can be divided into descriptive statisticsexploratory data analysis (EDA), and confirmatory data analysis (CDA). EDA focuses on discovering new features in the data while CDA focuses on confirming or falsifying existing hypothesesPredictive analytics focuses on application of statistical models for predictive forecasting or classification, while text analytics applies statistical, linguistic, and structural techniques to extract and classify information from textual sources, a species of unstructured data. All of the above are varieties of data analysis.
    • Data integration is a precursor to data analysis,[according to whom?] and data analysis is closely linked[how?] to data visualization and data dissemination. The term data analysis is sometimes used as a synonym for data modeling.

    学习笔记之NumPy - 浩然119 - 博客园

    • https://www.cnblogs.com/pegasus923/p/9022893.html

    学习笔记之pandas - 浩然119 - 博客园

    • https://www.cnblogs.com/pegasus923/p/8975684.html

    学习笔记之Python for Data Analysis - 浩然119 - 博客园

    • https://www.cnblogs.com/pegasus923/p/9591474.html

    5种数据分析常用的思维方法!- CSDN云计算

    • https://mp.weixin.qq.com/s/F-6AHuFa7DNbWYpQEJYzzw
    • 在数据分析中,数据分析思维是框架式的指引,实际分析问题时还是需要很多“技巧工具”的。就好比中学里你要解一元二次方式,可以用公式法、配方法、直接开平方法、因式分解法。
    • 数据分析里也有技巧,在一些通用的分析场景下可以快速使用,而且对未来构建数据分析模型也有帮助。
    • 接下来就分享常见的5种数据分析方法,分别是:公式法、对比法、象限法,二八法,漏斗法,常常多种结合一起使用。
    • 注:主要偏思维层面的,基于业务问题对数据的探索性分析,不同于专业统计学中的数据处理方法。
    • 所谓公式法就是针对某个指标,用公式层层分解该指标的影响因素
    • 公式拆解法是针对问题的层级式解析,在拆解时,对因素层层分解,层层剥尽。
    • 对比法就是用两组或两组以上的数据进行比较,是最通用的方法。
    • 我们知道孤立的数据没有意义,有对比才有差异。一些直接描述事物的变量,如长度、数量、高度、宽度等。通过对比得到比率数据,增速、效率、效益等指标,这才是数据分析时常用的。
    • 通过对两种及以上维度的划分,运用坐标的方式表达出想要的价值。由价值直接转变为策略,从而进行一些落地的推动。象限法是一种策略驱动的思维,常于产品分析、市场分析、客户管理、商品管理等。
    • 象限法的优势

    1. 找到问题的共性原因
    2. 建立分组优化策略

    • 二八法也可以叫帕累托法则,源于经典的二八法则。比如在个人财富上可以说世界上20%的人掌握着80%的财富。而在数据分析中,则可以理解为20%的数据产生了80%的效果需要围绕这20%的数据进行挖掘。
    • 往往在使用二八法则的时候和排名有关系,排在前20%的才算是有效数据。二八法是抓重点分析,适用于任何行业。找到重点,发现其特征,然后可以思考如何让其余的80%向这20%转化,提高效果。
    • 漏斗法即是漏斗图,有点像倒金字塔,是一个流程化的思考方式,常用于像新用户的开发、购物转化率这些有变化和一定流程的分析中。
    • 整体漏斗模型的核心思想其实可以归为分解和量化。

    8个Python高效数据分析的技巧 - 机器学习算法与Python学习

    • https://mp.weixin.qq.com/s/D0FZFUs9_lJWEf6RE5aa5A
    • 一行代码定义List
    • Lambda表达式
    • Map和Filter
    • Arange和Linspace
    • Axis代表什么?
    • Concat,Merge和Join
    • Pandas Apply
    • Pivot Tables

    数据分析只需要看懂一张图 - Python爱好者社区

    • https://mp.weixin.qq.com/s/hQ7HnmMm85PEsMqmW3rcLw

    数据太多、太乱、太杂?你需要这样一套数据治理流程

  • 相关阅读:
    PAT Advanced 1138 Postorder Traversal (25) [树的遍历,前序中序转后序]
    PAT Advanced 1127 ZigZagging on a Tree (30) [中序后序建树,层序遍历]
    PAT Advanced 1020 Tree Traversals (25) [⼆叉树的遍历,后序中序转层序]
    PAT Basic 1075 链表元素分类(25) [链表]
    PAT A1133 Splitting A Linked List (25) [链表]
    PAT Advanced 1097 Deduplication on a Linked List (25) [链表]
    PAT Basic 反转链表 (25) [链表]
    PAT Advanced 1074 Reversing Linked List (25) [链表]
    PAT Advanced 1052 Linked List Sorting (25) [链表]
    PAT Advanced 1032 Sharing(25) [链表]
  • 原文地址:https://www.cnblogs.com/pegasus923/p/10365302.html
Copyright © 2011-2022 走看看