zoukankan      html  css  js  c++  java
  • 用Excel做数据分析常用函数(数据清理、关联匹配……)

    本文总结在使用Excel进行数据分析时,最常用的功能和函数。

    Excel的功能和函数非常多,用进废退,除了学习基本的函数和功能,最重要的是遇到问题可以快速的搜索并解决。

    首先Excel可以处理的数据量有大多?

    使用Ctrl +  → , Ctrl + ↓可以看到下界为104,8576,右界为24(X)*6(F)*4(D)=576    (Excel 2010版本)

    一、数据清理

    1)Trim()--空格清理

    清除掉字符串两边的空格

    2)CONCATENATE()--连接

    CONCATENATE函数与“&”连接符都可以用来连接多个文本字符串,当要连接的内容较多时,用函数比较方便。

    3)Replace()--替换

    replace(需要进行替换的字符串,替换起点,替换字符个数,替换成什么内容)

    替换起点是从1开始计数的,空格也算位数

    4)substitute()--替换

    substitute(需要替换的文本,旧文本,新文本,[instance_num])

    instance_num用来指定以 new_text新文本替换第几次出现的旧文本,不设定则默认替换所有出现过的旧文本

    substitute函数经常用来去掉文本之间的空格

    5)Left/Right/Mid--截取

    Left/Right(指定字符串,截取位数)

    Mid(指定字符串,开始位置,截取长度)

    6)Len/Lenb--长度计算

    返回字符串的长度,在len中,中文计算为一个,在lenb中,中文计算为两个。

    7)Findsearch--查找

    Find(要查找的字符串,被查找的字符串,从第几个字符开始查找(默认1,从头查找)

    返回某字符串出现的位置,与Left/Right/Mid结合能完成简单的文本提取

    search和Find类似,区别是Search大小写不敏感,且支持通配符

     二、关联匹配

    1)VLookupLookup

    VLookup(①找什么,②在哪个区域找,③返回第几列,④匹配类型)

    ②区域要包含①③列,且①在第一列

    ④0为精确匹配,1为模糊匹配:找小于等于自己的最大值,多用于找区间

    2)Index+Match

    可以比Vlookup更灵活的完成查找匹配的任务

    Match(找什么,查找区域,匹配类型)       匹配类型:大于、小于或等于

    Index(查找区域,②返回第几行数据,返回第几列数据)

    Index和match结合使用,Index②使用Match返回的行数

    3)row/column/offset

    row()返回单元格所在的行数,column()返回单元格所在的列数

    OFFSET(起始点,向下移动行数,向右移动列数,取值行数,取值列数)

    返回距离起始点的值或者区域。正数代表向下或向左,负数则相反。

     offset(X,Y,Z,1,1)返回单值

    ctrl+shift+enter返回数组

     

    三、逻辑运算类

    IF/IFS/AND/OR/ISERROR/ISERR/ISTEXR/ISNA,嵌套使用

    四、计算统计类

    常用的基础计算、分析、统计函数,以描述性统计为准。

    1)Sum/Sumif/Sumifs--求和

    根据指定条件对若干单元格进行求和,

    sumif(条件区域,求和条件,实际求和区域)

    sumifs(实际求和区域,条件区域1,求和条件1,条件区域2,求和条件2……)

    2)Count/Countif/Countifs--计数

    根据指定条件对若干单元格进行计数

    Countifs(条件区域1,条件1,条件区域2,条件2……)

    3)Sumproduct

    sumproduct(数组1,数组2……)

    返回数组元素对应相乘的和,数组形状需一致

    4)Rank--排名

    rank(排名对象,排名区域,[升序or降序])  (0降序1升序)

    排名区域注意绝对引用。重复值会有相同的排名

    不重复排名的解决:使用countif计数辅助

    5)Rand/Randbetween--随机数

    前者返回0~1之间的随机值,后者返回指定范围的整数

    6)average--平均数

    7)Quartile--四分位数

    Quartile(区域,四分位点)

    四分位点0-4对应,min,Q1,Q2,Q3,max

    8)Stdev--标准差

    9)Substotal

    10)Int/Round

    int向下取整

    round按小数位取数。round小数点位数设为0,正数向上,负数向下取整

    五、时间序列

    1)Year/Month/Day/Weekday

    返回日期中的年/月/日/星期数

    2)now

    返回当前时间戳,动态函数

    3)today

    返回今天的日期,动态函数

    4)Datedif

    DATEDIF(start_date,end_date,参数)

    参考:如何七周成为数据分析师01

              跟王佩丰学Excel视频教程

  • 相关阅读:
    datanode报错Problem connecting to server
    使用命令查看hdfs的状态
    Access denied for user root. Superuser privilege is requ
    ElasticSearch默认的分页参数 size
    SparkStreaming Kafka 维护offset
    【容错篇】Spark Streaming的还原药水——Checkpoint
    251 Android 线性与相对布局简介
    250 Android Studio使用指南 总结
    249 如何解决项目导入产生的中文乱码问题
    248 gradle更新问题
  • 原文地址:https://www.cnblogs.com/tongtong123/p/10712846.html
Copyright © 2011-2022 走看看