zoukankan      html  css  js  c++  java
  • 用Excel做数据分析常用函数(数据清理、关联匹配……)

    本文总结在使用Excel进行数据分析时,最常用的功能和函数。

    Excel的功能和函数非常多,用进废退,除了学习基本的函数和功能,最重要的是遇到问题可以快速的搜索并解决。

    首先Excel可以处理的数据量有大多?

    使用Ctrl +  → , Ctrl + ↓可以看到下界为104,8576,右界为24(X)*6(F)*4(D)=576    (Excel 2010版本)

    一、数据清理

    1)Trim()--空格清理

    清除掉字符串两边的空格

    2)CONCATENATE()--连接

    CONCATENATE函数与“&”连接符都可以用来连接多个文本字符串,当要连接的内容较多时,用函数比较方便。

    3)Replace()--替换

    replace(需要进行替换的字符串,替换起点,替换字符个数,替换成什么内容)

    替换起点是从1开始计数的,空格也算位数

    4)substitute()--替换

    substitute(需要替换的文本,旧文本,新文本,[instance_num])

    instance_num用来指定以 new_text新文本替换第几次出现的旧文本,不设定则默认替换所有出现过的旧文本

    substitute函数经常用来去掉文本之间的空格

    5)Left/Right/Mid--截取

    Left/Right(指定字符串,截取位数)

    Mid(指定字符串,开始位置,截取长度)

    6)Len/Lenb--长度计算

    返回字符串的长度,在len中,中文计算为一个,在lenb中,中文计算为两个。

    7)Findsearch--查找

    Find(要查找的字符串,被查找的字符串,从第几个字符开始查找(默认1,从头查找)

    返回某字符串出现的位置,与Left/Right/Mid结合能完成简单的文本提取

    search和Find类似,区别是Search大小写不敏感,且支持通配符

     二、关联匹配

    1)VLookupLookup

    VLookup(①找什么,②在哪个区域找,③返回第几列,④匹配类型)

    ②区域要包含①③列,且①在第一列

    ④0为精确匹配,1为模糊匹配:找小于等于自己的最大值,多用于找区间

    2)Index+Match

    可以比Vlookup更灵活的完成查找匹配的任务

    Match(找什么,查找区域,匹配类型)       匹配类型:大于、小于或等于

    Index(查找区域,②返回第几行数据,返回第几列数据)

    Index和match结合使用,Index②使用Match返回的行数

    3)row/column/offset

    row()返回单元格所在的行数,column()返回单元格所在的列数

    OFFSET(起始点,向下移动行数,向右移动列数,取值行数,取值列数)

    返回距离起始点的值或者区域。正数代表向下或向左,负数则相反。

     offset(X,Y,Z,1,1)返回单值

    ctrl+shift+enter返回数组

     

    三、逻辑运算类

    IF/IFS/AND/OR/ISERROR/ISERR/ISTEXR/ISNA,嵌套使用

    四、计算统计类

    常用的基础计算、分析、统计函数,以描述性统计为准。

    1)Sum/Sumif/Sumifs--求和

    根据指定条件对若干单元格进行求和,

    sumif(条件区域,求和条件,实际求和区域)

    sumifs(实际求和区域,条件区域1,求和条件1,条件区域2,求和条件2……)

    2)Count/Countif/Countifs--计数

    根据指定条件对若干单元格进行计数

    Countifs(条件区域1,条件1,条件区域2,条件2……)

    3)Sumproduct

    sumproduct(数组1,数组2……)

    返回数组元素对应相乘的和,数组形状需一致

    4)Rank--排名

    rank(排名对象,排名区域,[升序or降序])  (0降序1升序)

    排名区域注意绝对引用。重复值会有相同的排名

    不重复排名的解决:使用countif计数辅助

    5)Rand/Randbetween--随机数

    前者返回0~1之间的随机值,后者返回指定范围的整数

    6)average--平均数

    7)Quartile--四分位数

    Quartile(区域,四分位点)

    四分位点0-4对应,min,Q1,Q2,Q3,max

    8)Stdev--标准差

    9)Substotal

    10)Int/Round

    int向下取整

    round按小数位取数。round小数点位数设为0,正数向上,负数向下取整

    五、时间序列

    1)Year/Month/Day/Weekday

    返回日期中的年/月/日/星期数

    2)now

    返回当前时间戳,动态函数

    3)today

    返回今天的日期,动态函数

    4)Datedif

    DATEDIF(start_date,end_date,参数)

    参考:如何七周成为数据分析师01

              跟王佩丰学Excel视频教程

  • 相关阅读:
    netcore一键部署到linux服务器以服务方式后台运行
    查找100-999之间的水仙花数
    shell创建数据库的脚本
    python打印九九乘法表的菱形实现
    c++一些重要的细节
    MySQL数据库基础学习笔记(二)
    MySQL数据库基础学习笔记(一)
    react-redux 的基本使用
    react-router-dom基本使用+3种传参方式
    从create-react-app 项目搭建开始
  • 原文地址:https://www.cnblogs.com/tongtong123/p/10712846.html
Copyright © 2011-2022 走看看