zoukankan      html  css  js  c++  java
  • Python、Excel、MySQL 基于数据分层,打标签

    pandas.cut()

    用来将数据划分为不同的区间  
    
    	x:array型数据 DataFrame每列数据都是array型数据
    
    	bins:传入int型数据,表示划分的区间个数,传入list型数据,表示自定义的区间
    
    	labels: 与bins对应区间的标签(默认为None)
    
    	retbins:True表示返回划分的区间,False表示不返回划分的区间(默认为False)
    
    	right:True表示左开右闭,False表示左闭右开(默认为True)
    
    
    返回数据: 
    
    	x对应所在的区间,array类型
    
    	retbins为True时,还会返回划分区间
    

    excel

    =LOOKUP(I:I,
    {0,50,100,500,1000,2000,5000,10000,15000},
    {"[0, 50)","[50, 100)","[100, 500)","[500, 1000)","[1000, 2000)","[2000, 5000)","[5000, 10000)","[10000, 15000)"}
    )
    
    法二: if函数逐层嵌套
    
    

    MySQL

    法一:
        CASE
            WHEN cost>=0 and cost<50  THEN "[0, 50)"
            WHEN cost>=50 and cost<100 THEN "[50, 100)"
    			  ...
            ELSE "[10000, 15000)"
        END material_flag_off,
    法二:
    -- 偶然所得,未尝试
    SELECT
        elt(
            INTERVAL (days, 1, 3, 5, 7, 10),
            "1-3",
            "3-5",
            "5-7",
            "7-10",
            "10+"
        ) AS region,
        count(*)
    FROM
        tour_group
    GROUP BY
        region; 
    
    
  • 相关阅读:
    20200917-1 每周例行报告
    20200917-2 词频统计
    20200910-1每周例行报告
    20200910-2 博客作业
    20200910-3 命令行和控制台编程
    第05组 团队Git现场编程实战
    第05组 团队项目-需求分析报告
    团队项目-选题报告
    第二次结对编程作业
    第一次结对编程作业
  • 原文地址:https://www.cnblogs.com/geoffreygao/p/15767070.html
Copyright © 2011-2022 走看看