zoukankan      html  css  js  c++  java
  • Python、Excel、MySQL 基于数据分层,打标签

    pandas.cut()

    用来将数据划分为不同的区间  
    
    	x:array型数据 DataFrame每列数据都是array型数据
    
    	bins:传入int型数据,表示划分的区间个数,传入list型数据,表示自定义的区间
    
    	labels: 与bins对应区间的标签(默认为None)
    
    	retbins:True表示返回划分的区间,False表示不返回划分的区间(默认为False)
    
    	right:True表示左开右闭,False表示左闭右开(默认为True)
    
    
    返回数据: 
    
    	x对应所在的区间,array类型
    
    	retbins为True时,还会返回划分区间
    

    excel

    =LOOKUP(I:I,
    {0,50,100,500,1000,2000,5000,10000,15000},
    {"[0, 50)","[50, 100)","[100, 500)","[500, 1000)","[1000, 2000)","[2000, 5000)","[5000, 10000)","[10000, 15000)"}
    )
    
    法二: if函数逐层嵌套
    
    

    MySQL

    法一:
        CASE
            WHEN cost>=0 and cost<50  THEN "[0, 50)"
            WHEN cost>=50 and cost<100 THEN "[50, 100)"
    			  ...
            ELSE "[10000, 15000)"
        END material_flag_off,
    法二:
    -- 偶然所得,未尝试
    SELECT
        elt(
            INTERVAL (days, 1, 3, 5, 7, 10),
            "1-3",
            "3-5",
            "5-7",
            "7-10",
            "10+"
        ) AS region,
        count(*)
    FROM
        tour_group
    GROUP BY
        region; 
    
    
  • 相关阅读:
    MySQL Cluster --01
    TPCC-MySQL(转自imysql.com)
    MySQL mha 高可用集群搭建
    Redis--初入
    Python之Fabric
    MySQL pt-table-checksum及pt-table-sync校验及修复主从一致性
    MySQL GTID
    MySQL Batched Key Access
    MySQL Block Nested-Loop Join(BNL)
    MySQL Index Condition Pushdown
  • 原文地址:https://www.cnblogs.com/geoffreygao/p/15767070.html
Copyright © 2011-2022 走看看