zoukankan      html  css  js  c++  java
  • 数据分析常用的方法总结

    医院销售数据分析案例关键知识点

    读取

    data = pd.read_excel('chao.xlsx',dtype='object')

    为了防止数据类型不一致,先统一用object类型导入

    重新给列命名

    dataDF.rename(columns={"购药时间": "销售时间"}, inplace=True)

    数据类型转换

    dataDF["销售数量"] = dataDF["销售数量"].astype("f8")

    这里的f8是float64的意思

    字符串转时间格式,错误强转

    dataDF.loc[:, "销售时间"] = pd.to_datetime(dataDF.loc[:, "销售时间"], errors='coerce')

    根据时间计算天数

    daysI = (endTime - startTime).days

    业务指标

    月均消费次数 = 总消费次数 / 月份数

    月均消费金额 = 总消费金额 / 月份数

    客单价 = 总消费金额 / 总消费次数

    消费趋势

    常见画图属性设置

    绘图时防止中文报错

    1. from pylab import mpl
       mpl.rcParams['font.sans-serif'] = ['SimHei']
       
  • 相关阅读:
    P2149 [SDOI2009]Elaxia的路线
    P1346 电车
    P3174 [HAOI2009]毛毛虫
    P3047 [USACO12FEB]附近的牛Nearby Cows
    P4053 [JSOI2007]建筑抢修
    P2607 [ZJOI2008]骑士
    [HNOI2006]马步距离
    [POI2014]Hotel
    [BZOJ3856]Monster
    [BZOJ2819]Nim
  • 原文地址:https://www.cnblogs.com/mypath/p/12170282.html
Copyright © 2011-2022 走看看