zoukankan      html  css  js  c++  java
  • 数据分析常用的方法总结

    医院销售数据分析案例关键知识点

    读取

    data = pd.read_excel('chao.xlsx',dtype='object')

    为了防止数据类型不一致,先统一用object类型导入

    重新给列命名

    dataDF.rename(columns={"购药时间": "销售时间"}, inplace=True)

    数据类型转换

    dataDF["销售数量"] = dataDF["销售数量"].astype("f8")

    这里的f8是float64的意思

    字符串转时间格式,错误强转

    dataDF.loc[:, "销售时间"] = pd.to_datetime(dataDF.loc[:, "销售时间"], errors='coerce')

    根据时间计算天数

    daysI = (endTime - startTime).days

    业务指标

    月均消费次数 = 总消费次数 / 月份数

    月均消费金额 = 总消费金额 / 月份数

    客单价 = 总消费金额 / 总消费次数

    消费趋势

    常见画图属性设置

    绘图时防止中文报错

    1. from pylab import mpl
       mpl.rcParams['font.sans-serif'] = ['SimHei']
       
  • 相关阅读:
    gems gems gems
    poj 6206 Apple
    lightoj1341唯一分解定理
    lightoj1370欧拉函数
    约瑟夫环lightoj1179
    拓展欧几里得算法
    RMQ算法
    poj1502MPI Maelstrom
    poj1860Currency Exchange
    生成全排列
  • 原文地址:https://www.cnblogs.com/mypath/p/12170282.html
Copyright © 2011-2022 走看看