zoukankan      html  css  js  c++  java
  • 【数据分析&数据挖掘】相关性计算+数据分析流程

     1 import pandas as pd
     2 
     3 detail = pd.read_excel("../day05/meal_order_detail.xlsx")
     4 # print("detail: 
    ", detail)
     5 print("detail的列名称: 
    ", detail.columns)
     6 
     7 # corr
     8 print("相关系数为: 
    ", detail.loc[:, ["counts", "amounts"]].corr())
     9 print("spearman相关系数为: 
    ", detail.loc[:, ["counts", "amounts"]].corr(method="spearman"))
    10 print("kendall相关系数为: 
    ", detail.loc[:, ["counts", "amounts"]].corr(method="kendall"))
    11 
    12 # data = detail.loc[:, ["detail_id", "order_id", "dishes_id", "counts", "amounts"]]

    # 完整的机器学习算法流程
    # 1、导包
    # 2、加载数据
    # 3、筛选出有用的列
    # 4、检测并处理缺失值
    # 5、处理异常值
    # 6、数据标准化
    # 7、构建算法模型进行运算
    # 8、算法结果展示---数据可视化
    # 9、结论

    # 纯数据分析
    # 1、导包
    # 2、加载数据
    # 3、筛选有用的数据
    # 4、检测并处理缺失值
    # 5、处理异常值
    # 6、结果可视化--数据分布、走势的可视化
    # 7、书写结论---非常重要
     
  • 相关阅读:
    Vue生命周期
    脚本生命周期
    音频
    光照系统
    InstantOC(对象渲染---游戏优化)
    kafka单机环境配置以及基本操作
    mysql 锁机制
    java.math.BigDecimal类multiply的使用
    去掉返回的json中特殊字符
    TheadLocal与synchronized
  • 原文地址:https://www.cnblogs.com/Tree0108/p/12116132.html
Copyright © 2011-2022 走看看