zoukankan      html  css  js  c++  java
  • B站14天数据分析笔记5次课作业

    (1)读取数据。读取之前作业保存的“酒店数据1.xlsx”

    请添加图片描述

    (2)将“类型”和“名字”设置为层次化索引,并交换索引的位置。然后将层次化索引取消

    请添加图片描述

    (3)将数据集转置,获取转制后的index和columns。

    请添加图片描述

    (4)用Groupby方法来计算每个地区的评分人数的总和以及均值。请添加图片描述

    (5)用Grouby方法计算每个类型的平均价格,最高价和最低价。

    请添加图片描述

    (6)数据离散化,按照价格将酒店分为3个等级,0-500为C,500-1000为B,大于1000为A,列名设置为“价格等级”。

    请添加图片描述

    (7)获取评分均值最高和最低的地区的数据,分别使用append和concat方法将获取的两个数据集合并。

    请添加图片描述

    (8)数据离散化,按照评分人数将酒店平均分为3个等级,三个等级的酒店数量尽量保持一致。评分人数最多的为A,最少的为C。列名设置为“热门等级”。

    请添加图片描述

    (9)选出评分人数为A,价格也为A的酒店数据,计算其平均评分。

    请添加图片描述

    (10)取价格最高的5个酒店的数据,使用stack和unstack方法实现dataframe和Series之间的转换。

    请添加图片描述

    (11)纵向拆分数据集,分为df1和df2,df1包含名字,类型,城市,地区,df2包含名字,地点,评分,评分人数,价格,价格等级,热门等级。

    请添加图片描述

    (12)将df2按照价格进行排序,重新设置df2的索引。索引值等于价格排名。

    请添加图片描述

    (13)使用merge方法将df1和df2合并。

    请添加图片描述

  • 相关阅读:
    macOS 上配置 Lua
    Oracle.ManagedDataAccess.dll
    offer
    Costura.Fody
    日志系统
    实战框架ABP
    什么是算法?
    HTTP状态码->HTTP Status Code
    How to untar a TAR file using Apache Commons
    python实践3:cursor() — 数据库连接操作
  • 原文地址:https://www.cnblogs.com/most-silence/p/15495352.html
Copyright © 2011-2022 走看看