一、背景与挖掘目标
经常听到这么一句话“坐拥百万大学生,武汉却留不住人。”,在人才竞争的大背景下,武汉出台了一系列包括“人才租房、购房8折优惠”等政策。“将武汉打造成大学生最友好城市”“5年内留住100万大学生”。
作为武汉百万大学生之一的你,是否考虑未来在武汉买房呢?
那么武汉的二手房市场又是怎样的呢?我们用Python来分析下武汉的二手房数据。
PS:如有需要Python学习资料的小伙伴可以加下方的群去找免费管理员领取
可以免费领取源码、项目实战视频、PDF文件等
二、采集器获取数据
这次小编没有用python爬虫代码来爬取数据,用后羿采集器来爬取武汉二手房网上的数据,共获取5015条记录。
数据读入
先导入要使用的数据处理包pandas,可视化工具pyecharts、stylecloud。
导入CSV文件,预览数据。
从获取的数据来看,需要对数据进行预处理,缺失值和异常值检测,删除无用的列,进行数据类型的转换,提取关键字等操作。
数据整理
此处我们主要对以上获取的数据集进行部分清洗工作以方便后续的处理:
title:作词云图
list-info:地区、室、厅、面积、方位、楼层
tag_info:提取是否靠近地铁
total_price:提取房屋总价
unitPrice:房屋单价
picNum、jjrinfo、jjrname-outer、
icon-anxuan-img:无用值无需分析,删去
提取关键数据:
数据类型转换:
处理后数据:
数据可视化
数据可视化部分主要对以下的数据进行汇总分析,分析维度以及代码如下:
- 武汉不同区域的二手房房源数量
- 武汉不同区域二手房平均价格
- 武汉二手房都处在什么价位
- 是否靠近地铁和房屋单价的关系
- 不同朝向的房屋数量分布
- 房屋面积和房屋价格的关系
- 卧室数量和房屋价格的关系
- 客厅数量和房屋价格的关系
- 二手房信息词云图
武汉不同区域的二手房房源数量
武汉不同区域二手房平均价格
武汉二手房都处在什么价位
是否靠近地铁和房屋单价的关系
不同朝向的房屋数量分布
房屋面积和房屋价格的关系
客厅数量和房屋价格的关系
二手房信息词云图
三、可视化分析
1. 武汉不同区域的二手房房源数量
那么武汉各个区域的二手房源分布如何呢?
获取的5014条数据中,经过统计可以看到,江夏区的二手房数量遥遥领先,达到997。其次是洪山区,共870。之后黄陂、汉阳、东西湖
2. 武汉不同区域二手房平均价格
不同区域的二手房价又是怎样的呢?
武昌区一马当先,以25518.24元每平米的价格领跑武汉的二手房市场。其次,江岸区以23190.4每平米排在第二位。江汉区以22921.04每平米的价格排在第三位。
3. 武汉二手房都处在什么价位
那么在武汉买一套二手房到底要花多少钱?
接着我们分析了二手房的价位,从图中可以看到总价在100-300万内的最多,占比达到76.44%。100万的占比18.23%。300万-500万的占比4.14%
4.是否靠近地铁和房屋单价的关系
一般来说,靠近地铁越近的房子房价越高,从分布的箱线图可以看出,以中位数来看,靠近地铁的房子单价比不靠近地铁的房子每平米高4254元。
5.不同朝向的房屋数量分布
房屋朝向方面,朝南北的自然是最多的,占比达到79.88%。其次是朝南的,占比15.33%。
6.房屋面积和房屋价格的关系
从散点图可以看出,房屋的面积和房屋价格呈现正相关,计算皮尔逊相关系数的值为0.67,为强相关。
7.客厅/卧室数量和房屋价格的关系
从分布的箱线图可以看出,卧室数量越多,面积越大,则房屋总价越高。房价呈现右偏分布,且离群值较多。客厅和卧室一样反映在房屋的面积上,客厅数越多,则房屋总价越高。
8.二手房信息词云图
简略的分析就到这里了。武汉最近几年的飞速发展,城市环境和交通都有质的飞跃,在武汉买
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。
作者:Nothing to lose921