zoukankan      html  css  js  c++  java
  • 国庆小长假来点不一样的,如何用Python爬取了全国近5000家旅游景点,一起来看

    2020 国庆马上就要到了 我想今年大家在家都憋坏了 今年国庆和中秋刚好又是同一天,加起来有 8 天假 这么长的假期,当然是出去 玩玩玩!
    但是每次长假期间,你有没有想起被人山人海支配的恐惧呢?
    那么该去哪些地方呢? 下面我用 Python 爬取了全国近 5000 个旅游景点,并结合 pyecharts 来做分析 技能包
    • 爬虫
    • Mysql
    • sqlalchemy
    • pyecharts
    数据爬取 旅游景点的数据是从网上爬取的,该数据包含以下维度:景点名称,所属省市区,景点简介,门票价格,评分,近期销量,景点评级等。 爬虫比较简单,多分析下就可以,直接贴代码了
    爬虫代码
    基本上没什么反爬,加点延时别爬太快就是了...
    爬取下来之后直接入库,入库部分代码如下:
    入库
    当然,每个省份我只爬了前 10 页,因为后面的基本都是些不知名的旅游景点
    爬完之后看了下数据库有 4572 条数据,我想应该够了吧...
    有了数据之后,是不是就能搞事情了...,简单做几个分析
    数据分析
    接下来我们使用 pyecharts 来对爬取的数据做一个简单的分析
    1. 景点销量排行榜
    直接从数据库查出数据,丢进去就行。
    结果展示:
    2. 景点评级排行榜
    假期这么长,想玩的地方有很多!如何选择一个景点多的地方并且评级高的
    这样就能在一个地方尽情的玩耍,而不用四处奔波
    我们不妨来看看各省市能排的上号的景点有多少吧!
    代码如下:
    将数据查询出来后作一个简单的清洗,统计各省份 4A 级以上景点数量
    一起来看看吧
     
    再将这些数据放到地图上看看..更加直观
    3.各省销量排行榜
    通过该数据,可以看出哪些省市区的人会比较多...
    这样就能避免去人山人海的地方看人人人人.。。
    综合分析
    最终考虑去哪儿,可能需要多维度的分析。
    所有,我把价格,评分,销量这三个维度放在一起
    当然,你也可以选择你关心的维度来..最好自己动手试试
    这样印象深刻!
    来看看效果把:
    重点关注下销量高,评分高,价格合适的...
    提前祝大家国庆有个美好的假期! 此文转载文,著作权归作者所有,如有侵权联系小编删除!
  • 相关阅读:
    dotnet core 获取 MacAddress 地址方法
    dotnet core 获取 MacAddress 地址方法
    dotnet core 发布只带必要的依赖文件
    dotnet core 发布只带必要的依赖文件
    Developing Universal Windows Apps 开发UWA应用 问答
    Developing Universal Windows Apps 开发UWA应用 问答
    cmd 如何跨驱动器移动文件夹
    cmd 如何跨驱动器移动文件夹
    C++ 驱动开发 error LNK2019
    C++ 驱动开发 error LNK2019
  • 原文地址:https://www.cnblogs.com/wxys/p/13736259.html
Copyright © 2011-2022 走看看