zoukankan      html  css  js  c++  java
  • 个人 圈外同学 一个简单的数据分析

    原文:圈外的微信群,这里只是作为笔记。



    一、背景


    1、目标

    对拉勾网的【数据分析岗位】上海地区企业分析,需要知道招聘【数据分析岗位】的上海公司所属【行业类型】

    2、大致流程

    1. 后羿采集器抓取数据
    2. Excel对数据分列
    3. Excel建立数据透视表,计算值



    二、数据采集


    1、准备工具

    1. 目标数据:https://www.lagou.com/jobs/list_数据分析师/p-city_3?&cl=false&fromSearch=true&labelWords=&suginput=

    2. 爬虫工具:后羿采集器

    2、选择模式,打开后羿采集器,选择右边的智能采集模式,点击开始采集


    3、填入数据地址,填入准备好的数据地址,点击开始创建


    4、去页面广告

    1. 点击按钮预执行操作


    2. 选择底部左边按钮点击

    3. 再点击页面的按钮给也不要

    4. 选择左上角的操作提示中的点击一下

    5、清空所有数据,自定义数据列。

    1. 点击清空所有,即可清空所有字段。
    2. 点击添加字段,然后鼠标移动到需要抓取的数据那儿即可添加字段。


    6、开始采集,保存,然后导出Excel




    三、数据分析


    1、数据拆分,打开Excel -> 选中目标列 -> 数据 -> 分列 -> 下一步 -> 选择需要的分隔符 -> 下一步 -> 完成


    1. 分隔符的设置


    2. 原始数据


    3. 处理后的数据


    2、建立数据透视表,选择目标列 -> 数据 -> 数据透视表 -> 确定

    1. 字段列表,选中要显示的字段
    2. 数据透视表区域,把字段列表的字段,拖入到数据透视表区域那个区域中
  • 相关阅读:
    批处理学习总结之常用命令1
    Delphi常用数据类型
    Delphi预编译指令总结
    Delphi同步互斥总结
    MyEclipse 环境配置总结
    倒排索引
    laravel 学习相关笔记
    elasticsearch倒排索引原理
    原生sql和 TP sql怎么关联?
    elastic
  • 原文地址:https://www.cnblogs.com/guxingy/p/13129701.html
Copyright © 2011-2022 走看看