zoukankan      html  css  js  c++  java
  • 爬虫第一步,re模块来铺路


    真的困炸了,我还能撑多久,为什么每天都睡不够呢,原因到底是什么,原因就是我真的没睡够啊他娘的。
    我才睡六个小时多一点,今天晚上洗完澡十二点多必须睡觉,不睡的话就是傻逼。
    眼皮架不住,我要学tom

    打气打气,给我的脑子也打打气

    今日洗脑金句: 好的朋友推你一把,坏的朋友扯你一下,鉴别损友,即日做起。

    re模块

    朋友,想要实现梦想吗,想要免费看片吗?想要在网上尽情冲浪吗!那你就得好好学习这个模块啦!

    学好了这个模块,就等于解决了一部分的爬虫,离你的梦想又进了一步。

    什么是re模块?

    一、正则表达式

    正则表达式本身是一种小型的、高度专业化的编程语言,它并不是Python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大。得益于这一点,在提供了正则表达式的语言里,正则表达式的语法都是一样的,区别只在于不同的编程语言实现支持的语法数量不同;但不用担心,不被支持的语法通常是不常用的部分。如果已经在其他语言里使用过正则表达式,只需要简单看一看就可以上手了。而在python中,通过内嵌集成re模块,程序员们可以直接调用来实现正则匹配。正则表达式模式被编译成一系列的字节码,然后由用C编写的匹配引擎执行。

    巴拉巴拉,巴拉巴拉。 就是在一串字符串里找特定的字符串。

    1566301645328

    这么多东西,不是所有的都要精通,我来讲一下需要好好学的内容。

    既然是模块,就要import

    昨天有个读者向我抱怨说我的图太少了,想要看我ide的截图,好吧,真是抱歉,接下来多放一些图。

    img

    好了,re模块非常重要,一定要把这里的内容掌握,不求背下去,但是至少在遇到的时候要知道能用这个解决,然后通过百度或者其他资源途经找到解决方法。

    还有,感谢轻哥,我从来没想到原来可以截图ide的内容,我长这么大都没遇到过这么无理的要求。居然要我放截图。

    img

    ​ @xxx

    typing模块

    typing模块: 提供了Generator,Iterable,Iterator三种数据类型,限制函数

    他就是用来限制参数的数据类型的。

    其实就是很鸡肋的东西,只要你代码写写规范,就根本用不到,就算你不规范出错了,也可以很快的就找到问题所在了,根本用不到这种模块,画蛇添足。垃圾

    collections模块

    collections模块: 复杂的数据类型

    所以今天主要的重要内容还是re模块,多学习这个模块,用来提取爬取过来的信息中的关键字段十分有用,加油宝贝,洗洗睡。

  • 相关阅读:
    在一个很长的字符串中搜索自定义字符串的问题(通过多线程实现)
    老鼠走迷宫
    js控制父子页面传值(iframe和window.open)
    C#后台跳转
    CSS小技巧-图片自动缩放
    js中去除换行( )
    js去除首尾空格
    JQuery隔行变色
    Web开发在线工具
    JQuery标签去重与数组去重
  • 原文地址:https://www.cnblogs.com/chanyuli/p/11385632.html
Copyright © 2011-2022 走看看