zoukankan      html  css  js  c++  java
  • Python爬虫入门教程 63-100 Python字体反爬之一,没办法,这个必须写,反爬第3篇

    背景交代

    在反爬圈子的一个大类,涉及的网站其实蛮多的,目前比较常被爬虫coder欺负的网站,猫眼影视,汽车之家,大众点评,58同城,天眼查…还是蛮多的,技术高手千千万,总有五花八门的反爬技术出现,对于爬虫coder来说,干!就完了,反正也996了~

    作为一个系列的文章,那免不了,依旧拿猫眼影视“学习”吧,为什么?因为它比较典型~

    猫眼影视

    打开猫眼专业版,常规操作,谷歌浏览器,开发者工具,抓取DOM节点,

    https://piaofang.maoyan.com/?ver=normal

    注意下图所有的数字位置,在DOM结构中,都是方块。
    在这里插入图片描述

    字体反爬扫盲

    字体反爬,是一种常见的反爬技术,网站采用了自定义的字体文件,在浏览器上正常显示,但是爬虫抓取下来的数据要么就是乱码,要么就是变成其他字符。采用自定义字体文件是CSS3的新特性,熟悉前端的同学可能知道,就是font-face属性

    一些重要破解素材的收集

    找到font-family属性,查看设置的内容,发现是cs字体,这明显是自定义字体了,在网页中检索cs
    html>

  • 相关阅读:
    02-05 flutter provider的使用
    02-04 flutter 构造函数总结
    02-03 flutter异步
    02-02dart语法
    02-01dart语法
    01-01 iOS内存对齐、内存对齐算法
    01-02 iOS kvo、kvc
    01-03 category 原理概述
    多线程编程 (2) -NSOperation
    IOS基本控件属性
  • 原文地址:https://www.cnblogs.com/hzcya1995/p/13311527.html
Copyright © 2011-2022 走看看