zoukankan      html  css  js  c++  java
  • Python爬虫入门教程 71-100 续上篇,python爬虫爬取B站视频

    写在前面

    上篇博客我们用比较大的篇幅分析了B站视频传输方式,这篇博客填一下之前留下的坑,我们把代码部分写出来。

    文章来源:梦想橡皮擦,其实这个ID是一个组合

    分析的步骤与逻辑这里不再重复给大家演示了,可以翻看 https://blog.csdn.net/hihell/article/details/106546531 这篇文章,里面有清晰的说明。

    先记住

    30280.m4s,对应音频文件
    30064.m4s,对应视频文件

    编码时间

    B站视频虽然已经分析完毕,但是实际编码还是有难度的,所以坚持住,我们一起搞定它。

    全篇文章使用的链接为:https://www.bilibili.com/video/BV1Pv41167FE ,BV链接,B站升级之后从AV连接提升到BV,反爬技术成倍的叠加。

    通过Fiddler抓取,分析之后,我们得到了这样的一些结论,重点如下图所示,页面返回状态码为206,这个需要关注下

    Python爬虫入门教程 71-100 续上篇,python爬虫爬取B站视频
    上面的图片,可能你看的比较晕,还是不要急,点击一个链接,我们需要看一下它是如何请求与返回数据的。分析之后,你会发现一个奇怪的现象,在链接相同的情况下,请求返回一个状态码是200,另一个是206。

    html>

  • 相关阅读:
    Beta 答辩总结
    Beta 冲刺 (7/7)
    Beta 冲刺 (6/7)
    Beta 冲刺 (5/7)
    Beta 冲刺 (4/7)
    Beta 冲刺 (3/7)
    软件产品案例分析(团队)
    概率图模型7:条件随机场(2)
    推荐系统概述3
    概率图模型6:条件随机场(1)
  • 原文地址:https://www.cnblogs.com/hzcya1995/p/13311461.html
Copyright © 2011-2022 走看看