哈喽大家好 我是阿喵,今天也是学习爬虫的一天
利用python写一个简单的笔趣阁爬虫,根据输入的小说网址爬取整个小说并保存到txt文件。爬虫用到了BeautifulSoup库的select方法
结果如图所示:

本文只用于学习爬虫
一、网页解析
这里以斗罗大陆小说为例 网址:
http://www.biquge001.com/Book/2/2486/

可以发现每章的网页地址和章节名都放在了 <"div id=list dl dd a>中的a标签中,所以利用BeautfulSoup中的select方法可以得到网址和章节名
然后遍历列表
然后每章小说的内容都存放在<div id=“content” 里 同理得
最后同理在首页获取小说的名称
<"div id = info h1>

二、代码填写
1.获取Html及写入方法
2.其余代码
代码如下(示例):
总结
简单利用了BeautfulSoup的select方法对笔趣阁的网页进行了爬取
在这里还是要推荐下我自己建的Python学习群:609616831,群里都是学Python的,如果你想学或者正在学习Python ,欢迎你加入,大家都是软件开发党,不定期分享干货(只有Python软件开发相关的),包括我自己整理的一份2020最新的Python进阶资料和零基础教学,欢迎进阶中和对Python感兴趣的小伙伴加入!