前言
我在微信读书APP上看了一些书,但很多都只是过了一遍,看完了也就忘了。这对于专业书籍来说,读一遍相当于没读,所以把自己做的笔记导出来看看增强记忆,是很有必要的。
遗憾的是微信读书APP只提供了将笔记复制到剪切板,然后粘贴到其他地方,而PC端版本连剪切的功能都没有,更不用说导出了。更为操蛋的是这个APP支持选择的笔记条数是有限的,如果笔记做得多的话,你得分好几次选择导出,而且要找到上次选择的位置。作为中国最大的互联网公司的核心产品之一,这种简单的需求都满足不了,我只能忍住爆粗口。
于是,我在网上找了个别人开发的爬虫工具,将自己的微信读书笔记内容导了出来,简要记录下。
实践
1. 爬虫工具准备
Github上的源码:https://github.com/arry-lee/wereader,Python3写的,将其克隆到本地。
使用方法都有简单说明:
- 浏览器打开 https://x.weread.qq.com
- 微信扫码登录确认,提示没有权限忽略即可
F12
获取Cookie
字符串拷贝到settings.py
中Cookie
一段时间就会失效 必须重新登录获取
2.获取cookie
这步是关键,关于怎么获取,可见这个回答:https://jingyan.baidu.com/article/5d368d1ea6c6e33f60c057ef.html
。我使用的是第一种方法获取cookie
。
3.导出笔记
使用任意一个IDE
,我用的Pycharm
,新建一个工程,打开脚本,先在settings.py
中设置好刚拷贝的cookie
,如下:
设置好后,运行client.py
程序即可,可根据自己需求修改脚本,导出笔记保存,笔记导出的格式可以是markdown
。
不过我发现,这个工具导出的内容并不全面,有些我明明是做了笔记却没有导出。而且它导出的章节顺序是反的,这可就一点也不友好了。当然,可以在作者脚本的基础上修改,后续有时间再看看。