Python和web初学 :屏幕抓取、CGI和mod_python
描述:
1、屏幕抓取:通过程序下载网页并提取其中的信息的过程。
方法:
1、使用正则表达式
2、结合程序Tidy(一个Python库)和XHTML解析
3、使用Beautiful Soup库