Python3 urllib抓取指定URL的内容 - 走看看

zoukankan html css js c++ java

Python3 urllib抓取指定URL的内容
最近在研究Python，熟悉了一些基本语法和模块的使用；现在打算研究一下Python爬虫。学习主要是通过别人的博客和自己下载的一下文档进行的，自己也写一下博客作为记录学习自己过程吧。Python代码写起来和Java的感觉很不一样。
Python爬虫主要使用的是urllib模块，Python2.x版本是urllib2，很多博客里面的示例都是使用urllib2的，因为我使用的是Python3.3.2，所以在文档里面没有urllib2这个模块，import的时候会报错，找不到该模块，应该是已经将他们整合在一起了。

下面是一个简单的代码示例：

[python] view plain copy

#encoding:UTF-8

import urllib.request

def getdata():

    url="http://www.baidu.com"

    data=urllib.request.urlopen(url).read()

    print(data)



getdata()

结果：

中文转码，修改一下代码：

[python] view plain copy

#encoding:UTF-8

import urllib.request

def getdata():

    url="http://www.baidu.com"

    data=urllib.request.urlopen(url).read()

    z_data=data.decode('UTF-8')

    print(z_data)



getdata()

结果如下：

研究Python到现在有差不多一周的时间这样，由于是刚入门，所以还有多东西需要学习的。比如这里需要使用正则表达式提取数据还需要进一步学习。

好了，以后再慢慢研究。欢各路前辈指导。
查看全文

相关阅读:
ReactNative 适合初学的第一个教程demo，找租房
 ReactNative 从环境和第一个demo说起，填坑教程
 WKWebView与JS交互，UIWebView+JavascriptCore和JS交互
 JS中匿名函数$(function(){ })和(function(){})()的区别
 对前端的一个H5项目的所思所想
 使用Swift打造动态库SDK和DemoAPP时所遇到的（Xcode7.3）
Git 分支合并代码
 Flutter中fluro使用
 flutter_redux框架的使用
 解决React-native init 初始化时 info Installing required CocoaPods dependencies

原文地址：https://www.cnblogs.com/fclbky/p/4149748.html

Copyright © 2011-2022 走看看