zoukankan html css js c++ java

python爬虫（二） urlparse和urlsplit函数

urlparse和urlsplit函数：

urlparse：

url='http://www.baidu.com/s?wd=python&username=abc#1'

result=parse.urlparse(url)

print(result)

输入的结果为解析之后的各部分

输出对应的参数：

url='http://www.baidu.com/s?wd=python&username=abc#1'

result=parse.urlparse(url)

# print(result)
print('scheme:',result.scheme)
print('netloc:',result.netloc)
print('path:',result.path)
print('params:',result.params)
print('query:',result.query)
print('fragment:',result.fragment)

结果就是输入的网址各个部分

urlsplit：

url='http://www.baidu.com/s?wd=python&username=abc#1'
result=parse.urlsplit(url)
print(result)

这个里面没有params这个参数

因为在urlparse中，

在这个网址问好前面加一个分号，分号和问好中间加一个hello

urlparse这个函数的params这个参数就是为了获得分号和问号中间的值

在平时使用中两个函数是一样的。

查看全文

相关阅读:
mapreduce的组件介绍
 [转]编译hadoop
hadoop-2.7.2-HA安装笔记
 Maven常用命令
 Maven教程
 [转]Mahout推荐算法API详解
 [转]hadoop新手错误解决方法
 mysql命令
 [java笔记]JDK的安装和配置
 Nginx常见错误解决办法

原文地址：https://www.cnblogs.com/zhaoxinhui/p/12358196.html