Python的urllib库是一个用于操作URL的Python标准库,它包含了多个模块,可以用来发送请求、处理请求返回的数据以及处理URL。在这篇文章中,我将介绍urllib库的基本用法和一些常见的操作。
首先,我们来看一下urllib库中的主要模块:
1. urllib.request:用于发送请求和获取请求返回的数据。它包含了一些常用的函数,如urlopen()用来打开一个URL并发送请求,urlretrieve()用来下载文件等。
2. urllib.parse:用于处理URL。它包含了一些用于解析和拼接URL的函数,如urlsplit()用于将URL拆分成不同的部分,urljoin()用于拼接URL等。
3. urllib.error:用于处理URL请求时出现的错误。它包含了一些异常类,如HTTPError、URLError等。
接下来,我们来看一些urllib库的基本用法。
1. 发送GET请求:
```python
import urllib.request
url = 'http://www.example.com'
response = urllib.request.urlopen(url)
html = response.read().decode('utf-8')
print(html)
```
在这个例子中,我们通过urlopen()函数打开了一个URL,并读取了返回的HTML内容。
2. 发送POST请求:
```python
import urllib.parse
import urllib.request
url = 'http://www.example.com'
data = urllib.parse.urlencode({'param1': 'value1'
'param2': 'value2'}).encode('utf-8')
response = urllib.request.urlopen(url
data)
html = response.read().decode('utf-8')
print(html)
```
在这个例子中,我们通过urlencode()函数将参数编码成URL格式,然后通过urlopen()函数发送了一个POST请求。
3. 文件下载:
```python
import urllib.request
url = 'http://www.example.com/file.txt'
filename
headers = urllib.request.urlretrieve(url
'file.txt')
print('Downloaded file:'
filename)
```
在这个例子中,我们使用urlretrieve()函数下载了一个文件,并打印出了文件名。