如何通过HTTP下载文件?

我有一个小工具，我用来从一个网站上下载一个MP3文件，然后构建/更新一个播客XML文件，我已经添加到iTunes。

创建/更新XML文件的文本处理是用Python编写的。但是，我在Windows .bat文件中使用wget来下载实际的MP3文件。我更喜欢用Python编写整个实用程序。

我努力寻找一种用Python实际下载该文件的方法，因此我使用了wget。

那么，如何使用Python下载文件呢?

当前回答

使用wget模块:

import wget
wget.download('url')

2015-03-25 12:59:25

其他回答

延迟回答，但对于python>=3.6，您可以使用:

import dload
dload.save(url)

安装dload:

pip3 install dload

2020-02-24 07:12:14

使用wget模块:

import wget
wget.download('url')

2015-03-25 12:59:25

如果你安装了wget，你可以使用parallel_sync。

PIP安装parallel_sync

from parallel_sync import wget
urls = ['http://something.png', 'http://somthing.tar.gz', 'http://somthing.zip']
wget.download('/tmp', urls)
# or a single file:
wget.download('/tmp', urls[0], filenames='x.zip', extract=True)

道格: https://pythonhosted.org/parallel_sync/pages/examples.html

这是非常强大的。它可以并行下载文件，失败时重试，甚至可以在远程机器上下载文件。

2015-11-19 23:48:06

我同意Corey的观点，urllib2比urllib更完整，如果你想做更复杂的事情，应该使用urllib2模块，但为了让答案更完整，如果你只想要基本的东西，urllib是一个更简单的模块:

import urllib
response = urllib.urlopen('http://www.example.com/sound.mp3')
mp3 = response.read()

会很好。或者，如果你不想处理"response"对象，你可以直接调用read():

import urllib
mp3 = urllib.urlopen('http://www.example.com/sound.mp3').read()

2008-08-22 15:58:52

另一种可能是使用内置的http.client:

from http import HTTPStatus, client
from shutil import copyfileobj

# using https
connection = client.HTTPSConnection("www.example.com")
with connection.request("GET", "/noise.mp3") as response:
    if response.status == HTTPStatus.OK:
        copyfileobj(response, open("noise.mp3")
    else:
        raise Exception("request needs work")

HTTPConnection对象被认为是“低级的”，因为它只执行一次所需的请求，并假设开发人员将对它或脚本进行子类化，以处理HTTP的细微差别。诸如请求之类的库倾向于处理更特殊的情况，例如自动跟随重定向等等。

2022-10-17 13:19:29

如何通过HTTP下载文件?

推荐文章

最新文章

标签