如何在python中找到文件的mime类型?

假设您想要在某个地方保存一堆文件，例如在blob中。假设您希望通过网页分发这些文件，并让客户端自动打开正确的应用程序/查看器。

假设:浏览器通过HTTP响应中的mime-type (content-type?)报头确定要使用哪个应用程序/查看器。

基于这个假设，除了文件的字节外，还需要保存MIME类型。

如何找到文件的MIME类型?我现在用的是Mac，但这应该也适用于Windows。

浏览器是否在将文件发布到网页时添加此信息?

是否有一个简洁的python库来查找这些信息?WebService还是(更好的)一个可下载的数据库?

当前回答

这似乎很简单

>>> from mimetypes import MimeTypes
>>> import urllib 
>>> mime = MimeTypes()
>>> url = urllib.pathname2url('Upload.xml')
>>> mime_type = mime.guess_type(url)
>>> print mime_type
('application/xml', None)

请参阅旧帖

更新-在python 3+版本中，现在更方便了:

import mimetypes
print(mimetypes.guess_type("sample.html"))

2014-02-13 13:09:49

其他回答

有3个不同的库包装libmagic。

其中2个在pypi上可用(所以PIP安装可以工作):

filemagic python-magic

另一种类似于python-magic的方法可以在最新的libmagic源代码中直接获得，它可能是您的linux发行版中所拥有的。

在Debian中，python-magic包就是这样的，它像toivotuo说的那样被使用，它并没有像Simon Zimmermann说的那样被淘汰(IMHO)。

在我看来，这是另一种说法(出自《libmagic》的原作者)。

太糟糕了，pypi上不能直接使用。

2012-09-06 10:22:50

标准库中的mimetypes模块将根据文件扩展名确定/猜测MIME类型。

如果用户正在上传文件，HTTP post将在数据旁边包含文件的MIME类型。例如，Django将此数据作为UploadedFile对象的属性提供。

2008-09-04 12:12:20

13年后…… 本页上关于python3的大多数答案不是过时就是不完整。要获得我使用的文件的mime类型:

import mimetypes

mt = mimetypes.guess_type("https://www.w3.org/WAI/ER/tests/xhtml/testfiles/resources/pdf/dummy.pdf")
if mt:
    print("Mime Type:", mt[0])
else:
    print("Cannot determine Mime Type")

# Mime Type: application/pdf

现场演示

来自Python文档:

mimetype。guess_type (url,严格= True)

根据文件的文件名、路径或URL (URL)来猜测文件的类型。URL可以是字符串或类似路径的对象。

返回值是一个元组(type, encoding)，如果无法猜到类型(缺少或未知后缀)，则type为None，或者是一个'type/subtype'形式的字符串，可用于MIME内容类型头。

encoding为None，表示没有编码或用于编码的程序名称(例如compress或gzip)。该编码适合作为Content-Encoding标头使用，而不是Content-Transfer-Encoding标头。映射是表驱动的。编码后缀区分大小写;类型后缀首先区分大小写，然后不区分大小写。

可选的strict参数是一个标志，指定已知MIME类型列表是否仅限于在IANA注册的正式类型。当strict为True(默认值)时，只支持IANA类型;当strict为False时，一些额外的非标准但常用的MIME类型也会被识别出来。

在3.8版更改:增加了对url是类路径对象的支持。

2021-02-02 15:08:42

mimetypes模块只是基于文件扩展名来识别文件类型。如果尝试恢复没有扩展名的文件的文件类型，mimetypes将不起作用。

2012-06-19 12:51:55

libmagic的Python绑定

关于这个主题的所有不同答案都非常令人困惑，所以我希望通过概述libmagic的不同绑定来更清楚地说明问题。以前mammadori给出了一个简短的回答，列出了可用的选项。

libmagic

模块名称:魔术 pypi: file-magic 来源:https://github.com/file/file/tree/master/python

在确定文件mime类型时，所选择的工具简单地称为file，其后端称为libmagic。(请参阅项目主页。)该项目是在一个私有cvs存储库中开发的，但在github上有一个只读的git镜像。

现在，如果你想在python中使用任何libmagic绑定，你将需要这个工具，它已经自带名为file-magic的python绑定。关于它们没有太多专门的文档，但是您可以查看c库的手册页:man libmagic。基本用法在自述文件中描述:

import magic

detected = magic.detect_from_filename('magic.py')
print 'Detected MIME type: {}'.format(detected.mime_type)
print 'Detected encoding: {}'.format(detected.encoding)
print 'Detected file type name: {}'.format(detected.name)

除此之外，您还可以使用示例文件中所示的Magic .open(flags)创建Magic对象来使用这个库。

toivotuo和ewr2san都使用文件工具中包含的这些文件魔术绑定。他们错误地认为，他们使用的是python魔法包。这似乎表明，如果同时安装了file和python-magic，则python模块magic指的是前者。

python-magic

模块名称:魔术 pypi: python-magic 来源:https://github.com/ahupp/python-magic

这是Simon Zimmermann在他的回答中提到的图书馆，Claude COULOMBE和Gringo Suave也使用了这个图书馆。

filemagic

模块名称:魔术 pypi: filemagic 来源:https://github.com/aliles/filemagic

注:本项目最后一次更新是在2013年!

由于基于相同的c-api，这个库与libmagic中包含的file-magic有一些相似之处。只有mammadori提到过，没有其他答案使用它。

2018-06-22 10:25:39

如何在python中找到文件的mime类型?

推荐文章

最新文章

标签