将字符串转换为有效的文件名?

我有一个字符串，我想用它作为文件名，所以我想用Python删除文件名中不允许的所有字符。

我宁愿严格一点，所以假设我想只保留字母、数字和一小组其他字符，如“_-.()”。”。最优雅的解决方案是什么?

文件名需要在多个操作系统(Windows, Linux和Mac OS)上有效——它是我库中的一个MP3文件，以歌曲标题为文件名，并在3台机器之间共享和备份。

当前回答

为python 3.6修改的答案

import string
import unicodedata

validFilenameChars = "-_.() %s%s" % (string.ascii_letters, string.digits)
def removeDisallowedFilenameChars(filename):
    cleanedFilename = unicodedata.normalize('NFKD', filename).encode('ASCII', 'ignore')
    return ''.join(chr(c) for c in cleanedFilename if chr(c) in validFilenameChars)

2019-04-22 04:48:57

其他回答

这是我最终使用的解决方案:

import unicodedata

validFilenameChars = "-_.() %s%s" % (string.ascii_letters, string.digits)

def removeDisallowedFilenameChars(filename):
    cleanedFilename = unicodedata.normalize('NFKD', filename).encode('ASCII', 'ignore')
    return ''.join(c for c in cleanedFilename if c in validFilenameChars)

unicodedata。Normalize调用将重音字符替换为同等的非重音字符，这比简单地将它们剥离要好。之后，所有不允许的字符都将被删除。

我的解决方案没有预先添加一个已知字符串，以避免可能的不允许文件名，因为我知道给定特定的文件名格式，它们不会出现。这需要一个更普遍的解决方案。

2009-03-30 19:40:17

不完全是OP要求的，但这是我使用的，因为我需要唯一的和可逆的转换:

# p3 code
def safePath (url):
    return ''.join(map(lambda ch: chr(ch) if ch in safePath.chars else '%%%02x' % ch, url.encode('utf-8')))
safePath.chars = set(map(lambda x: ord(x), '0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz+-_ .'))

结果“有些”可读，至少从系统管理员的角度来看是这样。

2014-09-12 12:19:39

使用字符串作为文件名的原因是什么?如果人类的可读性不是一个因素，我会使用base64模块，它可以产生文件系统安全字符串。它是不可读的，但你不需要处理碰撞，而且它是可逆的。

import base64
file_name_string = base64.urlsafe_b64encode(your_string)

更新:根据Matthew的评论修改。

2008-11-17 09:12:02

为什么不直接用try/except来包装“osopen”，让底层操作系统来判断文件是否有效?

这看起来工作量少得多，而且无论您使用哪种操作系统都是有效的。

2008-11-17 11:24:49

您可以将列表推导式与字符串方法一起使用。

>>> s
'foo-bar#baz?qux@127/\\9]'
>>> "".join(x for x in s if x.isalnum())
'foobarbazqux1279'

2008-11-17 09:12:49

将字符串转换为有效的文件名?

推荐文章

最新文章

标签