如何检查Python中的字符串是否是ASCII?

我想检查一个字符串是否是ASCII格式的。

我知道ord()，但是当我尝试ord('é')时，我有TypeError: ord()期望一个字符，但发现长度为2的字符串。我知道这是由我构建Python的方式引起的(如ord()的文档所解释的那样)。

还有别的办法吗?

当前回答

最近遇到了类似的事情，供以后参考

import chardet

encoding = chardet.detect(string)
if encoding['encoding'] == 'ascii':
    print 'string is in ascii'

你可以用在:

string_ascii = string.decode(encoding['encoding']).encode('ascii')

2011-08-08 20:47:22

其他回答

Python中的sting (str-type)是一系列字节。仅仅通过查看字符串无法判断这一系列字节是否代表ascii字符串、像ISO-8859-1这样的8位字符集的字符串，还是用UTF-8或UTF-16或其他编码的字符串。

但是，如果您知道使用的编码，那么您可以将str解码为unicode字符串，然后使用正则表达式(或循环)检查它是否包含您所关心的范围之外的字符。

2008-10-14 07:58:08

最近遇到了类似的事情，供以后参考

import chardet

encoding = chardet.detect(string)
if encoding['encoding'] == 'ascii':
    print 'string is in ascii'

你可以用在:

string_ascii = string.decode(encoding['encoding']).encode('ascii')

2011-08-08 20:47:22

要从Python 2.6(以及Python 3.x)改进Alexander的解决方案，您可以使用helper模块curses。ASCII和使用curses.ascii.isascii()函数或其他各种:https://docs.python.org/2.6/library/curses.ascii.html

from curses import ascii

def isascii(s):
    return all(ascii.isascii(c) for c in s)

2015-05-22 08:48:46

在Python 3中，我们可以将字符串编码为UTF-8，然后检查长度是否保持不变。如果是，那么原始字符串是ASCII。

def isascii(s):
    """Check if the characters in string s are in ASCII, U+0-U+7F."""
    return len(s) == len(s.encode())

要检查，通过测试字符串:

>>> isascii("♥O◘♦♥O◘♦")
False
>>> isascii("Python")
True

2013-08-23 13:14:49

Python 3.7新增功能(bpo32677)

不再对字符串进行烦人/低效的ascii检查，新的内置str/bytes/bytearray方法- .isascii()将检查字符串是否为ascii。

print("is this ascii?".isascii())
# True

2018-07-02 18:32:22

如何检查Python中的字符串是否是ASCII?

推荐文章

最新文章

标签