如何将列表的字符串表示转换为列表

我想知道最简单的方法是将如下列表的字符串表示转换为列表：

x = '[ "A","B","C" , " D"]'

即使在用户在逗号之间加空格，在引号内加空格的情况下，我也需要处理它并将其转换为：

x = ["A", "B", "C", "D"]

我知道我可以用strip（）和split（）分隔空格，并检查非字母字符。但代码变得非常笨拙。有没有我不知道的快速功能？

当前回答

如果有字符串化的字典列表，json模块是更好的解决方案。可以使用json.loads（your_data）函数将其转换为列表。

>>> import json
>>> x = '[ "A","B","C" , " D"]'
>>> json.loads(x)
['A', 'B', 'C', ' D']

类似地

>>> x = '[ "A","B","C" , {"D":"E"}]'
>>> json.loads(x)
['A', 'B', 'C', {'D': 'E'}]

2016-02-17 15:39:52

其他回答

我想用正则表达式提供一个更直观的模式化解决方案。下面的函数将包含任意字符串的字符串化列表作为输入。

逐步解释：您删除了所有的白间距、括号和value_separator（如果它们不是要提取的值的一部分，否则会使正则表达式更复杂）。然后将清理后的字符串拆分为单引号或双引号，并取非空值（或奇数索引值，无论首选项如何）。

def parse_strlist(sl):
import re
clean = re.sub("[\[\],\s]","",sl)
splitted = re.split("[\'\"]",clean)
values_only = [s for s in splitted if s != '']
return values_only

测试样本：“['21'，”foo“'6'，'0'，”A“]”

2018-06-01 09:32:00

从上面使用基本Python包的一些答案中，我比较了几个（使用Python 3.7.3）的性能：

方法1:ast

import ast

list(map(str.strip, ast.literal_eval(u'[ "A","B","C" , " D"]')))
# ['A', 'B', 'C', 'D']

import timeit
timeit.timeit(stmt="list(map(str.strip, ast.literal_eval(u'[ \"A\",\"B\",\"C\" , \" D\"]')))", setup='import ast', number=100000)
# 1.292875313000195

方法2:json

import json
list(map(str.strip, json.loads(u'[ "A","B","C" , " D"]')))
# ['A', 'B', 'C', 'D']

import timeit
timeit.timeit(stmt="list(map(str.strip, json.loads(u'[ \"A\",\"B\",\"C\" , \" D\"]')))", setup='import json', number=100000)
# 0.27833264000014424

方法3：不导入

list(map(str.strip, u'[ "A","B","C" , " D"]'.strip('][').replace('"', '').split(',')))
# ['A', 'B', 'C', 'D']

import timeit
timeit.timeit(stmt="list(map(str.strip, u'[ \"A\",\"B\",\"C\" , \" D\"]'.strip('][').replace('\"', '').split(',')))", number=100000)
# 0.12935059100027502

我很失望地看到，我认为可读性最差的方法是性能最好的方法。。。在选择最具可读性的选项时，需要考虑一些权衡。。。对于我使用Python的工作负载类型，我通常看重可读性，而不是性能稍高的选项，但这通常取决于。

2019-05-01 03:54:25

假设您的所有输入都是列表，并且输入中的双引号实际上无关紧要，这可以通过简单的正则表达式替换来完成。这有点过时，但它就像一种魅力。还要注意，输出现在是一个Unicode字符串列表，您没有指定需要它，但考虑到Unicode输入，它似乎是有意义的。

import re
x = u'[ "A","B","C" , " D"]'
junkers = re.compile('[[" \]]')
result = junkers.sub('', x).split(',')
print result
--->  [u'A', u'B', u'C', u'D']

junkers变量包含我们不需要的所有字符的编译正则表达式（为了速度），使用]作为字符需要一些反斜杠技巧。re.sub将所有这些字符都替换为空，我们在逗号处拆分得到的字符串。

注意，这也会从条目u'[“oh no”]'->[u'ohno']中删除空格。如果这不是您想要的，则需要对regexp进行一些升级。

2009-12-12 22:18:37

eval很危险——你不应该执行用户输入。

如果您有2.6或更高版本，请使用ast而不是eval：

>>> import ast
>>> ast.literal_eval('["A","B" ,"C" ," D"]')
["A", "B", "C", " D"]

一旦你做到了，就把绳子脱下来。

如果您使用的是较旧版本的Python，则可以使用简单的正则表达式来实现所需的功能：

>>> x='[  "A",  " B", "C","D "]'
>>> re.findall(r'"\s*([^"]*?)\s*"', x)
['A', 'B', 'C', 'D']

这不如ast解决方案好，例如，它不能正确处理字符串中的转义引号。但它很简单，不涉及危险的求值，如果您使用的是没有ast的旧Python，那么它可能足以满足您的目的。

2009-12-12 18:29:08

import ast
l = ast.literal_eval('[ "A","B","C" , " D"]')
l = [i.strip() for i in l]

2009-12-12 18:29:02

如何将列表的字符串表示转换为列表

推荐文章

最新文章

标签