如何将字符串分割为字符列表?Str.split不起作用。

"foobar"    →    ['f', 'o', 'o', 'b', 'a', 'r']

当前回答

如果你只需要一个字符数组:

arr = list(str)

如果你想用一个特定的分隔符分隔str:

# str = "temp//temps" will will be ['temp', 'temps']
arr = str.split("//")

其他回答

from itertools import chain

string = 'your string'
chain(string)

类似于list(string),但返回的生成器在使用点被延迟计算,因此内存效率高。

如果希望只读访问字符串,可以直接使用数组表示法。

Python 2.7.6 (default, Mar 22 2014, 22:59:38) 
[GCC 4.8.2] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> t = 'my string'
>>> t[1]
'y'

对于不使用regexp的测试可能很有用。 字符串是否包含结束换行符?

>>> t[-1] == '\n'
False
>>> t = 'my string\n'
>>> t[-1] == '\n'
True

下面是一个很好的脚本,可以帮助你找到最有效的方法:

import timeit
from itertools import chain

string = "thisisthestringthatwewanttosplitintoalist"

def getCharList(str):
  return list(str)

def getCharListComp(str):
  return [char for char in str]

def getCharListMap(str):
  return list(map(lambda c: c, str))

def getCharListForLoop(str):
  list = []
  for c in str:
    list.append(c)

def getCharListUnpack(str):
  return [*str]

def getCharListExtend(str):
  list = []
  return list.extend(str)

def getCharListChain(str):
  return chain(str)
 
time_list = timeit.timeit(stmt='getCharList(string)', globals=globals(), number=1)
time_listcomp = timeit.timeit(stmt='getCharListComp(string)', globals=globals(), number=1)
time_listmap = timeit.timeit(stmt='getCharListMap(string)', globals=globals(), number=1)
time_listforloop = timeit.timeit(stmt='getCharListForLoop(string)', globals=globals(), number=1)
time_listunpack = timeit.timeit(stmt='getCharListUnpack(string)', globals=globals(), number=1)
time_listextend = timeit.timeit(stmt='getCharListExtend(string)', globals=globals(), number=1)
time_listchain = timeit.timeit(stmt='getCharListChain(string)', globals=globals(), number=1)

print(f"Execution time using list constructor is {time_list} seconds")
print(f"Execution time using list comprehension is {time_listcomp} seconds")
print(f"Execution time using map is {time_listmap} seconds")
print(f"Execution time using for loop is {time_listforloop} seconds")
print(f"Execution time using unpacking is {time_listunpack} seconds")
print(f"Execution time using extend is {time_listextend} seconds")
print(f"Execution time using chain is {time_listchain} seconds")

你也可以用这种非常简单的方式来做,没有list():

>>> [c for c in "foobar"]
['f', 'o', 'o', 'b', 'a', 'r']

如果你想一次处理一个字符串字符。你有多种选择。

uhello = u'Hello\u0020World'

使用列表推导式:

print([x for x in uhello])

输出:

['H', 'e', 'l', 'l', 'o', ' ', 'W', 'o', 'r', 'l', 'd']

使用地图:

print(list(map(lambda c2: c2, uhello)))

输出:

['H', 'e', 'l', 'l', 'o', ' ', 'W', 'o', 'r', 'l', 'd']

调用内置列表函数:

print(list(uhello))

输出:

['H', 'e', 'l', 'l', 'o', ' ', 'W', 'o', 'r', 'l', 'd']

使用for循环:

for c in uhello:
    print(c)

输出:

H
e
l
l
o

W
o
r
l
d