如何从字符串的末尾删除子字符串?

我有以下代码:

url = 'abcdc.com'
print(url.strip('.com'))

我以为是abcdc

我得到:abcd

现在我知道了

url.rsplit('.com', 1)

有没有更好的办法?

参见.strip/.rstrip/。lstrip字符串方法在Python中工作?对于第一次尝试的具体解释。

当前回答

如果你只想剥离扩展:

'.'.join('abcdc.com'.split('.')[:-1])
# 'abcdc'

它适用于任何扩展名，与潜在的其他点存在的文件名以及。它只是将字符串拆分为一个点列表，并在没有最后一个元素的情况下将其连接起来。

其他回答

import re

def rm_suffix(url = 'abcdc.com', suffix='\.com'):
    return(re.sub(suffix+'$', '', url))

我想重复一下这个答案，作为最具表现力的回答。当然，以下操作会占用更少的CPU时间:

def rm_dotcom(url = 'abcdc.com'):
    return(url[:-4] if url.endswith('.com') else url)

但是，如果CPU是瓶颈，为什么要用Python编写呢?

CPU什么时候会成为瓶颈?在驾驶方面，可能是这样。

使用正则表达式的优点是代码可重用性。如果你接下来想要移除。Me '，只有三个字?

同样的代码可以做到这一点:

>>> rm_sub('abcdc.me','.me')
'abcdc'

Strip并不是指“删除这个子字符串”。x.strip(y)将y视为一个字符集，并从x的两端剥离该字符集中的任何字符。

在Python 3.9及更新版本中，您可以使用removeprefix和removesuffix方法从字符串的任意一侧删除整个子字符串:

url = 'abcdc.com'
url.removesuffix('.com')    # Returns 'abcdc'
url.removeprefix('abcdc.')  # Returns 'com'

相关的Python增强提案是PEP-616。

在Python 3.8及以上版本中，你可以使用endswith和slicing:

url = 'abcdc.com'
if url.endswith('.com'):
    url = url[:-4]

或者正则表达式:

import re
url = 'abcdc.com'
url = re.sub('\.com$', '', url)

如果你确定字符串只出现在末尾，那么最简单的方法是使用'replace':

url = 'abcdc.com'
print(url.replace('.com',''))

url[:-4]怎么样?

如果你知道是分机，那么

url = 'abcdc.com'
...
url.rsplit('.', 1)[0]  # split at '.', starting from the right, maximum 1 split

这同样适用于abcdc.com或www.abcdc.com或abcdc。[任何东西]并且更具有可扩展性。

推荐文章