时间:2022-05-22 08:20:28 | 栏目:Python代码 | 点击:次
在使用 Python 处理字符串的时候,有时候会需要分割字符。 分隔符比如下划线 “_”,比如 “.”之类的。
一个分隔符 比如对于文件名 20191022_log.zip,我们想要获取前面的日期。 如果日期格式固定,对于这样的字符串我们当然可以使用索引进行切割。 当然也可以使用字符串的内建函数 split(). 结果返回的是一个列表。 如果分隔符不在字符串之列,那么返回的也是一个列表,不过元素只有一个,那就是这个字符串自身: 多个分隔符 还是上面那个例子,如果字符串是 ‘log_20191022.zip' 这个形式,想要获取日期,有两种方法, 一种方法是使用能够 下划线作为分隔符获取结果的第一个元素,然后再使用 点 '.'作为分隔符再划分一遍。 另一种方法就是直接使用 re.split() 。
因为 字符串的 split() 函数不能接受两个分隔符作为参数。 re.split() 的使用方法如下: 以竖杠 | 作为分割分开两个分隔符,如果有多个分隔符,则可以使用多个 | ,在上述例子中,因为点 . 是在正则里有特殊的匹配含义,所以需要使用 \ 反斜杠对其进行转义。
字符串方法str.split()帮助:
>>> help(str.split) Help on method_descriptor: split(self, /, sep=None, maxsplit=-1) Return a list of the words in the string, using sep as the delimiter string. sep The delimiter according which to split the string. None (the default value) means split according to any whitespace, and discard empty strings from the result. maxsplit Maximum number of splits to do. -1 (the default value) means no limit. >>>
用法: string.split( sep = None, maxsplit = -1)
string 要操作字符串
sep 分隔符,默认值为whitespace空白符
maxsplit 最大分割次数,默认值为-1,表示无限制
如果同时有多个分隔符怎么分割呢?
可以用循环多次分割来实现,例如:
>>> s = '6[5,12]3[2,6]1;35]67[8;9;11]12' >>> for j in '[],;': t=[i.split(j) for i in t] t=[i for j in t for i in j] >>> t ['6', '5', '12', '3', '2', '6', '1', '35', '67', '8', '9', '11', '12'] >>>
懂正则表达式的可以一步到位:
>>> import re >>> s = '6[5,12]3[2,6]1;35]67[8;9;11]12' >>> re.split('\[|\]|,|;',s) ['6', '5', '12', '3', '2', '6', '1', '35', '67', '8', '9', '11', '12']