知行编程网知行编程网  2022-11-11 15:30 知行编程网 隐藏边栏  23 
文章评分 0 次,平均分 0.0
导语: 本文主要介绍了关于python如何进行文本切割的相关知识,包括python切割,以及pythonpdf这些编程知识,希望对大家有参考作用。

python如何进行文本切割

python的split() 方法可以实现将一个字符串按照指定的分隔符切分成多个子串,这些子串会被保存到列表中(不包含分隔符),作为方法的返回值反馈回来。该方法的基本语法格式如下:

str.split(sep,maxsplit)

此方法中各部分参数的含义分别是:

str:表示要进行分割的字符串;

sep:用于指定分隔符,可以包含多个字符。该参数默认为None,表示所有空字符,包括空格、换行符“\n”、制表符“\t”等。

maxsplit:一个可选参数,指定拆分的数量。最终列表中的子串数量最多为 maxsplit+1。如果未指定或指定为-1,则表示没有拆分次数限制。

在 split 方法中,如果不指定 sep 参数,也不能指定 maxsplit 参数。

推荐学习《

与使用内置函数(如len)不同,字符串变量所拥有的方法只能以“string.methodname()”的形式调用。不用担心为什么,学习了类和对象之后,自然就明白了。

比如定义一个保存php中文网站URL的字符串,然后使用split()方法根据不同的分隔符进行分隔。执行过程如下:

>>> str = "php中文网 >>> c.biancheng.net"
>>> str
'php中文网 >>> c.biancheng.net'
>>> list1 = str.split() #采用默认分隔符进行分割
>>> list1
['php中文网', '>>>', 'c.biancheng.net']
>>> list2 = str.split('>>>') #采用多个字符进行分割
>>> list2
['php中文网 ', ' c.biancheng.net']
>>> list3 = str.split('.') #采用 . 号进行分割
>>> list3
['php中文网 >>> c', 'biancheng', 'net']
>>> list4 = str.split(' ',4) #采用空格进行分割,并规定最多只能分割成 4 个子串
>>> list4
['php中文网', '>>>', 'c.biancheng.net']
>>> list5 = str.split('>') #采用 > 字符进行分割
>>> list5
['php中文网 ', '', '', ' c.biancheng.net']
>>>

需要注意的是,不指定sep参数时,split()方法默认使用空字符进行拆分,但是当字符串中有连续的空格或其他空字符时,会被视为分隔符进行拆分字符串,例如:

>>> str = "php中文网   >>>   c.biancheng.net"  #包含 3 个连续的空格
>>> list6 = str.split()
>>> list6
['php中文网', '>>>', 'c.biancheng.net']
>>>

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写
扫一扫二维码分享