1、split()方法
按分隔符或正则表达式拆分字符串;
split可以将用逗号分隔的字符串分成几段,拆分次数可以指定。
2、使用语法
Series.str.split(pat=None,n=-1,expand=False)
3、参数:
pat : 字符串,默认使用空白分割,根据分列,可以是空格、符号、字符串等
n : 整形,默认为-1,使用所有分割点进行分割。
n参数,指定分隔次数 >>>df[0].str.split('_',n=1) 0[A,1_1] 1[B,2_1] 2[C,3_1] 3[D,4_1] Name:0,dtype:object
expand : 默认为False的布尔值。拆分次数可以指定
若为真实返回数据框(DataFrame)或复杂索引(MultiIndex);假的话,返回序列(Series)或者索引(Index).
4、返回值
expand参数:每个具体值的类型是字符串
5、使用实例
>>>importnumpy,pandas; >>>s=pandas.Series([‘a_b_c‘,‘c_d_e‘,numpy.nan,‘f_g_h‘]) >>>s.str.split(‘‘) 0[a,b,c] 1[c,d,e] 2NaN 3[f,g,h] dtype:object >>>s.str.split(‘‘,-1) 0[a,b,c] 1[c,d,e] 2NaN 3[f,g,h] dtype:object
python中有一系列内置方法可以进行字符串操作,如使用split()方法粉格子风格,也可以作为python中的pandas库,也可以使用内置方法split()方法分割字符串,但split()方法不能分割字符串,需要先用.str将这一列转换为类似字符串的格式,可以使用split()方法。
以上是pandas中使用split()方法分割字符串的详细介绍。需要注意的是,如果直接用某个列和split()进行分类是不可能的,因为series的数据类型没有split(),所以需要先使用。.str将此列转换为类似字符串的格式,即可使用split()哦~更多python学习推荐:python教程。
(推荐操作系统:windows7系统Python 3.9.1,DELL G3电脑。)