原文参见:pandas中的series.str.split()的一点认识 - 知乎 (zhihu.com) pandas.Series.str.split(pat=None, n=-1, expand=False)的参数如下:
- pat:string 或者正则表达式,若为空,则为连续的空格,包括(换行符、空格、制表符)
- n:默认值为-1,若为None, 0 都会被修改成-1,即能分割多少次就分割多少次,与str.split()的n=-1,re.split()的maxsplit=0一致;
- expand:决定了分割后的结果是分布在多列(返回DataFrame)还是以列表的形式分布在一列中(返回Series)
df = pd.Series(['张三 一班 00001', '李四 二班 00002', '王五 三班 00003'])
# 若expand为True,返回DataFrame,将分列后的结果存储在不同的列中(完成分列动作)
result = df.str.split(pat=None, n=-1, expand=True).rename(columns={0:'姓名', 1:'班级', 2:'学号'})
print(result)