阅读量:0
先创建一个列表,由两段字符串组成:
df = ['第一段话,就到此为止。','第二段话,下次再说?或者下下次。']
1.拆分后的句子,每个句子单独为一行
df1 = [] # 创建一个空列表放拆分后的数据 for i in range(len(df)): #遍历df的每一串字符串 d = df[i] # 需要拆分的字符串赋值给d dd = re.split(r'[,?。]',df) # 设置,?。都为分割标记点,此处可以任意添加减少需要的字符在[]中 df1 = df1 + dd #每一个拆分后的句子添加回去 print('拆分的结果:', df1)
2.仅拆分句子,不改变数据行数
df2 = [] # 创建一个空列表放拆分后的数据 for i in range(len(df)): #遍历df的每一串字符串 d = df[i] # 需要拆分的字符串赋值给d dd = re.split(r'[,?。]',df) # 设置,?。都为分割标记点,此处可以任意添加减少需要的字符在[]中 df2.append(dd) # 添加拆分后的句子到df2 print('拆分的结果:', df2)