Pandas dividen la columna de listas en múltiples columnas

Tengo un dataFrame de pandas con una columna que se parece a la siguiente:

` In [207]:df2.teams Out[207]: 0 [SF, NYG] 1 [SF, NYG] 2 [SF, NYG] 3 [SF, NYG] 4 [SF, NYG] 5 [SF, NYG] 6 [SF, NYG] 7 [SF, NYG] ` 

Necesito dividir esta columna de listas en 2 columnas llamadas team1 y team2 usando pandas

Puede usar el constructor DataFrame con lists creadas al convertir a numpy array por values con tolist :

 import pandas as pd d1 = {'teams': [['SF', 'NYG'],['SF', 'NYG'],['SF', 'NYG'], ['SF', 'NYG'],['SF', 'NYG'],['SF', 'NYG'],['SF', 'NYG']]} df2 = pd.DataFrame(d1) print (df2) teams 0 [SF, NYG] 1 [SF, NYG] 2 [SF, NYG] 3 [SF, NYG] 4 [SF, NYG] 5 [SF, NYG] 6 [SF, NYG] 

 df2[['team1','team2']] = pd.DataFrame(df2.teams.values.tolist(), index= df2.index) print (df2) teams team1 team2 0 [SF, NYG] SF NYG 1 [SF, NYG] SF NYG 2 [SF, NYG] SF NYG 3 [SF, NYG] SF NYG 4 [SF, NYG] SF NYG 5 [SF, NYG] SF NYG 6 [SF, NYG] SF NYG 

Y para el nuevo DataFrame :

 df3 = pd.DataFrame(df2['teams'].values.tolist(), columns=['team1','team2']) print (df3) team1 team2 0 SF NYG 1 SF NYG 2 SF NYG 3 SF NYG 4 SF NYG 5 SF NYG 6 SF NYG 

La solución con apply(pd.Series) es muy lenta:

 #7k rows df2 = pd.concat([df2]*1000).reset_index(drop=True) In [89]: %timeit df2['teams'].apply(pd.Series) 1 loop, best of 3: 1.15 s per loop In [90]: %timeit pd.DataFrame(df2['teams'].values.tolist(), columns=['team1','team2']) 1000 loops, best of 3: 820 µs per loop 

Solución mucho más simple:

 pd.DataFrame(df2.teams.tolist(), columns=['team1', 'team2']) 

Rendimientos,

  team1 team2 ------------- 0 SF NYG 1 SF NYG 2 SF NYG 3 SF NYG 4 SF NYG 5 SF NYG 6 SF NYG 7 SF NYG 

Si quisiera dividir una columna de cadenas delimitadas en lugar de listas, podría hacer lo mismo:

 pd.DataFrame(df.teams.str.split('', expand=True).values, columns=['team1', 'team2']) 

Parece que hay una forma sintácticamente más simple, y por lo tanto más fácil de recordar, en oposición a las soluciones propuestas. Supongo que la columna se llama “meta” en un df de dataframe:

 df2 = pd.DataFrame(df['meta'].str.split().values.tolist())