Combine múltiples valores de columna en una columna en los pandas de Python

Tengo un dataframe de pandas como este:

Column1 Column2 Column3 Column4 Column5 0 a 1 2 3 4 1 a 3 4 5 2 b 6 7 8 3 c 7 7 

Lo que quiero hacer ahora es obtener un nuevo dataframe que contenga la Columna1 y una nueva columnaA. Esta columna A debe contener todos los valores de las columnas 2 – (a) n (donde n es el número de columnas de la Columna2 al final de la fila) de esta manera:

  Column1 ColumnA 0 a 1,2,3,4 1 a 3,4,5 2 b 6,7,8 3 c 7,7 

¿Cómo podría abordar mejor este problema? Cualquier consejo sería útil. ¡Gracias por adelantado!

Puede llamar a apply pass axis=1 para apply filas, luego convierta el dtype en str y join :

 In [153]: df['ColumnA'] = df[df.columns[1:]].apply( lambda x: ','.join(x.dropna().astype(int).astype(str)), axis=1 ) df Out[153]: Column1 Column2 Column3 Column4 Column5 ColumnA 0 a 1 2 3 4 1,2,3,4 1 a 3 4 5 NaN 3,4,5 2 b 6 7 8 NaN 6,7,8 3 c 7 7 NaN NaN 7,7 

Aquí llamo a dropna para deshacerse de la NaN , sin embargo, tenemos que lanzar de nuevo a int para que no terminemos con flotadores como str.

Propongo usar .assign

df2 = df.assign(ColumnA = df.Column2.astype(str) + ', ' + df.Column3.astype(str) + ', ' df.Column4.astype(str) + ', ' df.Column4.astype(str) + ', ' df.Column5.astype(str))

Es simple, tal vez largo pero funcionó para mí.

Si tiene muchas columnas, diga – 1000 columnas en el dataframe y desea combinar algunas columnas en función de particular column name en particular column name por ejemplo – Column2 en cuestión y no arbitrario. de columnas después de esa columna (p. ej., aquí 3 columnas después de 'Column2 incluida la Column2 como se solicitó OP]).

Podemos obtener la posición de la columna usando .get_loc() – como se responde aquí

 source_col_loc = df.columns.get_loc('Column2') # column position starts from 0 df['ColumnA'] = df.iloc[:,source_col_loc+1:source_col_loc+4].apply( lambda x: ",".join(x.astype(str)), axis=1) df Column1 Column2 Column3 Column4 Column5 ColumnA 0 a 1 2 3 4 1,2,3,4 1 a 3 4 5 NaN 3,4,5 2 b 6 7 8 NaN 6,7,8 3 c 7 7 NaN NaN 7,7 

Para eliminar NaN , use .dropna() o .fillna()

¡Espero eso ayude!