Articles of dataframe de los

cambie pandas 0.13.0 “imprimir dataframe” para imprimir dataframe como en versiones anteriores

En la nueva versión 0.13.0 de pandas, un df de dataframe se imprime en una larga lista de números usando df o print df En lugar de una vista general, como antes, que ahora solo es posible usando df.info() ¿Es posible cambiar el comando predeterminado ‘df’ o ‘print df’ para mostrar: In [12]: df.info() DatetimeIndex: […]

¿Cómo verificar si el contenido de la Columna A está contenido en la Columna B usando Python DataFrame?

Tengo dos columnas en un dataframe de pandas: authors y name . Quiero crear una tercera columna: el valor de una celda es True si el name la fila correspondiente está contenido en los authors la fila correspondiente, y False caso contrario. Así que el resultado se verá como la imagen de abajo. He intentado […]

Python: Intentando aplicar en forma cruzada dos marcos de datos

Estoy tratando de obtener un dataframe que tenga todas las combinaciones de dos columnas individuales en dos marcos de datos diferentes. Mis marcos de datos se ven así: >>>first_df >>>second_df id test id text 0 1 abc 0 11 uvw 1 2 def 1 22 xyz 2 3 ghi A partir de esto, pude obtener […]

Establecer el orden de las columnas indexadas en múltiples en el dataframe de pandas

¿Hay una manera de reordenar niveles específicos dentro del índice de columnas en un dataframe de Pandas según mis preferencias personales (por ejemplo, por una lista ordenada)? In [130]: frame = pd.DataFrame({ …: (‘TWO’,’thing1′):[1,2,3,4], …: (‘TWO’,’thing4′):[1,2,3,4], …: (‘DARK’,’thing1′):[0.1,0.2,1,2], …: (‘ANTS’,’thing3′):[‘a’,’e’,’i’,’o’], …: (‘ANTS’,’thing1′):[‘a’,’e’,’i’,’o’]}) In [131]: frame Out[131]: ANTS DARK TWO thing1 thing3 thing1 thing1 thing4 0 […]

Transformando una columna en múltiples columnas de acuerdo a sus valores

En Python, me pregunto si hay una manera de transformar un dataframe de una columna a partir de esto: dentro de esto:

Pandas – desastackr valores de columnas en nuevas columnas

Tengo un gran dataframe y estoy almacenando muchos valores redundantes que dificultan el manejo de mis datos. Tengo un dataframe de la forma: import pandas as pd df = pd.DataFrame([[“a”,”g”,”n1″,”y1″], [“a”,”g”,”n2″,”y2″], [“b”,”h”,”n1″,”y3″], [“b”,”h”,”n2″,”y4″]], columns=[“meta1”, “meta2”, “name”, “data”]) >>> df meta1 meta2 name data ag n1 y1 ag n2 y2 bh n1 y3 bh n2 y4 […]

Eliminar filas basadas en lista en pandas

node1 node2 weight date 3 6 1 2002 2 7 1 1998 2 7 1 2002 2 8 1 1999 2 15 1 2002 9 15 1 1998 2 16 1 2003 2 18 1 2001 Quiero eliminar las filas que tienen los valores [3, 7, 18] . Estos valores pueden estar en cualquiera de […]

¿Cómo convertir una columna de cadena a numérica?

Tengo este dataframe pandas de una consulta: | name | event | —————————- | name_1 | event_1 | | name_1 | event_2 | | name_2 | event_1 | Necesito convertir el evento de columna en numérico, o algo así: | name | event_1 | event_2 | ——————————- | name_1 | 1 | 0 | | […]

Dividir la célula en varias filas en el dataframe de pandas

Tengo un dataframe que contiene datos de pedidos, cada pedido tiene varios paquetes almacenados como columnas de cadena separadas por comas [ package y package_code package ] Quiero dividir los datos de los paquetes y crear una fila para cada paquete, incluidos los detalles de su pedido Aquí hay un ejemplo de dataframe de entrada: […]

Cuadro de datos / conjunto de datos / panel multidimensional / nested en Pandas

Me gustaría almacenar algunos datos multidimensionales en un dataframe o panel de pandas, de modo que me gustaría poder devolver, por ejemplo: Todos los tiempos para Runner A, Race A Todos los tiempos (y nombres) para la Carrera A durante un año determinado, digamos 2015 Los datos de ejemplo se verían así, tenga en cuenta […]