Articles of marcos de datos de

Nombre de la columna, que contiene el valor máximo.

Tengo un dataframe que se parece a: Alice Eleonora Mike Helen 2 7 8 6 11 5 9 4 6 15 12 3 5 3 7 8 No quiero crear la nueva columna que contiene para cada fila el nombre de la columna con el valor máximo para la fila dada Alice Eleonora Mike Helen […]

Los métodos Pandas DataFrame combine_first y update tienen un comportamiento extraño

Me estoy combine_first con un problema extraño (¿o fue pensado?) Donde combine_first o update están causando que los valores almacenados como bool se actualicen en float64 s si el argumento proporcionado no proporciona las columnas booleanas. Ejemplo de flujo de trabajo en ipython: In [144]: test = pd.DataFrame([[1,2,False,True],[4,5,True,False]], columns=[‘a’,’b’,’isBool’, ‘isBool2’]) In [145]: test Out[145]: ab […]

serializar pandas (python) dataframe a formato binario

Esta publicación incluye mi pregunta, pero en realidad trata sobre otra pregunta: la serialización de Pandas DataFrame. ¿Existe una rutina de serialización como numpy.savez para los marcos de datos de pandas? Veo que puedo usar hdf5 pero esperaba evitarlo, ya que hdf5 es una instalación adicional y no he podido hacer que h5py esté funcionando […]

Crea dos columnas agregadas por grupo por pandas

Soy nuevo en DataFrames y quiero agrupar varias columnas y luego sumr y mantener un recuento en la última columna. p.ej s = pd.DataFrame(np.matrix([[1, 2,3,4], [3, 4,7,6],[3,4,5,6],[1,2,3,7]]), columns=[‘a’, ‘b’, ‘c’, ‘d’]) abcd 0 1 2 3 4 1 3 4 7 6 2 3 4 5 6 3 1 2 3 7 Quiero agrupar en […]

¿Cómo puedo filtrar un dataframe de pandas según los recuentos de valores?

Estoy trabajando en Python con un DataFrame de pandas de videojuegos, cada uno con un género. Estoy tratando de eliminar cualquier videojuego con un género que aparezca menos de un número de veces en el DataFrame, pero no tengo ni idea de cómo hacerlo. Encontré una pregunta de StackOverflow que parece estar relacionada, pero no […]

En pandas / python, matriz de lectura almacenada como cadena

Tengo un dataframe de pandas donde una de las columnas tiene una matriz de cadenas como cada elemento. Así que algo como esto. col1 col2 0 120 [‘abc’, ‘def’] 1 130 [‘ghi’, ‘klm’] Ahora cuando guardo esto en csv usando to_csv parece estar bien. Cuando lo leo de nuevo usando from_csv parece que lo leo. […]

Cambiar un valor de columna de DataFrame de pandas basado en otro valor de columna

Tengo un dataframe con dos columnas, cada una de las cuales representa un organismo. Se llaman ORG1 y ORG2 Quiero mover los valores de ORG2 a ORG1 para el valor de índice correspondiente. Entonces, si ORG1 es ‘A’ y ORG2 es ‘B’ quiero que ORG1 tome el valor ‘B’ de ORG2. Ya empecé a trabajar […]

¿Es posible anexar Series a las filas de DataFrame sin hacer una lista primero?

Tengo algunos datos que bash organizar en un DataFrame en Pandas . Estaba tratando de hacer de cada fila una Series y DataFrame al DataFrame . Encontré una forma de hacerlo agregando la Series a una list vacía y luego convirtiendo la list de la Series en un DataFrame por ejemplo, DF = DataFrame([series1,series2],columns=series1.index) Esta […]

Pandas DataFrame Agregar columna al índice sin restablecer

¿Cómo agrego ‘d’ al índice de abajo sin tener que restablecerlo primero? from pandas import DataFrame df = DataFrame( {‘a’: range(6), ‘b’: range(6), ‘c’: range(6)} ) df.set_index([‘a’,’b’], inplace=True) df[‘d’] = range(6) # how do I set index to ‘abd’ without having to reset it first? df.reset_index([‘a’,’b’,’d’], inplace=True) df.set_index([‘a’,’b’,’d’], inplace=True) df

¿Cómo puedo convertir un Pandas DataFrame en una lista?

Tengo un dataframe de Python con varias columnas. 2u 2s 4r 4n 4m 7h 7v 0 1 1 0 0 0 1 0 1 0 1 0 0 1 1 0 0 1 0 1 0 1 0 0 0 1 1 0 1 0 1 0 0 1 0 0 1 1 0 0 […]