Articles of marcos de datos de

serializar pandas (python) dataframe a formato binario

Esta publicación incluye mi pregunta, pero en realidad trata sobre otra pregunta: la serialización de Pandas DataFrame. ¿Existe una rutina de serialización como numpy.savez para los marcos de datos de pandas? Veo que puedo usar hdf5 pero esperaba evitarlo, ya que hdf5 es una instalación adicional y no he podido hacer que h5py esté funcionando […]

Crea dos columnas agregadas por grupo por pandas

Soy nuevo en DataFrames y quiero agrupar varias columnas y luego sumr y mantener un recuento en la última columna. p.ej s = pd.DataFrame(np.matrix([[1, 2,3,4], [3, 4,7,6],[3,4,5,6],[1,2,3,7]]), columns=[‘a’, ‘b’, ‘c’, ‘d’]) abcd 0 1 2 3 4 1 3 4 7 6 2 3 4 5 6 3 1 2 3 7 Quiero agrupar en […]

¿Cómo puedo filtrar un dataframe de pandas según los recuentos de valores?

Estoy trabajando en Python con un DataFrame de pandas de videojuegos, cada uno con un género. Estoy tratando de eliminar cualquier videojuego con un género que aparezca menos de un número de veces en el DataFrame, pero no tengo ni idea de cómo hacerlo. Encontré una pregunta de StackOverflow que parece estar relacionada, pero no […]

En pandas / python, matriz de lectura almacenada como cadena

Tengo un dataframe de pandas donde una de las columnas tiene una matriz de cadenas como cada elemento. Así que algo como esto. col1 col2 0 120 [‘abc’, ‘def’] 1 130 [‘ghi’, ‘klm’] Ahora cuando guardo esto en csv usando to_csv parece estar bien. Cuando lo leo de nuevo usando from_csv parece que lo leo. […]

Cambiar un valor de columna de DataFrame de pandas basado en otro valor de columna

Tengo un dataframe con dos columnas, cada una de las cuales representa un organismo. Se llaman ORG1 y ORG2 Quiero mover los valores de ORG2 a ORG1 para el valor de índice correspondiente. Entonces, si ORG1 es ‘A’ y ORG2 es ‘B’ quiero que ORG1 tome el valor ‘B’ de ORG2. Ya empecé a trabajar […]

¿Es posible anexar Series a las filas de DataFrame sin hacer una lista primero?

Tengo algunos datos que bash organizar en un DataFrame en Pandas . Estaba tratando de hacer de cada fila una Series y DataFrame al DataFrame . Encontré una forma de hacerlo agregando la Series a una list vacía y luego convirtiendo la list de la Series en un DataFrame por ejemplo, DF = DataFrame([series1,series2],columns=series1.index) Esta […]

Pandas DataFrame Agregar columna al índice sin restablecer

¿Cómo agrego ‘d’ al índice de abajo sin tener que restablecerlo primero? from pandas import DataFrame df = DataFrame( {‘a’: range(6), ‘b’: range(6), ‘c’: range(6)} ) df.set_index([‘a’,’b’], inplace=True) df[‘d’] = range(6) # how do I set index to ‘abd’ without having to reset it first? df.reset_index([‘a’,’b’,’d’], inplace=True) df.set_index([‘a’,’b’,’d’], inplace=True) df

¿Cómo puedo convertir un Pandas DataFrame en una lista?

Tengo un dataframe de Python con varias columnas. 2u 2s 4r 4n 4m 7h 7v 0 1 1 0 0 0 1 0 1 0 1 0 0 1 1 0 0 1 0 1 0 1 0 0 0 1 1 0 1 0 1 0 0 1 0 0 1 1 0 0 […]

Exportar una tabla LaTeX desde pandas DataFrame

¿Existe una manera fácil de exportar un dataframe (o incluso una parte de él) a LaTeX? Busqué en google y solo pude encontrar soluciones usando asciitables.

Calcular la diferencia de tiempo entre los índices de Pandas Dataframe

Estoy tratando de agregar una columna de deltaT a un dataframe donde deltaT es la diferencia de tiempo entre las filas sucesivas (como se indica en la serie temporal). time value 2012-03-16 23:50:00 1 2012-03-16 23:56:00 2 2012-03-17 00:08:00 3 2012-03-17 00:10:00 4 2012-03-17 00:12:00 5 2012-03-17 00:20:00 6 2012-03-20 00:43:00 7 El resultado deseado […]