Articles of dataframe de los

Restablecer los niveles MultiIndex de una columna

¿Hay una forma más corta de eliminar una columna del nivel MultiIndex (en mi caso, basic_amt ), excepto la transposición dos veces? In [704]: test Out[704]: basic_amt Faculty NSW QLD VIC All All 1 1 2 4 Full Time 0 1 0 1 Part Time 1 0 2 3 In [705]: test.reset_index(level=0, drop=True) Out[705]: basic_amt […]

pandas fusiona el dataframe con NaN (o “desconocido”) para los valores faltantes

Tengo 2 marcos de datos, uno de los cuales tiene información complementaria para algunas (pero no todas) de las filas en el otro. names = df({‘names’:[‘bob’,’frank’,’james’,’tim’,’ricardo’,’mike’,’mark’,’joan’,’joe’], ‘position’:[‘dev’,’dev’,’dev’,’sys’,’sys’,’sys’,’sup’,’sup’,’sup’]}) info = df({‘names’:[‘joe’,’mark’,’tim’,’frank’], ‘classification’:[‘thief’,’thief’,’good’,’thief’]}) Me gustaría tomar la columna de clasificación del marco de info información anterior y agregarla al dataframe de names anterior. Sin embargo, cuando lo […]

python: elimina todas las filas en el dataframe de pandas que contienen una cadena

Tengo un dataframe de pandas llamado datos y quiero eliminar todas las filas que contengan una cadena en cualquier columna. Por ejemplo, a continuación vemos que la columna ‘gdp’ tiene una cadena en el índice 3 y ‘cap’ en el índice 1. data = y gdp cap 0 1 2 5 1 2 3 ab […]

Cómo agregar números incrementales a una nueva columna usando pandas

Tengo este dataframe simplificado: ID Fruit F1 Apple F2 Orange F3 Banana Quiero agregar al comienzo del dataframe una nueva columna df[‘New_ID’] que tiene el número 880 que se incrementa en uno en cada fila. La salida debe ser simplemente como: New_ID ID Fruit 880 F1 Apple 881 F2 Orange 882 F3 Banana Intenté lo […]

Recuperar DataFrame de todas menos una columna especificada

¿Hay una manera de seleccionar todas las columnas excepto una en un objeto DataFrame de pandas? He visto formas de eliminar una columna, pero no quiero hacer eso.

Pandas comparan la siguiente fila

Tengo un dataframe como este d={} d[‘z’]=[‘Q8′,’Q8′,’Q7′,’Q9′,’Q9’] d[‘t’]=[’10:30′,’10:31′,’10:38′,’10:40′,’10:41′] d[‘qty’]=[20,20,9,12,12] Quiero comparar la primera fila con la segunda fila es la misma cantidad que la siguiente fila Y es t mayor en la siguiente fila Y es el valor z igual que la fila siguiente El valor deseado es qty tz valid 0 20 2015-06-05 10:30:00 […]

¿Hay una manera de copiar solo la estructura (no los datos) de un DataFrame de Pandas?

Recibí un DataFrame de algún lugar y quiero crear otro DataFrame con el mismo número y nombres de columnas y filas (índices). Por ejemplo, supongamos que el dataframe original se creó como import pandas as pd df1 = pd.DataFrame([[11,12],[21,22]], columns=[‘c1′,’c2’], index=[‘i1′,’i2’]) Copié la estructura definiendo explícitamente las columnas y los nombres: df2 = pd.DataFrame(columns=df1.columns, index=df1.index) […]

Dividir un gran dataframe de Pandas con una huella de memoria mínima

Tengo un DataFrame grande, que me gustaría dividir en un conjunto de prueba y un conjunto de trenes para la construcción de modelos. Sin embargo, no quiero duplicar el DataFrame porque estoy alcanzando un límite de memoria. ¿Hay una operación, similar al pop pero para un segmento grande, que elimine simultáneamente una parte del DataFrame […]

Uniendo pandas dataframes por nombre de columna

Tengo dos marcos de datos con los siguientes nombres de columna: frame_1: event_id, date, time, county_ID frame_2: countyid, state Me gustaría obtener un dataframe con las siguientes columnas uniéndome (izquierda) en county_ID = countyid : joined_dataframe event_id, date, time, county, state No puedo averiguar cómo hacerlo si las columnas en las que quiero unirme no […]

Creación eficiente de columnas adicionales en un dataframe de pandas usando .map ()

Estoy analizando un conjunto de datos que tiene una forma similar al siguiente ejemplo. Tengo dos tipos diferentes de datos (datos abc y datos xyz ): abc1 abc2 abc3 xyz1 xyz2 xyz3 0 1 2 2 2 1 2 1 2 1 1 2 1 1 2 2 2 1 2 2 2 3 1 […]