Articles of marco de datos

Problema de rendimiento al convertir filas con inicio – termina en un dataframe con TimeIndex

Tengo un conjunto de datos grande donde cada línea representa el valor de un determinado tipo (piense en un sensor) para un intervalo de tiempo (entre el inicio y el final). Se parece a esto: start end type value 2015-01-01 2015-01-05 1 3 2015-01-06 2015-01-08 1 2 2015-01-05 2015-01-08 3 3 2015-01-13 2015-01-16 2 1 […]

¿Cómo hacer que el dataframe “(df1 y no df2)” se fusione en pandas?

Tengo 2 marcos de datos pandas df1 y df2 con columnas / claves comunes (x, y). Quiero fusionar el tipo de combinación “(df1 & not df2)” en las teclas (x, y), lo que significa que quiero que mi código devuelva un dataframe que contenga filas con (x, y) solo en df1 y no en df2. […]

Anexando fila a Pandas DataFrame agrega 0 columnas

Estoy creando un Pandas DataFrame para almacenar datos. Desafortunadamente, no puedo saber la cantidad de filas de datos que tendré antes de tiempo. Así que mi enfoque ha sido el siguiente. Primero, declaro un DataFrame vacío. df = DataFrame(columns=[‘col1’, ‘col2’]) Luego, agrego una fila de valores perdidos. df = df.append([None] * 2, ignore_index=True) Finalmente, puedo […]

Pandas reemplazar con valor predeterminado

Tengo un dataframe de pandas que quiero reemplazar una determinada columna de forma condicional. p.ej: col 0 Mr 1 Miss 2 Mr 3 Mrs 4 Col. Quiero mapearlos como {‘Mr’: 0, ‘Mrs’: 1, ‘Miss’: 2} Si hay otros títulos disponibles ahora en el dict, quiero que tengan un valor predeterminado de 3 El ejemplo anterior […]

explotando una columna de dataframe pandas

Tengo un Dataframe de Pandas que se parece a esto: text = [“abcd”, “efgh”, “ijkl”, “mnop”, “qrst”, “uvwx”, “yz”] labels = [“label_1, label_2”, “label_1, label_3, label_2”, “label_2, label_4”, “label_1, label_2, label_5”, “label_2, label_3”, “label_3, label_5, label_1, label_2”, “label_1, label_3”] df = pd.DataFrame(dict(text=text, labels=labels)) df text labels 0 abcd label_1, label_2 1 efgh label_1, label_3, label_2 […]

Pandas rolling window & datetime indexes: ¿Qué significa `offset`?

La función de ventana móvil pandas.DataFrame.rolling de pandas 0.22 toma un argumento de window que se describe a continuación: ventana : int, o offset Tamaño de la ventana móvil. Este es el número de observaciones utilizadas para calcular la estadística. Cada ventana tendrá un tamaño fijo. Si es un desplazamiento, este será el período de […]

Combine dos marcos de datos de pandas de Python de diferente longitud pero mantenga todas las filas en el dataframe de salida

Tengo el siguiente problema: tengo dos marcos de datos de pandas de diferente longitud que contienen algunas filas y columnas que tienen valores comunes y algunos que son diferentes, como este: df1: df2: Column1 Column2 Column3 ColumnA ColumnB ColumnC 0 axx 0 cyy 1 cxx 1 ezz 2 exx 2 ass 3 dxx 3 dff […]

Ordenar pandas dataframe tanto en los valores de una columna y el índice?

¿Es posible ordenar el dataframe de pandas por valores de una columna, pero también por índice? Si ordena un dataframe de pandas por valores de una columna, puede obtener el dataframe resultante ordenado por la columna, pero desafortunadamente, ve el orden del índice de su dataframe desordenado dentro del mismo valor de una columna ordenada. […]

¿Cuál es el significado del atributo “eje” en un DataFrame de Pandas?

Tomando el siguiente ejemplo: >>> df1 = pd.DataFrame({“x”:[1, 2, 3, 4, 5], “y”:[3, 4, 5, 6, 7]}, index=[‘a’, ‘b’, ‘c’, ‘d’, ‘e’]) >>> df2 = pd.DataFrame({“y”:[1, 3, 5, 7, 9], “z”:[9, 8, 7, 6, 5]}, index=[‘b’, ‘c’, ‘d’, ‘e’, ‘f’]) >>> pd.concat([df1, df2], join=’inner’) La salida es: y a 3 b 4 c 5 d […]

la unión / fusión interna en el dataframe de pandas da más filas que el dataframe izquierdo

Aquí es cómo se ven las columnas de marcos de datos. df1 = ‘número de dispositivo’, ‘fecha’, …. <> 3500 registros df2 = ‘número de dispositivo’, ‘fecha’, …. <> 14,000 registros En cada dataframe, ni el ‘número de dispositivo’ ni la ‘fecha’ son únicos. Sin embargo, su combinación es única para identificar una fila. Estoy […]