Articles of marco de datos

¿Cómo cambiar el formato de fecha y hora en el dataframe con el uso de pandas?

Soy un aprendiz de pandas. Tengo un dataframe con la columna ‘FECHA’, el formato de fecha y hora de la columna es como ’11 / 1/2017 1:00 ‘. Quiero cambiar el formato de fecha y hora de ’11 / 1/2017 1:00 ‘a’ 1-Dec-17 1:00 ‘, probé el siguiente código: dir_path = os.path.dirname(os.path.realpath(“__file__”)) print(dir_path) def parse_dates(x): […]

Problema de rendimiento al convertir filas con inicio – termina en un dataframe con TimeIndex

Tengo un conjunto de datos grande donde cada línea representa el valor de un determinado tipo (piense en un sensor) para un intervalo de tiempo (entre el inicio y el final). Se parece a esto: start end type value 2015-01-01 2015-01-05 1 3 2015-01-06 2015-01-08 1 2 2015-01-05 2015-01-08 3 3 2015-01-13 2015-01-16 2 1 […]

¿Cómo hacer que el dataframe “(df1 y no df2)” se fusione en pandas?

Tengo 2 marcos de datos pandas df1 y df2 con columnas / claves comunes (x, y). Quiero fusionar el tipo de combinación “(df1 & not df2)” en las teclas (x, y), lo que significa que quiero que mi código devuelva un dataframe que contenga filas con (x, y) solo en df1 y no en df2. […]

Anexando fila a Pandas DataFrame agrega 0 columnas

Estoy creando un Pandas DataFrame para almacenar datos. Desafortunadamente, no puedo saber la cantidad de filas de datos que tendré antes de tiempo. Así que mi enfoque ha sido el siguiente. Primero, declaro un DataFrame vacío. df = DataFrame(columns=[‘col1’, ‘col2’]) Luego, agrego una fila de valores perdidos. df = df.append([None] * 2, ignore_index=True) Finalmente, puedo […]

Pandas reemplazar con valor predeterminado

Tengo un dataframe de pandas que quiero reemplazar una determinada columna de forma condicional. p.ej: col 0 Mr 1 Miss 2 Mr 3 Mrs 4 Col. Quiero mapearlos como {‘Mr’: 0, ‘Mrs’: 1, ‘Miss’: 2} Si hay otros títulos disponibles ahora en el dict, quiero que tengan un valor predeterminado de 3 El ejemplo anterior […]

explotando una columna de dataframe pandas

Tengo un Dataframe de Pandas que se parece a esto: text = [“abcd”, “efgh”, “ijkl”, “mnop”, “qrst”, “uvwx”, “yz”] labels = [“label_1, label_2”, “label_1, label_3, label_2”, “label_2, label_4”, “label_1, label_2, label_5”, “label_2, label_3”, “label_3, label_5, label_1, label_2”, “label_1, label_3”] df = pd.DataFrame(dict(text=text, labels=labels)) df text labels 0 abcd label_1, label_2 1 efgh label_1, label_3, label_2 […]

Pandas rolling window & datetime indexes: ¿Qué significa `offset`?

La función de ventana móvil pandas.DataFrame.rolling de pandas 0.22 toma un argumento de window que se describe a continuación: ventana : int, o offset Tamaño de la ventana móvil. Este es el número de observaciones utilizadas para calcular la estadística. Cada ventana tendrá un tamaño fijo. Si es un desplazamiento, este será el período de […]

Combine dos marcos de datos de pandas de Python de diferente longitud pero mantenga todas las filas en el dataframe de salida

Tengo el siguiente problema: tengo dos marcos de datos de pandas de diferente longitud que contienen algunas filas y columnas que tienen valores comunes y algunos que son diferentes, como este: df1: df2: Column1 Column2 Column3 ColumnA ColumnB ColumnC 0 axx 0 cyy 1 cxx 1 ezz 2 exx 2 ass 3 dxx 3 dff […]

Ordenar pandas dataframe tanto en los valores de una columna y el índice?

¿Es posible ordenar el dataframe de pandas por valores de una columna, pero también por índice? Si ordena un dataframe de pandas por valores de una columna, puede obtener el dataframe resultante ordenado por la columna, pero desafortunadamente, ve el orden del índice de su dataframe desordenado dentro del mismo valor de una columna ordenada. […]

¿Cuál es el significado del atributo “eje” en un DataFrame de Pandas?

Tomando el siguiente ejemplo: >>> df1 = pd.DataFrame({“x”:[1, 2, 3, 4, 5], “y”:[3, 4, 5, 6, 7]}, index=[‘a’, ‘b’, ‘c’, ‘d’, ‘e’]) >>> df2 = pd.DataFrame({“y”:[1, 3, 5, 7, 9], “z”:[9, 8, 7, 6, 5]}, index=[‘b’, ‘c’, ‘d’, ‘e’, ‘f’]) >>> pd.concat([df1, df2], join=’inner’) La salida es: y a 3 b 4 c 5 d […]