Articles of marco de datos

crear múltiples columnas de la lista de valores de otra columna

Tengo el dataframe que se parece a: Groupe Id MotherName FatherName Field Advanced 56 Laure James English-107,Economics, Management, History, Philosophy Middle 11 Ann Nicolas Web-development, Java-2 Advanced 6 Helen Franc Literature, English-2 Beginner 43 Laure James Mathematics, History, Philosophy, Literature Middle 14 Naomi Franc Java-2, Management, English-107 Para seguir trabajando con los datos, necesito dividir […]

¿Cómo manejar adecuadamente las comparaciones de fecha y hora en un DataFrame completo con valores NaT?

Me topé con este extraño comportamiento al intentar verificar si un DataFrame tiene valores por encima de cierta fecha, mientras que ese DataFrame también puede contener pd.NaT Las comparaciones de valores se comportan como se espera: import pandas as pd pd.NaT > pd.to_datetime(‘2018-10-15’) # False Las comparaciones con una Series también se comportan como se […]

¿Cómo cambiar el formato de fecha y hora en el dataframe con el uso de pandas?

Soy un aprendiz de pandas. Tengo un dataframe con la columna ‘FECHA’, el formato de fecha y hora de la columna es como ’11 / 1/2017 1:00 ‘. Quiero cambiar el formato de fecha y hora de ’11 / 1/2017 1:00 ‘a’ 1-Dec-17 1:00 ‘, probé el siguiente código: dir_path = os.path.dirname(os.path.realpath(“__file__”)) print(dir_path) def parse_dates(x): […]

Problema de rendimiento al convertir filas con inicio – termina en un dataframe con TimeIndex

Tengo un conjunto de datos grande donde cada línea representa el valor de un determinado tipo (piense en un sensor) para un intervalo de tiempo (entre el inicio y el final). Se parece a esto: start end type value 2015-01-01 2015-01-05 1 3 2015-01-06 2015-01-08 1 2 2015-01-05 2015-01-08 3 3 2015-01-13 2015-01-16 2 1 […]

¿Cómo hacer que el dataframe “(df1 y no df2)” se fusione en pandas?

Tengo 2 marcos de datos pandas df1 y df2 con columnas / claves comunes (x, y). Quiero fusionar el tipo de combinación “(df1 & not df2)” en las teclas (x, y), lo que significa que quiero que mi código devuelva un dataframe que contenga filas con (x, y) solo en df1 y no en df2. […]

Anexando fila a Pandas DataFrame agrega 0 columnas

Estoy creando un Pandas DataFrame para almacenar datos. Desafortunadamente, no puedo saber la cantidad de filas de datos que tendré antes de tiempo. Así que mi enfoque ha sido el siguiente. Primero, declaro un DataFrame vacío. df = DataFrame(columns=[‘col1’, ‘col2’]) Luego, agrego una fila de valores perdidos. df = df.append([None] * 2, ignore_index=True) Finalmente, puedo […]

Pandas reemplazar con valor predeterminado

Tengo un dataframe de pandas que quiero reemplazar una determinada columna de forma condicional. p.ej: col 0 Mr 1 Miss 2 Mr 3 Mrs 4 Col. Quiero mapearlos como {‘Mr’: 0, ‘Mrs’: 1, ‘Miss’: 2} Si hay otros títulos disponibles ahora en el dict, quiero que tengan un valor predeterminado de 3 El ejemplo anterior […]

explotando una columna de dataframe pandas

Tengo un Dataframe de Pandas que se parece a esto: text = [“abcd”, “efgh”, “ijkl”, “mnop”, “qrst”, “uvwx”, “yz”] labels = [“label_1, label_2”, “label_1, label_3, label_2”, “label_2, label_4”, “label_1, label_2, label_5”, “label_2, label_3”, “label_3, label_5, label_1, label_2”, “label_1, label_3”] df = pd.DataFrame(dict(text=text, labels=labels)) df text labels 0 abcd label_1, label_2 1 efgh label_1, label_3, label_2 […]

Pandas rolling window & datetime indexes: ¿Qué significa `offset`?

La función de ventana móvil pandas.DataFrame.rolling de pandas 0.22 toma un argumento de window que se describe a continuación: ventana : int, o offset Tamaño de la ventana móvil. Este es el número de observaciones utilizadas para calcular la estadística. Cada ventana tendrá un tamaño fijo. Si es un desplazamiento, este será el período de […]

Combine dos marcos de datos de pandas de Python de diferente longitud pero mantenga todas las filas en el dataframe de salida

Tengo el siguiente problema: tengo dos marcos de datos de pandas de diferente longitud que contienen algunas filas y columnas que tienen valores comunes y algunos que son diferentes, como este: df1: df2: Column1 Column2 Column3 ColumnA ColumnB ColumnC 0 axx 0 cyy 1 cxx 1 ezz 2 exx 2 ass 3 dxx 3 dff […]