Articles of dataframe de los

Añadir una fila con medios de columnas a pandas DataFrame

Tengo un DataFrame de pandas que consiste en algunas lecturas de sensores tomadas a lo largo del tiempo como esto: diode1 diode2 diode3 diode4 Time 0.530 7 0 10 16 1.218 17 7 14 19 1.895 13 8 16 17 2.570 8 2 16 17 3.240 14 8 17 19 3.910 13 6 17 18 […]

¿Cómo ordenar el dataframe por una fila?

Tengo un dataframe: import pandas as pd df = pd.DataFrame(data={‘x’:[7,1,9], ‘y’:[4,5,6],’z’:[1,8,3]}, index=[‘a’, ‘b’, ‘c’]) Muestra: Cómo ordenar este dataframe por fila [‘a’]: después de ordenar el dataframe, podría ser:

Cómo combinar dos marcos de datos según la fecha más cercana

Quiero fusionar dos marcos de datos basados ​​en dos columnas: “Código” y “Fecha”. Es sencillo combinar marcos de datos basados ​​en “Código”, sin embargo, en el caso de “Fecha” se vuelve complicado: no hay una coincidencia exacta entre las fechas en df1 y df2. Por lo tanto, quiero seleccionar las fechas más cercanas. ¿Cómo puedo […]

Leer datos (archivo .dat) con Pandas

¿Cómo leo los siguientes datos (dos columnas) (de un archivo .dat) con Pandas? TIME XGSM 2004 006 01 00 01 37 600 1 2004 006 01 00 02 32 800 5 2004 006 01 00 03 28 000 8 2004 006 01 00 04 23 200 11 2004 006 01 00 05 18 400 17 […]

¿Cómo hacer coincidir varias columnas en el dataframe de pandas para un “intervalo”?

Tengo el siguiente dataframe de pandas: import pandas as pd df = pd.DataFrame(‘filename.csv’) print(df) order start end value 1 1342 1357 category1 1 1459 1489 category7 1 1572 1601 category23 1 1587 1599 category2 1 1591 1639 category1 …. 15 792 813 category13 15 892 913 category5 …. Por lo tanto, hay una columna de […]

¿Cómo encontrar la coincidencia más cercana basada en 2 claves de un dataframe a otro?

Tengo 2 marcos de datos con los que estoy trabajando. Uno tiene un montón de ubicaciones y coordenadas (longitud, latitud). El otro es un conjunto de datos meteorológicos con datos de estaciones meteorológicas de todo el mundo y sus respectivas coordenadas. Estoy tratando de vincular la estación meteorológica más cercana a cada ubicación en mi […]

Pandas: Convierte dataframe a dict de listas

Tengo un dataframe como este: col1, col2 A 0 A 1 B 2 C 3 Me gustaría obtener esto: { A: [0,1], B: [2], C: [3] } Lo intenté: df.set_index(‘col1’)[‘col2′].to_dict() pero eso no es del todo correcto. El primer problema que tengo es que ‘A’ se repite, acabo obteniendo A: 1 solo (0 se sobrescribe). […]

Cómo astackr marcos de datos unos sobre otros en Pandas

Tengo un dataframe con 96 columnas: df.to_csv(‘result.csv’) fuera (excel): Run 1 Run 2 Run 3 Run 4 Run 5 Run 6 Run 7 Run 8 Run 9 Run 10 Run 11 Run 12 Run 13 Run 14 Run 15 Run 16 Run 17 Run 18 Run 19 Run 20 Run 21 Run 22 Run 23 […]

¿Cómo filtrar un dataframe de fechas por un mes / día en particular?

Así que mi código es el siguiente: df[‘Dates’][df[‘Dates’].index.month == 11] Estaba haciendo una prueba para ver si podía filtrar los meses, así que solo muestra las fechas de noviembre, pero esto no funcionó. Me da el siguiente error: AttributeError: el objeto ‘Int64Index’ no tiene atributo ‘mes’. Si lo hago print type(df[‘Dates’][0]) luego obtengo la clase […]

Python – Drop row si dos columnas son NaN

Esta es una extensión de esta pregunta , donde OP quiso saber cómo colocar filas donde los valores en una sola columna son NaN. Me pregunto cómo puedo eliminar filas donde los valores en 2 (o más) columnas son NaN. Usando el dataframe creado por la segunda respuesta: In [1]: df = pd.DataFrame(np.random.randn(10,3)) In [2]: […]