Articles of marco de datos

Combine dos marcos de datos de pandas de Python de diferente longitud pero mantenga todas las filas en el dataframe de salida

Tengo el siguiente problema: tengo dos marcos de datos de pandas de diferente longitud que contienen algunas filas y columnas que tienen valores comunes y algunos que son diferentes, como este: df1: df2: Column1 Column2 Column3 ColumnA ColumnB ColumnC 0 axx 0 cyy 1 cxx 1 ezz 2 exx 2 ass 3 dxx 3 dff […]

Ordenar pandas dataframe tanto en los valores de una columna y el índice?

¿Es posible ordenar el dataframe de pandas por valores de una columna, pero también por índice? Si ordena un dataframe de pandas por valores de una columna, puede obtener el dataframe resultante ordenado por la columna, pero desafortunadamente, ve el orden del índice de su dataframe desordenado dentro del mismo valor de una columna ordenada. […]

¿Cuál es el significado del atributo “eje” en un DataFrame de Pandas?

Tomando el siguiente ejemplo: >>> df1 = pd.DataFrame({“x”:[1, 2, 3, 4, 5], “y”:[3, 4, 5, 6, 7]}, index=[‘a’, ‘b’, ‘c’, ‘d’, ‘e’]) >>> df2 = pd.DataFrame({“y”:[1, 3, 5, 7, 9], “z”:[9, 8, 7, 6, 5]}, index=[‘b’, ‘c’, ‘d’, ‘e’, ‘f’]) >>> pd.concat([df1, df2], join=’inner’) La salida es: y a 3 b 4 c 5 d […]

la unión / fusión interna en el dataframe de pandas da más filas que el dataframe izquierdo

Aquí es cómo se ven las columnas de marcos de datos. df1 = ‘número de dispositivo’, ‘fecha’, …. <> 3500 registros df2 = ‘número de dispositivo’, ‘fecha’, …. <> 14,000 registros En cada dataframe, ni el ‘número de dispositivo’ ni la ‘fecha’ son únicos. Sin embargo, su combinación es única para identificar una fila. Estoy […]

Reemplace los valores de columna usando un diccionario

Tengo este dataframe donde se espera que el género sea masculino o femenino. from io import StringIO import pandas as pd audit_trail = StringIO(”’ course_id AcademicYear_to months TotalFee Gender 260 2017 24 100 male 260 2018 12 140 male 274 2016 36 300 mail 274 2017 24 340 female 274 2018 12 200 animal 285 […]

pasar pandas dataframe a un subproceso python. Se abre como un argumento

Estoy intentando llamar a un script de python desde un script maestro. Necesito que el dataframe se genere solo uno desde el script maestro y luego se pase al script de subproceso como un argumento para usar dentro del subproceso. A continuación se muestra mi bash de escribir el script maestro de python requerido. from […]

Insertar fila en el dataframe de Python Pandas

(Soy nuevo en Python, perdón por los errores que cometí, espero que puedas entenderme) He buscado un método para insertar una fila en un Data Frame de Pandas en Python, y he encontrado esto: agregar una fila en un pandas.DataFrame He utilizado el código proporcionado en la respuesta aceptada de ese tema por fred, pero […]

seleccione varias columnas en el dataframe de pandas con el índice de columna como número secuencial

Estoy tratando de extraer las columnas 7 a 14 en un dataframe. sin embargo df[0:3] solo da las filas 1 a 3. ¿Alguien sabe qué debo hacer si quiero averiguar las columnas? Sé cómo hacerlo con nombres de columna como df[‘a’] pero como los nombres son demasiados, solo quiero escribir algo como df[,7:14] en R. […]

¿Cómo fusionar / combinar columnas en pandas?

Tengo un dataframe (ejemplo) con 4 columnas: data = {‘A’: [‘a’, ‘b’, ‘c’, ‘d’, ‘e’, ‘f’], ‘B’: [42, 52, np.nan, np.nan, np.nan, np.nan], ‘C’: [np.nan, np.nan, 31, 2, np.nan, np.nan], ‘D’: [np.nan, np.nan, np.nan, np.nan, 62, 70]} df = pd.DataFrame(data, columns = [‘A’, ‘B’, ‘C’, ‘D’]) ABCD 0 a 42.0 NaN NaN 1 b 52.0 […]

Clasificación por valor absoluto sin cambiar los datos.

Estoy buscando una forma sencilla de ordenar un dataframe de pandas por el valor absoluto de una columna en particular, pero sin cambiar realmente los valores dentro del dataframe. Algo similar a sorted(df, key=abs) . Así que si tuviera un dataframe como: ab 0 1 -3 1 2 5 2 3 -1 3 4 2 […]