Articles of marco de datos de los

Eliminar filas por múltiples criterios de columna en DataFrame

Tengo un dataframe de pandas en el que bash eliminar filas según un criterio en columnas seleccionadas. Si los valores en estas columnas de selección son cero, las filas deben ser eliminadas. Aquí hay un ejemplo. import pandas as pd t = pd.DataFrame({‘a’:[1,0,0,2],’b’:[1,2,0,0],’c’:[1,2,3,4]}) abc 0 1 1 1 1 0 2 2 2 0 0 […]

Eliminación de palabras clave con pandas

Me gustaría eliminar las palabras clave de una columna de un dataframe. Dentro de la columna hay un texto que necesita ser dividido. Por ejemplo, mi dataframe se ve así: ID Text 1 eat launch with me 2 go outside have fun Quiero aplicar stopword en la text column para que se divida. Intenté esto: […]

Reemplace las filas en un df Pandas con filas de otro df

Tengo 2 Pandas dfs, A y B. Ambos tienen 10 columnas y el índice ‘ID’. Donde las ID de A y B coinciden, quiero reemplazar las filas de B con las filas de A. He intentado usar pd.update, pero aún no tengo éxito. Cualquier ayuda apreciada.

Mapeo de 2 marcos de datos y reemplazo del encabezado de los valores coincidentes en el dataframe de destino

Tengo un dataframe: df1 SAP_Name SAP_Class SAP_Sec Avi 5 C Rison 6 A Slesh 7 B San 8 C Sud 7 B df2: Name_Fi Class Avi 5 Rison 6 Slesh 7 Estoy tratando de hacer coincidir df2 con df1 de tal manera que los valores coincidentes deben tener los encabezados reemplazados igual que df1. SAP_Name […]

Cómo agregar una columna a un DataFrame basado en un mapa de múltiples índices

Tengo un df dataframe de la siguiente manera: # df.head(10) TYPE AB 0 0 5 25 1 1 7 23 2 5 10 43 3 1 5 37 4 2 4 61 5 3 1 17 6 0 8 39 7 2 4 59 8 4 2 6 9 0 3 31 Y tengo un […]

Convertir cada columna agrupada en el objeto DataFrameGroupBy en una lista

Aquí están los datos: df = pd.DataFrame({ ‘date’:[1,1,2,2,2,3,3,3,4,5], ‘request’:[2,2,2,3,3,2,3,3,3,3], ‘users’:[1,3,7,1,7,3,4,9,7,9], ‘count’:[1,1,2,3,1,3,1,2,1,1] }) df count date request users 0 1 1 2 1 1 1 1 2 3 2 2 2 2 7 3 3 2 3 1 4 1 2 3 7 5 3 3 2 3 6 1 3 3 4 7 2 3 […]

¿Cómo puedo tener columnas separadas de un dataframe fuera de la lista de tuplas y una lista?

Tengo las siguientes listas: l1 = [(1,2),(3,4),(5,6)] l2 = [7,8,9] Quiero la salida como df df = c1 c2 c3 0 1 2 7 1 3 4 8 2 5 6 9 Hasta ahora puedo separar solo la tupla como df = pd.DataFrame(l1) eso me da c1 c2 0 1 2 1 3 4 2 […]

pandas read_csv ignoran el separador en la última columna

Tengo un archivo con la siguiente estructura (la primera fila es el encabezado, el nombre del archivo es test.dat ): ID_OBS LAT LON ALT TP TO LT_min LT_max STATIONNAME ALT_NOA_000 82.45 -62.52 210.0 FM 0 0.0 24.0 Alert, Nunavut, Canada ¿Cómo le pido a los pandas que lean el nombre completo de la estación (en […]

Creación de un nuevo nombre de columna basado en una variable de bucle y una cadena adicional

Quiero crear una columna de cambio de porcentaje para cada columna que es un flotante en mi dataframe y la almacené en una nueva columna cada vez con el nombre de la columna inicial y el agregado en “_change” He intentado esto, pero no parece funcionar ninguna idea? for col in df.columns: if df[col].dtypes == […]

Eliminar la mitad de las filas de marcos de datos que cumplen con la condición

Estoy buscando extraer un subconjunto de un dataframe basado en una condición. Digamos df = pd.Dataframe({‘Col1’: [values1], ‘Col2’ = [values2], ‘Col3’ = [values3]}) Me gustaría ordenar por Col2. De las entradas en Col2 que son negativas (si las hay), me gustaría quitar la mitad más grande. Entonces, si valores2 = [-5,10,13, -3, -1, -2], entonces […]