Articles of marco de datos de los

¿Cómo reemplazar un rango de valores con NaN en el dataframe de Pandas?

Tengo un enorme dataframe. ¿Cómo debo reemplazar un rango de valores (-200, -100) con NaN?

¿Cómo colocar elementos de NaN en un groupby en un dataframe de pandas?

Supongamos que tengo este dataframe: my_df = pd.DataFrame({‘A’:[np.nan,np.nan,’gate’,’ball’],’B’:[‘car’,np.nan,np.nan,np.nan],’C’:[np.nan,’edge’,np.nan,np.nan],’D’:[‘id1′,’id1′,’id1′,’id2’]}) In [176]: my_df Out[176]: ABCD 0 NaN car NaN id1 1 NaN NaN edge id1 2 gate NaN NaN id1 3 ball NaN NaN id2 Quiero agrupar por columna “D” e ignorar el NaN. Rendimiento esperado : ABC D id1 gate car edge id2 ball NaN NaN […]

Encontrando el promedio de dos filas consecutivas en pandas

Estoy tratando de encontrar el promedio de dos filas consecutivas en cada columna In[207]: df = DataFrame({“A”: [9, 4, 2, 1, 4], “B”: [12, 7, 5, 4,8]}) In[208]: df Out[207]: AB 0 9 12 1 4 7 2 2 5 3 1 4 4 4 8 El resultado debe ser: Out[207]: AB 0 6.5 9.5 […]

Eliminar elementos de la serie Pandas por índice

Tengo una serie de pandas df (fechas = índice): 2015-09-10 58 2015-09-11 40 2015-09-12 33 2015-09-13 42 2015-09-14 22 2015-09-15 88 2015-09-16 99 2015-09-17 124 Me gustaría eliminar las fechas del 2015-09-11 al 2015-09-15, por lo que mi df sería: 2015-09-10 58 2015-09-16 99 2015-09-17 124 He intentado usar df.drop [“2015-09-11”: “2015-09-15”], pero aparece un […]

Compartiendo y transformando en pandas.

Tengo el dataframe a continuación. AB 1 1 4 1 5 1 6 2 8 3 15 4 Me gustaría agrupar y transformar el dataframe a continuación. range(A) sum(B) [0,4) 2 [5,9) 6 [10,14) 0 [15,19) 4 Intenté groupby+Grouper , pero no pude averiguar cómo bin. ¿Puedo preguntar cómo transformar los datos?

Eliminar segunda fila de encabezado en PANDAS

Tengo un dataframe en PANDAS que tiene dos líneas de encabezados. ¿Cómo puedo eliminar la segunda línea? Por ejemplo, tengo lo siguiente: AA BB CC DD ABCD Index 1 1 2 3 4 2 5 6 7 8 3 9 1 2 3 y me gustaría conseguir algo como esto: AA BB CC DD Index […]

¿Cómo intercambiar meses y días en un objeto de fecha y hora?

Tengo una columna en un dataframe de pandas con fechas como: año, día, mes, hora, minuto, segundo 2015-09-03 14:32:00 Me gustaría convertir esto en año, mes, día, hora, minuto, segundo 2015-03-09 14:32:00

El dataframe de Pandas se aplica a la fila anterior para calcular la diferencia

Tengo el siguiente dataframe de pandas que contiene 2 columnas (simplificado). La primera columna contiene los nombres de los jugadores y la segunda columna contiene fechas (objetos de datetime y datetime ): player date A 2010-01-01 A 2010-01-09 A 2010-01-11 A 2010-01-15 B 2010-02-01 B 2010-02-10 B 2010-02-21 B 2010-02-23 Quiero agregar una columna diff […]

Compruebe eficientemente si el valor está presente en cualquiera de los rangos dados

Tengo dos objetos pandas DataFrame: A contiene ‘finish’ columnas ‘start’ y ‘finish’ B tiene la columna ‘date’ El objective es crear de manera eficiente una máscara booleana que indique si la date está en el intervalo [start, finish] La ingenua iteración toma demasiado tiempo, supongo que hay un método para hacerlo más rápido ACTUALIZACIÓN: A […]

Cómo hacer pandas dataframe str.contains búsqueda más rápido

Estoy buscando una subcadena o múltiples subcadenas en el dataframe de 4 millones de filas. df[df.col.str.contains(‘Donald’,case=True,na=False)] o df[df.col.str.contains(‘Donald|Trump|Dump’,case=True,na=False)] El dataframe (df) se ve a continuación (con 4 millones de filas de cadenas) df = pd.DataFrame({‘col’: [“very definition of the American success story, continually setting the standards of excellence in business, real estate and entertainment.”, “The […]