Articles of pandas

Pandas – escribe filas Multiindex con to_csv

Estoy utilizando to_csv para escribir un DataFrame Multiindex en archivos csv. El archivo csv tiene una columna que contiene los multiindexes en tuplas, como: (‘a’, ‘x’) (‘a’, ‘y’) (‘a’, ‘z’) (‘b’, ‘x’) (‘b’, ‘y’) (‘b’, ‘z’) Sin embargo, quiero poder generar el Multiindex en dos columnas en lugar de una columna de tuplas, como: a, […]

Las pandas clasifican por columnas múltiples

Estoy tratando de clasificar un dataframe de pandas basado en dos columnas. Puedo clasificarlo en base a una columna, pero ¿cómo puedo clasificarlo en base a dos columnas? ‘SaleCount’, luego ‘TotalRevenue’? import pandas as pd df = pd.DataFrame({‘TotalRevenue’:[300,9000,1000,750,500,2000,0,600,50,500], ‘Date’:[‘2016-12-02’ for i in range(10)], ‘SaleCount’:[10,100,30,35,20,100,0,30,2,20], ‘shops’:[‘S3′,’S2′,’S1′,’S5′,’S4′,’S8′,’S6′,’S7′,’S9′,’S10’]}) df[‘Rank’] = df.SaleCount.rank(method=’dense’,ascending = False).astype(int) #df[‘Rank’] = df.TotalRevenue.rank(method=’dense’,ascending = False).astype(int) […]

Convertir el dataframe de PANDAS de mensual a diario

Tengo un dataframe con datos mensuales para 2014 para una serie de 317 tickers de acciones (317 tickers x 12 meses = 3,804 filas en el DF). Me gustaría convertirlo en un dataframe diario (317 tickers x 365 días = 115,705 filas). Por lo tanto, creo que debo boost la muestra o reindexar mientras se […]

buscando un patrón de cadena coincidente desde la columna del dataframe en pandas de Python

tengo un dataframe como el de abajo name genre satya |ACTION|DRAMA|IC| satya |COMEDY|BIOPIC|SOCIAL| abc |CLASSICAL| xyz |ROMANCE|ACTION|DARMA| def |DISCOVERY|SPORT|COMEDY|IC| ghj |IC| Ahora quiero consultar el dataframe para poder obtener las filas 1,5 y 6.i: quiero encontrar | IC | Con solo o con cualquier combinación de otros géneros. Hasta ahora puedo hacer una búsqueda exacta […]

Columna Máx. / Mín. De fecha en Pandas, las columnas incluyen valores nan

Estoy intentando crear una nueva columna en un dataframe de pandas con la fecha máxima (o mínima) de otras dos columnas de fecha. Pero, cuando hay una NAN en cualquiera de esas columnas, la columna min / max completa se convierte en una NAN. ¿Lo que da? Cuando se usan columnas de números, esto funciona […]

dividir una serie de Pandas sin un multiindex

Me gustaría tomar una serie de Pandas con un índice de un solo nivel y dividir ese índice en un dataframe con varias columnas. Por ejemplo, para la entrada: s = pd.Series(range(10,17), index=[‘a’,’a’,’b’,’b’,’c’,’c’,’c’]) s a 10 a 11 b 12 b 13 c 14 c 15 c 16 dtype: int64 Lo que me gustaría como […]

Trazar intervalos de confianza y predicción con entradas repetidas

Tengo una gráfica de correlación para dos variables, la variable predictiva (temperatura) en el eje x, y la variable de respuesta (densidad) en el eje y. Mi mejor ajuste de la línea de regresión de mínimos cuadrados es un polinomio de segundo orden. También me gustaría trazar la confianza y los intervalos de predicción. El […]

Pandas: desastackndo una columna de un DataFrame

Quiero desastackr una columna en mi Pandas DataFrame. El DataFrame está indexado por la ‘Fecha’ y quiero desastackr la columna ‘País’ para que cada país sea su propia columna. El actual pandas DF se ve así: Country Product Flow Unit Quantity Date 2002-01-31 FINLAND KEROSENE TOTEXPSB KBD 3.8129 2002-01-31 TURKEY KEROSENE TOTEXPSB KBD 0.2542 2002-01-31 […]

Las pandas reemplazan a nan con el valor medio para una agrupación dada

Tengo un gran conjunto de datos de la forma: period_id gic_subindustry_id operating_mgn_fym5 operating_mgn_fym4 317 201509 25101010 13.348150 11.745965 682 201509 20101010 10.228725 10.473917 903 201509 20101010 NaN 17.700966 1057 201509 50101010 27.858305 28.378040 1222 201509 25502020 15.598956 11.658813 2195 201508 25502020 27.688324 22.969760 2439 201508 45202020 NaN 27.145216 2946 201508 45102020 17.956425 18.327724 En la […]

Obteniendo la fila con valor máximo en Pandas

Ten una df como esa: Me gustaría tener un dataframe con solo una fila con la fecha máxima en él. ¿Cómo se puede realizar? ¡Gracias!