Articles of pandas de

Agrupación de pandas: valores como porcentaje de totales agrupados que no funcionan

Utilizando un dataframe y pandas, estoy tratando de averiguar qué es cada valor como un porcentaje del total general para la categoría “agrupar por” Por lo tanto, utilizando la base de datos de consejos, quiero ver, para cada sexo / fumador, cuál es la proporción de la factura total para mujeres fumadoras / todas mujeres […]

Combinar la primera fila con los encabezados de columna en un dataframe

Estoy tratando de limpiar un archivo de Excel para una investigación más a fondo. Problema que tengo, quiero unir la primera y la segunda fila. El código que tengo ahora: xl = pd.ExcelFile(“nanonose.xls”) df = xl.parse(“Sheet1”) df = df.drop(‘Unnamed: 2’, axis=1) ## Tried this line but no luck ##print(df.head().combine_first(df.iloc[[0]])) La salida de esto es: Nanonose […]

pandas: filtrado iterativo de las filas de un DataFrame

Supongamos que tengo un DataFrame como tal, df = pd.DataFrame([[‘x’, 1, 2], [‘x’, 1, 3], [‘y’, 2, 2]], columns=[‘a’, ‘b’, ‘c’]) Para seleccionar todas las filas donde c == 2 y a == ‘x’ , podría hacer algo como: df[(df[‘a’] == ‘x’) & (df[‘c’] == 2)] O podría refinar iterativamente haciendo variables temporales, df1 = […]

¿Cómo insertar n DataFrame en otra fila nth en Pandas?

Por ejemplo, tengo un DataFrame A como sigue A 0 1 2 Ahora quiero insertar cada 2 filas en DataFrame B en A cada 1 fila y B es como sigue B 3 3 4 4 5 5 finalmente quiero A 0 3 3 1 4 4 2 5 5 ¿Cómo puedo conseguir esto?

Encuentra todos los grupos que coincidan en una lista de listas con pandas.

Me gustaría encontrar todos los casos para todos los identificadores en un DataFrame de Pandas. ¿Cuál sería una solución eficiente? Tengo alrededor de 10k de registros y se procesa en el lado del servidor. ¿Sería una buena idea crear un nuevo DataFrame, o hay una estructura de datos más eficiente que pueda usar? Un caso […]

Cálculo del crecimiento interanual por grupos en Pandas.

Tengo el siguiente dataframe : In [1]: df Out[1]: ID Month Transaction_Amount 1 2013/01 10 1 2013/02 20 1 2013/03 10 1 2013/04 20 1 2013/05 10 1 2013/06 20 1 2013/07 10 1 2013/08 20 1 2013/09 10 1 2013/10 20 1 2013/11 10 1 2013/12 20 1 2014/01 15 1 2014/02 25 1 […]

Consulta de pandas con una columna que consta de entradas de matriz.

ykp.data Out[182]: state action reward 0 [41] 5 59 1 [5] 52 48 2 [46] 35 59 3 [42] 16 12 4 [43] 37 48 5 [36] 5 59 6 [49] 52 48 7 [39] 11 23 Me gustaría encontrar la fila que coincide con [42] en la entrada del estado, así que corrí ykp.data.query(‘state […]

Intersección de intervalos en pandas

Actualización 5: Esta característica se ha lanzado como parte de pandas 20.1 (en mi cumpleaños:]) Actualización 4: PR se ha fusionado! Actualización 3: El PR se ha mudado aquí Actualización 2: Parece que esta pregunta puede haber contribuido a reabrir el PR para IntervalIndex en pandas . Actualizar: Ya no tengo este problema, ya que […]

¿Cómo puedo verificar el tipo de contenido de una columna en los pandas python?

Esta pregunta está relacionada con la forma de verificar el tipo de columna de los pandas python . Se crea un dataframe de pandas vacío. A continuación, se llena de datos. ¿Cómo puedo verificar si alguna de sus columnas contiene tipos complex ? index = [np.array([‘foo’, ‘qux’])] columns = [“A”, “B”] df = pd.DataFrame(index=index, columns=columns) […]

Convierta la cadena de fecha y hora en nuevas columnas de Día, Mes, Año en el dataframe de pandas

Soy nuevo en Python y tengo una pregunta bastante simple (¡con suerte sencilla!). Digamos que tengo un dataframe con 3 columnas: tiempo (que está en el formato AAAA-MM-DDTHH: MM: SSZ), dispositivo_id y lluvia pero necesito la primera columna, “tiempo”, para que se convierta en tres columnas de ” día “,” mes “y” año “con valores […]