Articles of multi index

¿Cómo puedo agregar un nivel a un MultiIndex?

index = [np.array([‘foo’, ‘foo’, ‘qux’]), np.array([‘a’, ‘b’, ‘a’])] data = np.random.randn(3, 2) columns = [“X”, “Y”] df = pd.DataFrame(data, index=index, columns=columns) df.index.names = [“Level0”, “Level1”] print df XY Level0 Level1 foo a 0.418549 0.252685 b -1.307099 0.202833 qux a 0.046095 -0.968976 Nuevo nivel Quiero tomar el índice de df y crear un nuevo índice múltiple […]

pandas multi index clasificar campos específicos

Obtuve un índice múltiple en pandas ejecutando series.describe () para un dataframe agrupado. ¿Cómo puedo ordenar estas series por modelName.mean y solo mantener campos específicos? Esta summary.sortlevel(1)[‘kappa’] los ordena pero retiene todos los otros campos como contar. ¿Cómo puedo solo mantener la mean y la std ? editar Esta es una representación textual de la […]

¿Cómo actualizar el valor en las primeras N filas por grupo en un dataframe de múltiples índices de Pandas?

Estoy intentando actualizar las primeras N filas en un dataframe de múltiples índices, pero estaba teniendo algunos problemas para encontrar una solución, así que pensé en crear una publicación para ella. El código de ejemplo es el siguiente: # Imports import numpy as np import pandas as pd # Set Up Data Frame dates = […]

¿Cómo construir una matriz de transición multindexada?

Comienzo con los siguientes datos tabulares: (digamos los resultados de las pruebas por versión) Artículo Resultado Versión 0 A OK V1 1 T1 NOK V1 2 T2 OK V1 3 T3 NOK V1 4 A OK V2 5 T1 OK V2 6 T2 NOK V2 7 T3 NOK V2 df=p.DataFrame({‘Item’: [‘TO’,’T1′,’T2′,’T3′,’TO’,’T1′,’T2′,’T3′], ‘Version’: [‘V1′,’V1′,’V1′,’V1′,’V2′,’V2′,’V2′,’V2’], ‘Result’ : […]

Tabla dinámica de pandas para múltiples columnas a la vez

Digamos que tengo un DataFrame: nj ptype wd wpt 0 2 1 2 1 1 3 2 1 2 2 1 1 3 1 3 2 2 3 3 4 3 1 2 2 Me gustaría agregar estos datos usando ptype como el índice, así: nj wd wpt 1.0 2.0 3.0 1.0 2.0 3.0 1.0 […]

pandas: concatene dos DataFrames con MultiIndexes ordenados de manera que el resultado tenga un MultiIndex ordenado

Por favor, hágame saber cómo concatenar dos DataFrames con MultiIndexes ordenados, de manera que el resultado tenga un MultiIndex ordenado. Dado que, ambos están ordenados, el algoritmo tiene que tener una complejidad lineal en términos del número total de filas en ambos DataFrames (esta es la complejidad de fusionar 2 listas ordenadas, que es lo […]

Remodelar el dataframe MultiIndex al formato tabular

Dada una muestra MultiIndex: idx = pd.MultiIndex.from_product([[0, 1, 2], [‘a’, ‘b’, ‘c’, ‘d’]]) df = pd.DataFrame({‘value’ : np.arange(12)}, index=idx) df value 0 a 0 b 1 c 2 d 3 1 a 4 b 5 c 6 d 7 2 a 8 b 9 c 10 d 11 ¿Cómo puedo convertir esto de manera eficiente […]

Pandas – escribe filas Multiindex con to_csv

Estoy utilizando to_csv para escribir un DataFrame Multiindex en archivos csv. El archivo csv tiene una columna que contiene los multiindexes en tuplas, como: (‘a’, ‘x’) (‘a’, ‘y’) (‘a’, ‘z’) (‘b’, ‘x’) (‘b’, ‘y’) (‘b’, ‘z’) Sin embargo, quiero poder generar el Multiindex en dos columnas en lugar de una columna de tuplas, como: a, […]

Pandas groupby (), agg (): ¿cómo devolver resultados sin el índice múltiple?

Tengo un dataframe: pe_odds[ [ ‘EVENT_ID’, ‘SELECTION_ID’, ‘ODDS’ ] ] Out[67]: EVENT_ID SELECTION_ID ODDS 0 100429300 5297529 18.00 1 100429300 5297529 20.00 2 100429300 5297529 21.00 3 100429300 5297529 22.00 4 100429300 5297529 23.00 5 100429300 5297529 24.00 6 100429300 5297529 25.00 Cuando uso groupby y agg, obtengo resultados con un índice múltiple: pe_odds.groupby( [ […]

Estructura de datos de alta dimensión en Python

¿Cuál es la mejor manera de almacenar y analizar fechas de alta dimensión en Python? Me gusta Pandas DataFrame y Panel donde puedo manipular fácilmente el eje. Ahora tengo un hipercubo (dim> = 4) de datos. He estado pensando en cosas como dict de paneles, tupla como entradas de panel. Me pregunto si hay algo […]