Articles of multi index

Combinar columnas MultiIndex juntas en 1 nivel

Aquí hay algunos datos de otra pregunta: date type value 1/1/2016 a 1 1/1/2016 b 2 1/1/2016 a 1 1/1/2016 b 4 1/2/2016 a 1 1/2/2016 b 1 Ejecutar esta línea de código: x = df.groupby([‘date’, ‘type’]).value.agg([‘sum’, ‘max’]).unstack() x debería verse así: sum max type abab date 1/1/2016 2 6 1 4 1/2/2016 1 1 […]

Slice MultiIndex pandas DataFrame por posición

Actualmente estoy tratando de cortar un DataFrame MuliIndex que tiene tres niveles por posición. Estoy usando pandas 19.1 Level0 Level1 Level2 Value 03-00368 A Item111 6.9 03-00368 A Item333 19.2 03-00368 B Item111 9.7 03-00368 B Item222 17.4 04-00176 C Item110 17.4 04-00176 C Item111 9.7 04-00246 D Item46 12.5 04-00246 D Item66 5.6 04-00246 […]

Combina dos niveles MultiIndex en uno en Pandas

Tengo un dataframe de Pandas que es MultiIndexed. El segundo nivel contiene un año ([2014,2015]) y el tercero contiene el número del mes ([1, 2, .., 12]). Me gustaría fusionar estos dos en un solo nivel como – [1/2014, 2/2014 …, 6/2015]. ¿Como se puede hacer esto? Soy nuevo en Pandas. Busqué mucho pero no […]

Eliminando una sola (sub) columna de un MultiIndex

Tengo el siguiente df col1 col2 col3 ababab 1 … 2 3 y simplemente no puedo descubrir cómo soltar un solo ‘subnivel’, por ejemplo, df.col1.a Puedo df.col1.drop(‘a’, axis=1) , pero la reasignación como df.col1=df.col1.drop(‘a’, axis=1) falla. La estructura lógica df.colums entiendo, pero ¿cómo debo modificarla?

Configurando valores con multiindex en pandas

Ya hay un par de preguntas sobre SO relacionadas con esto, especialmente esta , sin embargo, ninguna de las respuestas parece funcionar para mí y algunos enlaces a documentos (especialmente sobre el ordenamiento) están rotos, así que le haré otra. . Estoy tratando de hacer algo (aparentemente) muy simple. Considere el siguiente dataframe multiindexado: import […]

Python (pandas): almacena un cuadro de datos en hdf5 con un índice múltiple

Necesito trabajar con un dataframe de gran dimensión con índice múltiple, así que intenté crear un dataframe para aprender a almacenarlo en un archivo hdf5. El dataframe es así: (con el índice múltiple en las primeras 2 columnas) Symbol Date 0 C 2014-07-21 4792 B 2014-07-21 4492 A 2014-07-21 5681 B 2014-07-21 8310 A 2014-07-21 […]

Transforme Pandas DataFrame con un índice jerárquico de n niveles en una matriz numpy nD

Pregunta ¿Hay una buena manera de transformar un DataFrame con un índice de n niveles en una matriz n -D Numpy (también conocido como n -tensor)? Ejemplo Supongamos que configuro un DataFrame como from pandas import DataFrame, MultiIndex index = range(2), range(3) value = range(2 * 3) frame = DataFrame(value, columns=[‘value’], index=MultiIndex.from_product(index)).drop((1, 0)) print frame […]

Uso de la indexación booleana para fila y columna MultiIndex en Pandas

Las preguntas están al final, en negrita . Pero primero, vamos a configurar algunos datos: import numpy as np import pandas as pd from itertools import product np.random.seed(1) team_names = [‘Yankees’, ‘Mets’, ‘Dodgers’] jersey_numbers = [35, 71, 84] game_numbers = [1, 2] observer_names = [‘Bill’, ‘John’, ‘Ralph’] observation_types = [‘Speed’, ‘Strength’] row_indices = list(product(team_names, jersey_numbers, […]

Ordenar el dataframe multiindex y por columna

Actualizado: pandas versión 0.23.0 resuelve este problema con Clasificación por una combinación de columnas y niveles de índice He luchado con esto y sospecho que hay una mejor manera. ¿Cómo ordeno el siguiente dataframe por nombre de nivel de índice ‘idx_0’, nivel = 0 y por columna, ‘value_1’ descendiendo de manera tal que la columna […]

Cómo salirse con un índice multidimensional en pandas

En Pandas, ¿cuál es una buena manera de seleccionar conjuntos de filas arbitrarias en un índice múltiple? df = pd.DataFrame(columns=[‘A’, ‘B’, ‘C’]) df[‘A’] = [‘a’, ‘a’, ‘b’, ‘b’] df[‘B’] = [1,2,3,4] df[‘C’] = [1,2,3,4] the_indices_we_want = df.ix[[0,3],[‘A’,’B’]] df = df.set_index([‘A’, ‘B’]) #Create a multiindex df.ix[the_indices_we_want] #ValueError: Cannot index with multidimensional key df.ix[[tuple(x) for x in […]