Articles of multi index

Pandas MultiIndex de expresiones regulares en la columna

Tengo un dataframe de pandas que se ve df = pd.DataFrame( [ [‘JoeSmith’, 5], [‘CathySmith’, 3], [‘BrianSmith’, 12], [‘MarySmith’, 67], [‘JoeJones’, 23], [‘CathyJones’, 98], [‘BrianJones’, 438], [‘MaryJones’, 75], [‘JoeCollins’, 56], [‘CathyCollins’, 125], [‘BrianCollins’, 900], [‘MaryCollins’, 321], ], columns = [‘Name’, ‘Value’] ) print df Name Value 0 JoeSmith 5 1 CathySmith 3 2 BrianSmith 12 […]

Cómo construir un DataFrame de MultiIndex Pandas desde un diccionario nested con listas

Tengo el siguiente diccionario. d= {‘key1’: {‘sub-key1’: [‘a’,’b’,’c’,’d’,’e’]}, ‘key2’: {‘sub-key2’: [‘1′,’2′,’3′,’5′,’8′,’9′,’10’]}} Con la ayuda de esta publicación, logré convertir este diccionario en un DataFrame. df = pd.DataFrame.from_dict({(i,j): d[i][j] for i in d.keys() for j in d[i].keys()}, orient=’index’) Sin embargo, mi DataFrame toma la siguiente forma: 0 1 2 3 4 5 6 (key1, sub-key1) abcde […]

Combinar columnas MultiIndex juntas en 1 nivel

Aquí hay algunos datos de otra pregunta: date type value 1/1/2016 a 1 1/1/2016 b 2 1/1/2016 a 1 1/1/2016 b 4 1/2/2016 a 1 1/2/2016 b 1 Ejecutar esta línea de código: x = df.groupby([‘date’, ‘type’]).value.agg([‘sum’, ‘max’]).unstack() x debería verse así: sum max type abab date 1/1/2016 2 6 1 4 1/2/2016 1 1 […]

Slice MultiIndex pandas DataFrame por posición

Actualmente estoy tratando de cortar un DataFrame MuliIndex que tiene tres niveles por posición. Estoy usando pandas 19.1 Level0 Level1 Level2 Value 03-00368 A Item111 6.9 03-00368 A Item333 19.2 03-00368 B Item111 9.7 03-00368 B Item222 17.4 04-00176 C Item110 17.4 04-00176 C Item111 9.7 04-00246 D Item46 12.5 04-00246 D Item66 5.6 04-00246 […]

Combina dos niveles MultiIndex en uno en Pandas

Tengo un dataframe de Pandas que es MultiIndexed. El segundo nivel contiene un año ([2014,2015]) y el tercero contiene el número del mes ([1, 2, .., 12]). Me gustaría fusionar estos dos en un solo nivel como – [1/2014, 2/2014 …, 6/2015]. ¿Como se puede hacer esto? Soy nuevo en Pandas. Busqué mucho pero no […]

Eliminando una sola (sub) columna de un MultiIndex

Tengo el siguiente df col1 col2 col3 ababab 1 … 2 3 y simplemente no puedo descubrir cómo soltar un solo ‘subnivel’, por ejemplo, df.col1.a Puedo df.col1.drop(‘a’, axis=1) , pero la reasignación como df.col1=df.col1.drop(‘a’, axis=1) falla. La estructura lógica df.colums entiendo, pero ¿cómo debo modificarla?

Configurando valores con multiindex en pandas

Ya hay un par de preguntas sobre SO relacionadas con esto, especialmente esta , sin embargo, ninguna de las respuestas parece funcionar para mí y algunos enlaces a documentos (especialmente sobre el ordenamiento) están rotos, así que le haré otra. . Estoy tratando de hacer algo (aparentemente) muy simple. Considere el siguiente dataframe multiindexado: import […]

Python (pandas): almacena un cuadro de datos en hdf5 con un índice múltiple

Necesito trabajar con un dataframe de gran dimensión con índice múltiple, así que intenté crear un dataframe para aprender a almacenarlo en un archivo hdf5. El dataframe es así: (con el índice múltiple en las primeras 2 columnas) Symbol Date 0 C 2014-07-21 4792 B 2014-07-21 4492 A 2014-07-21 5681 B 2014-07-21 8310 A 2014-07-21 […]

Transforme Pandas DataFrame con un índice jerárquico de n niveles en una matriz numpy nD

Pregunta ¿Hay una buena manera de transformar un DataFrame con un índice de n niveles en una matriz n -D Numpy (también conocido como n -tensor)? Ejemplo Supongamos que configuro un DataFrame como from pandas import DataFrame, MultiIndex index = range(2), range(3) value = range(2 * 3) frame = DataFrame(value, columns=[‘value’], index=MultiIndex.from_product(index)).drop((1, 0)) print frame […]

Uso de la indexación booleana para fila y columna MultiIndex en Pandas

Las preguntas están al final, en negrita . Pero primero, vamos a configurar algunos datos: import numpy as np import pandas as pd from itertools import product np.random.seed(1) team_names = [‘Yankees’, ‘Mets’, ‘Dodgers’] jersey_numbers = [35, 71, 84] game_numbers = [1, 2] observer_names = [‘Bill’, ‘John’, ‘Ralph’] observation_types = [‘Speed’, ‘Strength’] row_indices = list(product(team_names, jersey_numbers, […]