Seleccione solo un índice de DataFrame multiindex

Estoy tratando de crear un nuevo DataFrame usando solo un índice de un DataFrame multi-indexado.

ABC first second bar one 0.895717 0.410835 -1.413681 two 0.805244 0.813850 1.607920 baz one -1.206412 0.132003 1.024180 two 2.565646 -0.827317 0.569605 foo one 1.431256 -0.076467 0.875906 two 1.340309 -1.187678 -2.211372 qux one -1.170299 1.130127 0.974466 two -0.226169 -1.436737 -2.006747 

Idealmente, me gustaría algo como esto:

 In: df.ix[level="first"] 

y:

 Out: ABC first bar 0.895717 0.410835 -1.413681 0.805244 0.813850 1.607920 baz -1.206412 0.132003 1.024180 2.565646 -0.827317 0.569605 foo 1.431256 -0.076467 0.875906 1.340309 -1.187678 -2.211372 qux -1.170299 1.130127 0.974466 -0.226169 -1.436737 -2.006747 ` 

Esencialmente, quiero eliminar todos los demás índices del índice múltiple que no sean el nivel first . ¿Hay una forma fácil de hacer esto?

Una forma podría ser simplemente volver a df.index al nivel deseado del MultiIndex. Puede hacer esto especificando el nombre de la etiqueta que desea mantener:

 df.index = df.index.get_level_values('first') 

o usa el valor entero del nivel:

 df.index = df.index.get_level_values(0) 

Todos los otros niveles del MultiIndex desaparecerían aquí.

La solución es bastante nueva y utiliza la función df.xs como

 In [88]: df.xs('bar', level='first') Out[88]: Second Third one A -2.315312 B 0.497769 C 0.108523 two A -0.778303 B -1.555389 C -2.625022 dtype: float64 

También se puede hacer con múltiples índices como

 In [89]: df.xs(('bar', 'A'), level=('First', 'Third')) Out[89]: Second one -2.315312 two -0.778303 dtype: float64 

La configuración para los ejemplos está abajo.

 import pandas as pd import numpy as np arrays = [ np.array(['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux']), np.array(['one', 'two', 'one', 'two', 'one', 'two', 'one', 'two']) ] index = pd.MultiIndex.from_tuples(list(zip(*arrays)), names=['first', 'second']) df = pd.DataFrame(np.random.randn(3, 8), index=['A', 'B', 'C'], columns=index) df.index.names = pd.core.indexes.frozen.FrozenList(['First', 'Second', 'Third']) df = df.unstack()