iterar sobre el objeto GroupBy en dask

¿Es posible, iterar sobre un objeto dask GroupBy para obtener acceso a los marcos de datos subyacentes? Lo intenté:

import dask.dataframe as dd import pandas as pd pdf = pd.DataFrame({'A':[1,2,3,4,5], 'B':['1','1','a','a','a']}) ddf = dd.from_pandas(pdf, npartitions = 3) groups = ddf.groupby('B') for name, df in groups: print(name) 

Sin embargo, esto produce un error: KeyError: 'Column not found: 0'

En términos más generales, ¿qué tipo de interacciones permite el objeto dask GroupBy, excepto por el método de aplicación?

podría iterar a través de grupos haciendo esto con dask, quizás haya una mejor manera pero esto funciona para mí.

 import dask.dataframe as dd import pandas as pd pdf = pd.DataFrame({'A':[1, 2, 3, 4, 5], 'B':['1','1','a','a','a']}) ddf = dd.from_pandas(pdf, npartitions = 3) groups = ddf.groupby('B') for group in pdf['B'].unique(): print groups.get_group(group) 

esto volvería

 dd.DataFrame dd.DataFrame 

Generalmente no se recomienda iterar sobre objetos Dask.dataframe. Es ineficiente. En su lugar, puede intentar construir una función y asignar esa función a los grupos resultantes usando groupby.apply