Las pandas .describe () solo devuelven 4 estadísticas en el dataframe int (count, unique, top, freq) … no min, max, etc.

¿Por qué podría ser esto? Mis datos parecen bastante simples y directos, es un dataframe de 1 columna de ints, pero .describe solo devuelve el conteo, único, superior, frecuencia … no máximo, mínimo y otros resultados esperados.

(Tenga en cuenta que la funcionalidad .describe () es la esperada en otros proyectos / conjuntos de datos)

Parece que los pandas no reconocen tus datos como int.

Trate de hacer esto explícitamente:

 print(df.astype(int).describe()) 

Tratar:

 df.agg(['count', 'nunique', 'min', 'max']) 

Puede agregar o eliminar las diferentes funciones de agregación a esa lista. Y cuando tengo bastantes columnas, personalmente me gusta transponerlo:

 df.agg(['count', 'nunique', 'min', 'max']).transpose() 

Para reducir las agregaciones en un subconjunto de columnas, hay diferentes maneras de hacerlo.

  • Por contener una palabra: ejemplo ‘ID’

    df.filter (like = ‘ID’). agg ([‘count’, ‘nunique’])

  • Por tipo de datos:

    df.select_dtypes (include = [‘int’]). agg ([‘count’, ‘nunique’])

    df.select_dtypes (exclude = [‘float64’]). agg ([‘count’, ‘nunique’])