Articles of pandas

¿Pandas DataFrame Object Herencia o uso de objetos?

Estoy construyendo una biblioteca para trabajar con datos estructurados muy específicos y estoy construyendo mi infraestructura sobre Pandas. Actualmente estoy escribiendo un montón de diferentes contenedores de datos para diferentes casos de uso, como CTMatrix para Country x Time Data, etc. para alojar los métodos adecuados para todos los datos estructurados de CountryxTime. Actualmente estoy […]

Exportar Pandas DataFrame a un archivo PDF usando Python

¿Cuál es una forma eficiente de generar PDF para marcos de datos en Pandas?

Multi-index pivoting en pandas

Considere el siguiente dataframe: item_id hour when date quantity 110 0YrKNYeEoa 1 before 2015-01-26 247286 111 0UMNiXI7op 1 before 2015-01-26 602001 112 0QBtIMN3AH 1 before 2015-01-26 981630 113 0GuKXLiWyV 1 after 2015-01-26 2203913 114 0SoFbjvXTs 1 after 2015-01-26 660183 115 0UkT257SXj 1 before 2015-01-26 689332 116 0RPjXnkiGx 1 after 2015-01-26 283090 117 0FhJ9RGsLT 1 before […]

convertir todo el dataframe de pandas en enteros en pandas (0.17.0)

Mi pregunta es muy similar a esta , pero necesito convertir todo el dataframe en lugar de solo una serie. La función to_numeric solo funciona en una serie a la vez y no es un buen reemplazo para el comando convert_objects desuso. ¿Hay alguna manera de obtener resultados similares al convert_objects(convert_numeric=True) en la nueva versión […]

Imprima la ruta de decisión de una muestra específica en un clasificador de bosque aleatorio

Cómo imprimir la ruta de decisión de un bosque aleatorio en lugar de la ruta de árboles individuales en un bosque aleatorio para una muestra específica. import numpy as np import pandas as pd from sklearn.datasets import make_classification from sklearn.ensemble import RandomForestClassifier X, y = make_classification(n_samples=1000, n_features=6, n_informative=3, n_classes=2, random_state=0, shuffle=False) # Creating a dataFrame […]

grupo por semana en pandas

Estoy teniendo este dataframe: Name Date Quantity Apple 07/11/17 20 orange 07/14/17 20 Apple 07/14/17 70 Orange 07/25/17 40 Apple 07/20/17 30 Quiero agregar esto por Nombre y Fecha para obtener la sum de las cantidades Detalles: Fecha : Grupo, el resultado debe ser al principio de la semana (o solo el lunes) Cantidad : […]

Uso de la tabla cruzada de Pandas con gráficos de barras astackdos en el mar

Estoy tratando de crear una gráfica de barras astackda en el mar con mi dataframe. Primero he generado una tabla de referencias cruzadas en pandas así: pd.crosstab(df[‘Period’], df[‘Mark’]) que devuelve: Mark False True Period BASELINE 583 132 WEEK 12 721 0 WEEK 24 589 132 WEEK 4 721 0 Me gustaría usar Seaborn para crear […]

Pandas: restando dos columnas de fecha y el resultado es un entero

Tengo dos columnas en un dataframe de Pandas que son fechas. Busco restar una columna de otra y el resultado es la diferencia en números de días como un entero . Un vistazo a los datos: df_test.head(10) Out[20]: First_Date Second Date 0 2016-02-09 2015-11-19 1 2016-01-06 2015-11-30 2 NaT 2015-12-04 3 2016-01-06 2015-12-08 4 NaT […]

¿Pandas de valores de columna a columnas?

He visto algunas variaciones sobre el tema de explotar una columna / serie en varias columnas de un dataframe de Pandas, pero he estado tratando de hacer algo y no he tenido éxito con los enfoques existentes. Dado un DataFrame como tal: key val id 2 foo oranges 2 bar bananas 2 baz apples 3 […]

convertir el dataframe de Python a la lista

Tengo un DataFrame de Python con varias columnas. LogBlk Page BayFail 0 0 [0, 1, 8, 9] 1 16 [0, 1, 4, 5, 6, 8, 9, 12, 13, 14] 2 32 [0, 1, 4, 5, 6, 8, 9, 12, 13, 14] 3 48 [0, 1, 4, 5, 6, 8, 9, 12, 13, 14] Quiero encontrar […]