Articles of Series

Usando la lógica booleana para limpiar DF ​​en pandas

df shape square shape circle animal NaN NaN dog NaN cat NaN fish color red color blue wish_df shape square shape circle animal dog animal cat animal fish color red color blue Tengo un df que contiene información que necesita ser normalizada. He notado un patrón que indica cómo unir las columnas y normalizar los […]

cómo eliminar el tiempo de fecha redundante cuando el eje x es pandas incontinuos DatetimeIndex

Quiero trazar una serie de pandas cuyo índice es incalculable DatatimeIndex. Mi código es el siguiente: import matplotlib.dates as mdates index = pd.DatetimeIndex([‘2000-01-01 00:00:00’, ‘2000-01-01 00:01:00’, ‘2000-01-01 00:02:00’, ‘2000-01-01 00:03:00’, ‘2000-01-01 00:07:00’, ‘2000-01-01 00:08:00′], dtype=’datetime64[ns]’) df = pd.Series(range(6), index=index) print(df) plt.plot(df.index, df.values) plt.gca().xaxis.set_major_formatter(mdates.DateFormatter(“%M”)) plt.show() La salida es: Pero el resultado no es lo que realmente […]

Transforma una serie en un dataframe (de pandas / Python) donde las columnas son los niveles de la serie.

Estoy trabajando con pandas y utilicé el groupby: group = df_crimes_query.groupby([“CrimeDateTime”, “WeaponFactor”]).size() group.head(20) CrimeDateTime WeaponFactor 2016-01-01 FIREARM 11 HANDS 26 KNIFE 3 OTHER 11 UNDEFINED 102 2016-01-02 FIREARM 10 HANDS 21 KNIFE 8 OTHER 6 UNDEFINED 68 2016-01-03 FIREARM 12 HANDS 13 KNIFE 6 OTHER 5 UNDEFINED 73 2016-01-04 FIREARM 11 HANDS 10 KNIFE 1 […]

Cálculo de distancia entre filas en Pandas Dataframe usando una matriz de distancia

Tengo el siguiente dataframe de Pandas: In [31]: import pandas as pd sample = pd.DataFrame({‘Sym1’: [‘a’,’a’,’a’,’d’],’Sym2′:[‘a’,’c’,’b’,’b’],’Sym3′:[‘a’,’c’,’b’,’d’],’Sym4′:[‘b’,’b’,’b’,’a’]},index=[‘Item1′,’Item2′,’Item3′,’Item4’]) In [32]: print(sample) Out [32]: Sym1 Sym2 Sym3 Sym4 Item1 aaab Item2 accb Item3 abbb Item4 dbda y quiero encontrar la forma elegante de obtener la distancia entre cada Item según esta matriz de distancia: In [34]: DistMatrix = […]

Descomposición de elementos de series temporales, estacionales y residuales.

Tengo un DataFrame con algunas series de tiempo: divida movav12 var varmovav12 Date 2004-01 0 NaN NaN NaN 2004-02 0 NaN NaN NaN 2004-03 0 NaN NaN NaN 2004-04 34 NaN inf NaN 2004-05 30 NaN -0.117647 NaN 2004-06 44 NaN 0.466667 NaN 2004-07 35 NaN -0.204545 NaN 2004-08 31 NaN -0.114286 NaN 2004-09 30 […]

¿Cómo puedo seleccionar el ‘último día hábil del mes’ en Pandas?

Estoy tratando de subcontratar un DataFrame en la condición que es la última del mes. Solía: df[‘Month_End’] = df.index.is_month_end sample = df[df[‘Month_End’] == 1] Esto funciona, pero estoy trabajando con datos del mercado de valores, por lo que me pierdo todas las instancias en las que el fin de mes real es durante el fin […]

¿Cómo entender los argumentos cerrados y etiquetados en el método de remuestreo de pandas?

Basado en la documentación de los pandas de aquí: Docs. Y los ejemplos: >>> index = pd.date_range(‘1/1/2000′, periods=9, freq=’T’) >>> series = pd.Series(range(9), index=index) >>> series 2000-01-01 00:00:00 0 2000-01-01 00:01:00 1 2000-01-01 00:02:00 2 2000-01-01 00:03:00 3 2000-01-01 00:04:00 4 2000-01-01 00:05:00 5 2000-01-01 00:06:00 6 2000-01-01 00:07:00 7 2000-01-01 00:08:00 8 Freq: T, […]

agregue un campo en el dataframe de pandas con columnas MultiIndex

He buscado una respuesta a esta pregunta porque parece bastante simple, pero no he podido encontrar nada todavía. Disculpas si me perdí algo. Tengo pandas versión 0.10.0 y he estado experimentando con datos de la siguiente forma: import pandas import numpy as np import datetime start_date = datetime.datetime(2009,3,1,6,29,59) r = pandas.date_range(start_date, periods=12) cols_1 = [‘AAPL’, […]

Pandas comparan la siguiente fila

Tengo un dataframe como este d={} d[‘z’]=[‘Q8′,’Q8′,’Q7′,’Q9′,’Q9’] d[‘t’]=[’10:30′,’10:31′,’10:38′,’10:40′,’10:41′] d[‘qty’]=[20,20,9,12,12] Quiero comparar la primera fila con la segunda fila es la misma cantidad que la siguiente fila Y es t mayor en la siguiente fila Y es el valor z igual que la fila siguiente El valor deseado es qty tz valid 0 20 2015-06-05 10:30:00 […]

¿Cómo contar la distancia al cero anterior en las series de pandas?

Tengo las siguientes series de pandas (representadas como una lista): [7,2,0,3,4,2,5,0,3,4] Me gustaría definir una nueva serie que devuelva la distancia al último cero. Significa que me gustaría tener la siguiente salida: [1,2,0,1,2,3,4,0,1,2] ¿Cómo hacerlo en pandas de la manera más eficiente?