Articles of Series

Cálculo de distancia entre filas en Pandas Dataframe usando una matriz de distancia

Tengo el siguiente dataframe de Pandas: In [31]: import pandas as pd sample = pd.DataFrame({‘Sym1’: [‘a’,’a’,’a’,’d’],’Sym2′:[‘a’,’c’,’b’,’b’],’Sym3′:[‘a’,’c’,’b’,’d’],’Sym4′:[‘b’,’b’,’b’,’a’]},index=[‘Item1′,’Item2′,’Item3′,’Item4’]) In [32]: print(sample) Out [32]: Sym1 Sym2 Sym3 Sym4 Item1 aaab Item2 accb Item3 abbb Item4 dbda y quiero encontrar la forma elegante de obtener la distancia entre cada Item según esta matriz de distancia: In [34]: DistMatrix = […]

Descomposición de elementos de series temporales, estacionales y residuales.

Tengo un DataFrame con algunas series de tiempo: divida movav12 var varmovav12 Date 2004-01 0 NaN NaN NaN 2004-02 0 NaN NaN NaN 2004-03 0 NaN NaN NaN 2004-04 34 NaN inf NaN 2004-05 30 NaN -0.117647 NaN 2004-06 44 NaN 0.466667 NaN 2004-07 35 NaN -0.204545 NaN 2004-08 31 NaN -0.114286 NaN 2004-09 30 […]

¿Cómo puedo seleccionar el ‘último día hábil del mes’ en Pandas?

Estoy tratando de subcontratar un DataFrame en la condición que es la última del mes. Solía: df[‘Month_End’] = df.index.is_month_end sample = df[df[‘Month_End’] == 1] Esto funciona, pero estoy trabajando con datos del mercado de valores, por lo que me pierdo todas las instancias en las que el fin de mes real es durante el fin […]

¿Cómo entender los argumentos cerrados y etiquetados en el método de remuestreo de pandas?

Basado en la documentación de los pandas de aquí: Docs. Y los ejemplos: >>> index = pd.date_range(‘1/1/2000′, periods=9, freq=’T’) >>> series = pd.Series(range(9), index=index) >>> series 2000-01-01 00:00:00 0 2000-01-01 00:01:00 1 2000-01-01 00:02:00 2 2000-01-01 00:03:00 3 2000-01-01 00:04:00 4 2000-01-01 00:05:00 5 2000-01-01 00:06:00 6 2000-01-01 00:07:00 7 2000-01-01 00:08:00 8 Freq: T, […]

agregue un campo en el dataframe de pandas con columnas MultiIndex

He buscado una respuesta a esta pregunta porque parece bastante simple, pero no he podido encontrar nada todavía. Disculpas si me perdí algo. Tengo pandas versión 0.10.0 y he estado experimentando con datos de la siguiente forma: import pandas import numpy as np import datetime start_date = datetime.datetime(2009,3,1,6,29,59) r = pandas.date_range(start_date, periods=12) cols_1 = [‘AAPL’, […]

Pandas comparan la siguiente fila

Tengo un dataframe como este d={} d[‘z’]=[‘Q8′,’Q8′,’Q7′,’Q9′,’Q9’] d[‘t’]=[’10:30′,’10:31′,’10:38′,’10:40′,’10:41′] d[‘qty’]=[20,20,9,12,12] Quiero comparar la primera fila con la segunda fila es la misma cantidad que la siguiente fila Y es t mayor en la siguiente fila Y es el valor z igual que la fila siguiente El valor deseado es qty tz valid 0 20 2015-06-05 10:30:00 […]

¿Cómo contar la distancia al cero anterior en las series de pandas?

Tengo las siguientes series de pandas (representadas como una lista): [7,2,0,3,4,2,5,0,3,4] Me gustaría definir una nueva serie que devuelva la distancia al último cero. Significa que me gustaría tener la siguiente salida: [1,2,0,1,2,3,4,0,1,2] ¿Cómo hacerlo en pandas de la manera más eficiente?

KeyError: 0 al acceder al valor en series pandas

En mi script tengo df [‘Time’] como se muestra a continuación. 497 2017-08-06 11:00:00 548 2017-08-08 15:00:00 580 2017-08-10 04:00:00 646 2017-08-12 23:00:00 Name: Time, dtype: datetime64[ns] Pero cuando lo hago t1=pd.Timestamp(df[‘Time’][0]) Me sale un error como este: KeyError: 0 ¿Necesito algún tipo de conversión aquí? Si es así, ¿cómo se puede solucionar?

pandas: ¿Cómo obtener el artículo más frecuente en la serie de pandas?

¿Cómo puedo obtener el artículo más frecuente en una serie de pandas ? Considera la serie s s = pd.Series(“1 5 3 3 3 5 2 1 8 10 2 3 3 3”.split()).astype(int) El valor devuelto debe ser 3

Elemento más grande todas las listas en Panda Series

Tengo una serie de pandas decir import pandas as pd a = pd.Series([ [1, 2, 3, 4, 5], [6, 7, 8, 3, 334], [333, 4, 5, 3, 4] ]) Quiero encontrar el elemento más grande en todas las listas, que es 334, ¿cuál es la forma más fácil de hacerlo?