Articles of series de tiempo

Rellene los valores de fecha faltantes en una columna de Pandas Dataframe

Estoy usando Pandas para almacenar datos de precios de acciones usando marcos de datos. Hay 2940 filas en el conjunto de datos. La instantánea del conjunto de datos se muestra a continuación: Los datos de la serie de tiempo no contienen los valores para el sábado y el domingo. Por lo tanto, los valores perdidos […]

¿Pueden los pandas trazar una serie de tiempo sin tratar de convertir el índice a períodos?

Al trazar una serie de tiempo, observo un comportamiento inusual, que eventualmente resulta en no poder formatear los xticks de la ttwig. Parece que los pandas intentan convertir internamente el índice en un PeriodIndex, pero obviamente solo tiene éxito si los valores de la marca de tiempo están espaciados por igual. Si están espaciadas de […]

Modelo StatesSpace.SARIMAX: por qué el modelo usa todos los datos para entrenar, y predice el rango de un modelo de tren.

Seguí el tutorial para estudiar el modelo SARIMAX: https://www.digitalocean.com/community/tutorials/a-guide-to-time-series-forecasting-with-arima-in-python-3 . El rango de fechas de los datos es 1958-2001. mod = sm.tsa.statespace.SARIMAX(y, order=(1, 1, 1), seasonal_order=(1, 1, 1, 12), enforce_stationarity=False, enforce_invertibility=False) results = mod.fit() cuando estoy ajustando un modelo de serie temporal ARIMA, encontré al autor todos los datos del rango de fechas para ajustar […]

Matplotlib elimina la interpolación de los datos faltantes

Estoy trazando datos de series de tiempo usando Matplotlib y faltan algunos de los datos en la secuencia. Matplotlib une de manera implícita el último punto de datos contiguos al siguiente. Pero en caso de que falten datos, la ttwig se ve fea. La siguiente es la ttwig obtenida. Se puede ver que cerca del […]

Python Statsmodel ARIMA start

Acabo de empezar a trabajar en el análisis de series de tiempo usando statsmodels. Tengo un conjunto de datos con fechas y valores (durante aproximadamente 3 meses). Estoy enfrentando algunos problemas para proporcionar el orden correcto al modelo ARIMA. Estoy buscando ajustar las tendencias y la estacionalidad y luego calcular los valores atípicos. Mis ‘valores’ […]

Python pandas interpolación y regularización de series de tiempo.

Estoy usando Python Pandas por primera vez. Tengo datos de tráfico de retraso de 5 minutos en formato csv: … 2015-01-04 08:29:05,271238 2015-01-04 08:34:05,329285 2015-01-04 08:39:05,-1 2015-01-04 08:44:05,260260 2015-01-04 08:49:05,263711 … Hay varias cuestiones: para algunas marcas de tiempo faltan datos (-1) entradas faltantes (también 2/3 horas consecutivas) la frecuencia de las observaciones no es […]

Descomposición estacional de series de tiempo por Loess con Python

Estoy tratando de hacer con Python la función STL en R. Los comandos R son fit <- stl(elecequip, s.window=5) plot(fit) ¿Cómo hago esto en Python? Investigué que statmodels.tsa tiene algunas funciones de análisis de series temporales, pero pude encontrar específicamente “Descomposición estacional de series temporales por Loess” en la documentación. De manera similar, en Python.org […]

R recoger la fecha de inicio y la fecha de finalización del período de recesión

Estoy tratando de trazar los períodos de sombreado de recesión en R. Considere el siguiente ejemplo, los períodos de recesión se reconocen como 1 y los períodos de no recesión son 0. Date Recession 1918-09-01 1 1918-10-01 1 1918-11-01 1 1918-12-01 1 1919-01-01 1 1919-02-01 1 1919-03-01 1 1919-04-01 0 1919-05-01 0 1919-06-01 0 1919-07-01 […]

Cómo dividir un dataframe o serie de pandas por día (posiblemente utilizando un iterador)

Tengo una larga serie de tiempo, por ejemplo. import pandas as pd index=pd.date_range(start=’2012-11-05′, end=’2012-11-10′, freq=’1S’).tz_localize(‘Europe/Berlin’) df=pd.DataFrame(range(len(index)), index=index, columns=[‘Number’]) Ahora quiero extraer todos los sub-cuadros de datos para cada día, para obtener el siguiente resultado: df_2012-11-05: data frame with all data referring to day 2012-11-05 df_2012-11-06: etc. df_2012-11-07 df_2012-11-08 df_2012-11-09 df_2012-11-10 ¿Cuál es la forma más […]

Combinando múltiples datos de series temporales en una matriz numpy 2d

Tengo datos de timeseries de tres sensores diferentes durante un período de un año, los sensores producen un punto de datos aproximadamente cada 3 minutos, los sensores no están sincronizados, por lo que producen una salida de punto de datos en diferentes momentos entre sí. Estos datos se encuentran en una db sqlite en una […]