Articles of series de tiempo

Pandas: Usando la marca de tiempo de la época de Unix como índice de fecha y hora

Mi aplicación implica tratar con datos (contenidos en un CSV) que tiene la siguiente forma: Epoch (number of seconds since Jan 1, 1970), Value 1368431149,20.3 1368431150,21.4 .. Actualmente leo el CSV usando el método numpy loadtxt (puedo usar fácilmente read_csv desde Pandas). Actualmente, para mi serie, estoy convirtiendo el campo de marcas de tiempo de […]

¿Por qué NUMPY correlate y corrcoef devuelven valores diferentes y cómo “normalizar” un correlato en modo “completo”?

Estoy tratando de usar un análisis de series de tiempo en Python, usando Numpy. Tengo dos series algo medianas, con valores de 20k cada una y quiero verificar la correlación deslizante. El corrcoef me da como salida una Matriz de coeficientes de correlación / correlación automática. Nada útil por sí mismo en mi caso, ya […]

Pandas – agrupando series de tiempo intra-día por fecha

Tengo una serie de devoluciones de registros intradía a lo largo de varios días que me gustaría cambiar de muestra a ohlc diario. Puedo hacer algo como hi = series.resample(‘B’, how=lambda x: np.max(np.cumsum())) low = series.resample(‘B’, how=lambda x: np.min(np.cumsum())) Pero parece ineficiente calcular la sum en cada llamada. ¿Hay alguna forma de calcular primero las […]

pandas, python – cómo seleccionar tiempos específicos en series temporales

Trabajé durante bastante tiempo usando python y pandas para analizar un conjunto de datos por hora y me parece bastante agradable (Viniendo de Matlab). Ahora estoy un poco atascado. He creado mi DataFrame así: SamplingRateMinutes=60 index = DateRange(initialTime,finalTime, offset=datetools.Minute(SamplingRateMinutes)) ts=DataFrame(data, index=index) Lo que quiero hacer ahora es seleccionar los Datos para todos los días en […]

Regresión de vectores de apoyo – gráfico de predicción

Esta publicación es una continuación de mi pregunta anterior que se encuentra en el siguiente enlace. Predicción: predicción en serie temporal de eventos futuros utilizando el módulo SVR Corriendo con algunos datos de muestra, obtengo el siguiente gráfico, pero parece ser difícil interpretar esta gráfica. ¿Qué podemos hacer de esto? ¿Podemos decir (o predecir el […]

¿Cómo remuestrear un dataframe con diferentes funciones aplicadas a cada columna?

Tengo una serie de tiempos con temperatura y radiación en un dataframe pandas. La resolución del tiempo es de 1 minuto en pasos regulares. import datetime import pandas as pd import numpy as np date_times = pd.date_range(datetime.datetime(2012, 4, 5, 8, 0), datetime.datetime(2012, 4, 5, 12, 0), freq=’1min’) tamb = np.random.sample(date_times.size) * 10.0 radiation = np.random.sample(date_times.size) […]

Pandas: volver a muestrear series de tiempo con groupby

Dado el siguiente dataframe de pandas: In [115]: times = pd.to_datetime(pd.Series([‘2014-08-25 21:00:00′,’2014-08-25 21:04:00’, ‘2014-08-25 22:07:00′,’2014-08-25 22:09:00’])) locations = [‘HK’, ‘LDN’, ‘LDN’, ‘LDN’] event = [‘foo’, ‘bar’, ‘baz’, ‘qux’] df = pd.DataFrame({‘Location’: locations, ‘Event’: event}, index=times) df Out[115]: Event Location 2014-08-25 21:00:00 foo HK 2014-08-25 21:04:00 bar LDN 2014-08-25 22:07:00 baz LDN 2014-08-25 22:09:00 qux LDN […]

¿Pueden los pandas trazar un histogtwig de fechas?

Tomé mi Serie y la coaccioné en una columna datetime de dtype = datetime64[ns] (aunque solo necesito una resolución de día … no estoy seguro de cómo cambiar). import pandas as pd df = pd.read_csv(‘somefile.csv’) column = df[‘date’] column = pd.to_datetime(column, coerce=True) pero el trazado no funciona: ipdb> column.plot(kind=’hist’) *** TypeError: ufunc add cannot use […]

La creación de pandas.Series () usando columnas de DataFrame devuelve entradas de datos NaN

Estoy intentando convertir un dataframe en una serie usando un código que, simplificado, se ve así: dates = [‘2016-1-{}’.format(i)for i in range(1,21)] values = [i for i in range(20)] data = {‘Date’: dates, ‘Value’: values} df = pd.DataFrame(data) df[‘Date’] = pd.to_datetime(df[‘Date’]) ts = pd.Series(df[‘Value’], index=df[‘Date’]) print(ts) Sin embargo, la salida de impresión se ve así: […]

¿Cómo puedo usar KNN / K-medias para agrupar series de tiempo en un dataframe?

Supongamos un dataframe que contiene 1000 filas. Cada fila representa una serie de tiempo. Luego construí un algoritmo DTW para calcular la distancia entre 2 filas. No sé qué hacer a continuación para completar una tarea de clasificación no supervisada para el dataframe. ¿Cómo etiquetar todas las filas del dataframe?