Remuestreo de datos de minutos

Tengo datos OHLCV basados ​​en minutos para el rango de apertura / primera hora (9: 30-10: 30 AM EST). Estoy buscando volver a muestrear estos datos para poder obtener un valor de 60 minutos y luego calcular el rango.

Cuando llamo a la función dataframe.resample () en los datos, obtengo dos filas y la fila inicial comienza a las 9:00 AM. Estoy buscando obtener solo una fila que comienza a las 9:30 AM.

Nota: los datos iniciales comienzan a las 9:30.

introduzca la descripción de la imagen aquí

Editar: Añadiendo código:

# Extract data for regular trading hours (rth) from the 24 hour data set rth = data.between_time(start_time = '09:30:00', end_time = '16:15:00', include_end = False) # Extract data for extended trading hours (eth) from the 24 hour data set eth = data.between_time(start_time = '16:30:00', end_time = '09:30:00', include_end = False) # Extract data for initial balance (rth) from the 24 hour data set initial_balance = data.between_time(start_time = '09:30:00', end_time = '10:30:00', include_end = False) 

Quedó atascado intentó separar el rango de apertura por fecha individual y obtener el saldo inicial

 conversion = {'Open' : 'first', 'High' : 'max', 'Low' : 'min', 'Close' : 'last', 'Volume' : 'sum'} sample = data.between_time(start_time = '09:30:00', end_time = '10:30:00', include_end = False) sample = sample.ix['2007-05-07'] sample.tail() sample.resample('60Min', how = conversion) 

Por defecto, el remuestreo comienza al principio de la hora. Me gustaría empezar desde donde comienzan los datos.

Puedes usar el argumento base de resample :

 sample.resample('60Min', how=conversion, base=30) 

Desde el docs-link anterior :

base : int , por defecto 0
Para las frecuencias que subdividen uniformemente 1 día, el “origen” de los intervalos agregados.
Por ejemplo, para la frecuencia de ‘5min’, la base puede variar de 0 a 4. El valor predeterminado es 0