Estoy tratando de obtener una gráfica como datos bursátiles en Bokeh como en el enlace http://bokeh.pydata.org/en/latest/docs/gallery/stocks.html
2004-01-05,00:00:00,01:00:00,Mon,20504,792 2004-01-05,01:00:00,02:00:00,Mon,16553,783 2004-01-05,02:00:00,03:00:00,Mon,18944,790 2004-01-05,03:00:00,04:00:00,Mon,17534,750 2004-01-06,00:00:00,01:00:00,Tue,17262,747 2004-01-06,01:00:00,02:00:00,Tue,19072,777 2004-01-06,02:00:00,03:00:00,Tue,18275,785
Quiero usar la columna 2: startTime y 5: count y quiero agrupar por day
columna y sumr los counts
en las horas respectivas.
Código: No da la salida.
import numpy as np import pandas as pd #from bokeh.layouts import gridplot from bokeh.plotting import figure, show, output_file data = pd.read_csv('one_hour.csv') data.column = ['date', 'startTime', 'endTime', 'day', 'count', 'unique'] p1 = figure(x_axis_type='startTime', y_axis_type='count', title="counts per hour") p1.grid.grid_line_alpha=0.3 p1.xaxis.axis_label = 'startTime' p1.yaxis.axis_label = 'count' output_file("count.html", title="time_graph.py") show(gridplot([[p1]], plot_width=400, plot_height=400)) # open a browser
No puedo realizar la lectura de la columna y el trazado, pero no puedo realizar las operaciones de agrupar y sumr en los datos de la columna.
Aprecio la ayuda, gracias!
Suena como esto es lo que necesitas:
data.groupby('startTime')['count'].sum()
Salida:
00:00:00 37766 01:00:00 35625 02:00:00 37219 03:00:00 17534