Articles of Series

Python Pandas: ¿Cambiar el nombre de una serie dentro de un dataframe?

Estoy usando pandas de Python para el análisis de datos y quiero cambiar el nombre de una serie en un dataframe. Esto funciona, pero parece muy ineficiente: AA = pandas.DataFrame( A ) for series in A: AA[A_prefix+series] = A[series] del A[series] ¿Hay alguna manera de cambiar el nombre de la serie en su lugar?

Aplicación de la función lambda a una serie de ventanas giratorias pandas

Tengo una función que toma una matriz y un valor, y devuelve un valor. Me gustaría aplicarlo a mis Series s de forma continua, por lo que la matriz es siempre la ventana móvil. Aquí hay un ejemplo mínimo de lo que he intentado (sin éxito), usando np.random.choice en lugar de mi función real. Encuentro […]

promediando cada cinco minutos los datos como un punto de datos en el dataframe de pandas

Tengo un Dataframe en Pandas como este 1. 2013-10-09 09:00:05 2. 2013-10-09 09:01:00 3. 2013-10-09 09:02:00 4. ………… 5. ………… 6. ………… 7. 2013-10-10 09:15:05 8. 2013-10-10 09:16:00 9. 2013-10-10 09:17:00 Me gustaría reducir el tamaño del Dataframe promediando cada 5 minutos de datos y formando 1 punto de datos para ello. 1. 2013-10-09 09:05:00 […]

los pandas crean una serie con n elementos (secuencial o randbetween)

Estoy tratando de crear una serie de pandas . Una columna de la serie debe contener n números secuenciales. [1, 2, 3, …, n] Una columna debe contener números aleatorios entre k y k+100 . Una columna debe contener una selección aleatoria entre cadenas en una lista. [‘A’, ‘B’, ‘C’, … ‘Z’]

AttributeError: el objeto ‘Serie’ no tiene ningún atributo pandas ‘buscados’

Reproduzco el código del libro python para el análisis de datos en la página 38 yo escribo prop_cumsum = df.sort_index(by=’prop’, ascending=False).prop.cumsum() and prop_cumsum.searchsorted(0.5) Entonces hay un error decir: AttributeError Traceback (most recent call last) in () —-> 1 prop_cumsum.searchsorted(0.5) C:\Users\xxx\AppData\Local\Enthought\Canopy32\User\lib\site-packages\pandas\core\generic.pyc in __getattr__(self, name) 1813 return self[name] 1814 raise AttributeError(“‘%s’ object has no attribute ‘%s'” % […]

Python – Serie de gráficos Extra Excel con win32com

Estoy escribiendo algo de código para una tarea y necesito crear un gráfico de columnas simple en Excel. Esta tarde encontré win32com (una herramienta increíble, por cierto), pero he estado sufriendo por la falta de documentación al respecto o por mi falta de suerte para encontrarla ^^ Estoy jugando con los gráficos, y creo que […]

Valor de acceso por ubicación en series de pandas ordenadas con índice entero

Tengo una serie de pandas con un índice entero que he ordenado (por valor), cómo accedo a los valores por posición en esta serie. Por ejemplo: s_original = pd.Series({0: -0.000213, 1: 0.00031399999999999999, 2: -0.00024899999999999998, 3: -2.6999999999999999e-05, 4: 0.000122}) s_sorted = np.sort(s_original) In [3]: s_original Out[3]: 0 -0.000213 1 0.000314 2 -0.000249 3 -0.000027 4 0.000122 […]

convertir la marca de tiempo a datetime.datetime en pandas.Series

Tengo una serie de pandas donde el índice es una lista de enteros (marca de tiempo), ¿cómo puedo convertirlos a datetime.datetime (con zona horaria) más eficiente que la conversión en bruto por debajo de? pd.Series(data=s.values, index=map(lambda x:datetime.datetime.fromtimestamp(x,tz=utc), s.index))

¿Las subclases del objeto de pandas funcionan de manera diferente a la subclase de otro objeto?

Estoy tratando de crear una subclase de una estructura de datos Pandas para sustituir, en mi código, una subclase de un dict con una subclase de una Series , no entiendo por qué este código de ejemplo no funciona from pandas import Series class Support(Series): def supportMethod1(self): print ‘I am support method 1’ def supportMethod2(self): […]

¿Piso o techo de una serie de pandas en python?

Tengo una serie de pandas. Si quiero obtener el piso o el techo de los elementos, ¿hay un método incorporado o tengo que escribir la función y el uso que corresponda? Pregunto porque los datos son grandes, así que aprecio la eficiencia. Además, esta pregunta no se ha hecho con respecto al paquete de Pandas.