Articles of Series

Encontrando la intersección entre dos series en Pandas.

Tengo dos series s1 y s2 en pandas / python y quiero calcular la intersección, es decir, donde todos los valores de la serie son comunes. ¿Cómo usaría la función concat para hacer esto? He estado intentando resolverlo pero no he podido (no quiero calcular la intersección en los índices de s1 y S2, sino […]

Cómo convertir un formato de fecha y hora a minutos – pandas

Tengo un dataframe que tiene una columna use_duration (que es la diferencia de otras dos columnas en el formato de fecha y hora). Se ve a continuación: processid, userid, usage_duration 17613,root,0 days 23:41:03.000000000 17641,root,2 days 04:05:26.000000000 13848,acs,0 days 00:00:50.000000000 3912,acs,0 days 06:07:38.000000000 6156,acs,0 days 17:22:43.000000000 Ahora quería convertir lo mismo en minutos. Debería verse como […]

Análisis de series de tiempo – medidas espaciadas de manera desigual – pandas + statsmodels

Tengo dos arrays numpy light_points y time_points y me gustaría usar algunos métodos de análisis de series de tiempo en esos datos. Entonces intenté esto: import statsmodels.api as sm import pandas as pd tdf = pd.DataFrame({‘time’:time_points[:]}) rdf = pd.DataFrame({‘light’:light_points[:]}) rdf.index = pd.DatetimeIndex(freq=’w’,start=0,periods=len(rdf.light)) #rdf.index = pd.DatetimeIndex(tdf[‘time’]) Esto funciona pero no está haciendo lo correcto. De hecho, […]

Pandas: convertir categorías en números

Supongamos que tengo un dataframe con países que va como: cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0 Sé que hay una función pd.get_dummies para convertir los países a ‘codificaciones de un solo uso’. Sin embargo, deseo convertirlos en índices en lugar de que obtenga cc_index = [1,2,1,3] […]

Pandas DataFrame – asigna 1,0 valores basados ​​en otra columna

Tengo un dataframe que contiene nombres de países y su porcentaje de producción de energía. Necesito agregar una nueva columna que asigne un 1 o un 0, según si la producción de energía del país está por encima o por debajo de la mediana de la producción de energía. Algún código ficticio es: import pandas […]

¿Dónde está el valor cuando hago esto en Pandas Series?

tengo el siguiente código. s2 = pd.Series([100,”PYTHON”,”Soochow”,”Qiwsir”], index=[“mark”,”title”,”university”,”name”]) s2.mark = “102” s2.price = “100” Cuando imprimo s2 , puedo ver que el valor de la marca ha cambiado y no hay precio; pero puedo obtener un resultado imprimiendo s2.price . ¿Por qué no se imprime el price ?

Pandas: cambiar el tipo de datos de Series a String

Uso Pandas ‘versión 0.12.0’ con Python 2.7 y tengo un dataframe como el siguiente: df = pd.DataFrame({‘id’ : [123,512,’zhub1′, 12354.3, 129, 753, 295, 610], ‘colour’: [‘black’, ‘white’,’white’,’white’, ‘black’, ‘black’, ‘white’, ‘white’], ‘shape’: [’round’, ‘triangular’, ‘triangular’,’triangular’,’square’, ‘triangular’,’round’,’triangular’] }, columns= [‘id’,’colour’, ‘shape’]) La serie id consta de algunos enteros y cadenas. Su dtype por defecto es object […]

Elimina a NaN de la serie de pandas

¿Hay una manera de eliminar los valores de NaN de una serie de panda? Tengo una serie que puede tener o no algunos valores de NaN, y me gustaría devolver una copia de la serie con todos los NaN eliminados.

Python: Pandas Series – ¿Por qué usar loc?

¿Por qué usamos ‘loc’ para los marcos de datos de pandas? Parece que el siguiente código con o sin usar loc comstack y se ejecuta a una velocidad similar %timeit df_user1 = df.loc[df.user_id==’5561′] 100 loops, best of 3: 11.9 ms per loop o %timeit df_user1_noloc = df[df.user_id==’5561′] 100 loops, best of 3: 12 ms per […]

Obtener el primer elemento de la serie sin saber el índice

Es de esa manera que puedo obtener el primer elemento de Seires sin tener información sobre el índice. Por ejemplo, tenemos una serie. import pandas as pd key=’MCS096′ SUBJECTS=pd.DataFrame({‘ID’:Series([146],index=[145]),\ ‘study’:Series([‘MCS’],index=[145]),\ ‘center’:Series([‘Mag’],index=[145]),\ ‘initials’:Series([‘MCS096’],index=[145]) }) Imprime SUJETOS: print (SUBJECTS[SUBJECTS.initials==key][‘ID’]) 145 146 Name: ID, dtype: int64 ¿Cómo puedo obtener el valor aquí 146 sin usar el índice 145? […]