Articles of Series

Pandas Series de listas para una serie.

Tengo una serie de pandas de listas de cuerdas: 0 [slim, waist, man] 1 [slim, waistline] 2 [santa] Como puedes ver, las listas varían según la longitud. Quiero una forma eficiente de colapsar esto en una serie 0 slim 1 waist 2 man 3 slim 4 waistline 5 santa Sé que puedo dividir las listas […]

Python Reindex Produciendo Nan

Aquí está el código con el que estoy trabajando: import pandas as pd test3 = pd.Series([1,2,3], index = [‘a’,’b’,’c’]) test3 = test3.reindex(index = [‘f’,’g’,’z’]) Así que originalmente todo está bien y test3 tiene un índice de ‘a’ ‘b’ ‘c’ y valores de 1,2,3. Pero cuando llegué a reindexar test3, obtengo que mis valores 1 2 […]

Encontrando la intersección entre dos series en Pandas.

Tengo dos series s1 y s2 en pandas / python y quiero calcular la intersección, es decir, donde todos los valores de la serie son comunes. ¿Cómo usaría la función concat para hacer esto? He estado intentando resolverlo pero no he podido (no quiero calcular la intersección en los índices de s1 y S2, sino […]

Cómo convertir un formato de fecha y hora a minutos – pandas

Tengo un dataframe que tiene una columna use_duration (que es la diferencia de otras dos columnas en el formato de fecha y hora). Se ve a continuación: processid, userid, usage_duration 17613,root,0 days 23:41:03.000000000 17641,root,2 days 04:05:26.000000000 13848,acs,0 days 00:00:50.000000000 3912,acs,0 days 06:07:38.000000000 6156,acs,0 days 17:22:43.000000000 Ahora quería convertir lo mismo en minutos. Debería verse como […]

Análisis de series de tiempo – medidas espaciadas de manera desigual – pandas + statsmodels

Tengo dos arrays numpy light_points y time_points y me gustaría usar algunos métodos de análisis de series de tiempo en esos datos. Entonces intenté esto: import statsmodels.api as sm import pandas as pd tdf = pd.DataFrame({‘time’:time_points[:]}) rdf = pd.DataFrame({‘light’:light_points[:]}) rdf.index = pd.DatetimeIndex(freq=’w’,start=0,periods=len(rdf.light)) #rdf.index = pd.DatetimeIndex(tdf[‘time’]) Esto funciona pero no está haciendo lo correcto. De hecho, […]

Pandas: convertir categorías en números

Supongamos que tengo un dataframe con países que va como: cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0 Sé que hay una función pd.get_dummies para convertir los países a ‘codificaciones de un solo uso’. Sin embargo, deseo convertirlos en índices en lugar de que obtenga cc_index = [1,2,1,3] […]

Pandas DataFrame – asigna 1,0 valores basados ​​en otra columna

Tengo un dataframe que contiene nombres de países y su porcentaje de producción de energía. Necesito agregar una nueva columna que asigne un 1 o un 0, según si la producción de energía del país está por encima o por debajo de la mediana de la producción de energía. Algún código ficticio es: import pandas […]

¿Dónde está el valor cuando hago esto en Pandas Series?

tengo el siguiente código. s2 = pd.Series([100,”PYTHON”,”Soochow”,”Qiwsir”], index=[“mark”,”title”,”university”,”name”]) s2.mark = “102” s2.price = “100” Cuando imprimo s2 , puedo ver que el valor de la marca ha cambiado y no hay precio; pero puedo obtener un resultado imprimiendo s2.price . ¿Por qué no se imprime el price ?

Pandas: cambiar el tipo de datos de Series a String

Uso Pandas ‘versión 0.12.0’ con Python 2.7 y tengo un dataframe como el siguiente: df = pd.DataFrame({‘id’ : [123,512,’zhub1′, 12354.3, 129, 753, 295, 610], ‘colour’: [‘black’, ‘white’,’white’,’white’, ‘black’, ‘black’, ‘white’, ‘white’], ‘shape’: [’round’, ‘triangular’, ‘triangular’,’triangular’,’square’, ‘triangular’,’round’,’triangular’] }, columns= [‘id’,’colour’, ‘shape’]) La serie id consta de algunos enteros y cadenas. Su dtype por defecto es object […]

Elimina a NaN de la serie de pandas

¿Hay una manera de eliminar los valores de NaN de una serie de panda? Tengo una serie que puede tener o no algunos valores de NaN, y me gustaría devolver una copia de la serie con todos los NaN eliminados.