Articles of pandas

Dividir una lista dentro de un DataFrame Pandas

Tengo un archivo csv que contiene una serie de columnas. Usando pandas, leí este archivo csv en un dataframe y tengo un índice de fecha y hora y otras cinco o seis columnas. Una de las columnas es una lista de marcas de tiempo (ejemplo a continuación con índice) CreateDate TimeStamps 4/1/11 [Timestamp(‘2012-02-29 00:00:00’), Timestamp(‘2012-03-31 […]

series de pandas filtrando entre valores

Si s es una pandas.Series , sé que puedo hacer esto: b = s < 4 o b = s > 0 pero no puedo hacer b = 0 < s < 4 o b = (0 < s) and (s < 4) ¿Cuál es el método de los pandas idiomáticos para crear una serie […]

Agregando una columna calculada al dataframe pandas

Soy completamente nuevo en Python, pandas y progtwigción en general, y no puedo entender lo siguiente: He accedido a una base de datos con la ayuda de pandas y he puesto los datos de la consulta en un dataframe, df. Una de las columnas contiene cumpleaños, que pueden tener las siguientes formas: – 25/01/1980 (cadena) […]

Agrupar por columna en marcos de datos pandas y matrices promedio

Tengo un dataframe de películas con nombres de películas, sus respectivos géneros y representación vectorial (matrices numpy). ID Year Title Genre Word Vector 1 2003.0 Dinosaur Planet Documentary [-0.55423898, -0.72544044, 0.33189204, -0.1720… 2 2004.0 Isle of Man TT 2004 Review Sports & Fitness [-0.373265237, -1.07549703, -0.469254494, -0.4… 3 1997.0 Character Foreign [-1.57682264, -0.91265768, 2.43038678, -0.2114… […]

Eliminar los valores atípicos en Pandas DataFrame usando Percentiles

Tengo un df DataFrame con 40 columnas y muchos registros. df: User_id | Col1 | Col2 | Col3 | Col4 | Col5 | Col6 | Col7 |…| Col39 Para cada columna, excepto la columna user_id, deseo verificar los valores atípicos y eliminar el registro de agujeros, si aparece un valor atípico. Para la detección de […]

¿Cómo acelerar el filtrado de fila de pandas mediante la concordancia de cadenas?

A menudo necesito filtrar el dataframe de pandas df por df[df[‘col_name’]==’string_value’] , y quiero acelerar la operación de selección de fila, ¿hay una manera rápida de hacerlo? Por ejemplo, In [1]: df = mul_df(3000,2000,3).reset_index() In [2]: timeit df[df[‘STK_ID’]==’A0003′] 1 loops, best of 3: 1.52 s per loop ¿Se pueden acortar los 1.52s? Nota: mul_df() es […]

Groupby en los pandas python: Fast Way

Quiero mejorar el tiempo de un groupby en pandas python. Tengo este codigo df[“Nbcontrats”] = df.groupby([‘Client’, ‘Month’])[‘Contrat’].transform(len) El objective es contar cuántos contratos tiene un cliente en un mes y agregar esta información en una nueva columna ( Nbcontrats ). Client : código de cliente Month : mes de extracción de datos Contrat : número […]

Girar un DataFrame en Pandas para la salida a CSV

Esta es una pregunta simple para la cual las respuestas son sorprendentemente difíciles de encontrar en línea. Aquí está la situación: >>> A [(‘hey’, ‘you’, 4), (‘hey’, ‘not you’, 5), (‘not hey’, ‘you’, 2), (‘not hey’, ‘not you’, 6)] >>> A_p = pandas.DataFrame(A) >>> A_p 0 1 2 0 hey you 4 1 hey not […]

Cómo (re) nombrar un encabezado de columna vacío en un dataframe de pandas sin exportar a csv

Tengo un dataframe pandas df1 con una columna de índice y una serie de valores sin nombre. Quiero asignar un nombre a la serie sin nombre. La única forma de hacerlo que conozco es exportar a df1.csv utilizando: df1.to_csv(“df1.csv”, header = [“Signal”]) y luego volver a importar utilizando: pd.read_csv(“df1.csv”, sep=”,”) Sin embargo, esto cuesta tiempo […]

convertir datos de stock diarios a semanales a través de pandas en Python

Tengo un DataFrame almacena datos basados ​​en el día, que son los siguientes: Date Open High Low Close Volume 2010-01-04 38.660000 39.299999 38.509998 39.279999 1293400 2010-01-05 39.389999 39.520000 39.029999 39.430000 1261400 2010-01-06 39.549999 40.700001 39.020000 40.250000 1879800 2010-01-07 40.090000 40.349998 39.910000 40.090000 836400 2010-01-08 40.139999 40.310001 39.720001 40.290001 654600 2010-01-11 40.209999 40.520000 40.040001 40.290001 963600 […]