Articles of dataframe

Restablecer la base de la sum acumulada en condición Pandas

Tengo un dataframe como: customer spend hurdle A 20 50 A 31 50 A 20 50 B 50 100 B 51 100 B 30 100 Quiero calcular la columna adicional para Acumulativo que se reiniciará en la base del mismo cliente cuando la sum Acumulativa sea mayor o igual al obstáculo, como se muestra a […]

Usando lambda si condición en diferentes columnas en el dataframe de Pandas

Tengo un dataframe simple: import pandas as pd frame = pd.DataFrame(np.random.randn(4, 3), columns=list(‘abc’)) Así por ejemplo: abc 0 -0.813530 -1.291862 1.330320 1 -1.066475 0.624504 1.690770 2 1.330330 -0.675750 -1.123389 3 0.400109 -1.224936 -1.704173 Y luego quiero crear la columna “d” que contiene el valor de “c” si c es positivo. Otro valor de “b”. Estoy […]

¿Agrupar el dataframe y obtener la sum Y contar?

Tengo un dataframe que se ve así: Company Name Organisation Name Amount 10118 Vifor Pharma UK Ltd Welsh Assoc for Gastro & Endo 2700.00 10119 Vifor Pharma UK Ltd Welsh IBD Specialist Group, 169.00 10120 Vifor Pharma UK Ltd West Midlands AHSN 1200.00 10121 Vifor Pharma UK Ltd Whittington Hospital 63.00 10122 Vifor Pharma UK […]

¿Cómo obtener la primera columna de un dataframe de pandas como una serie?

Lo intenté: x=pandas.DataFrame(…) s = x.take([0], axis=1) Y s obtiene un DataFrame, no una serie.

columnas de dataframe pandas escala con sklearn

Tengo un dataframe de pandas con columnas de tipo mixto, y me gustaría aplicar el min_max_scaler de sklearn a algunas de las columnas. Idealmente, me gustaría hacer estas transformaciones en su lugar, pero aún no he encontrado una manera de hacerlo. He escrito el siguiente código que funciona: import pandas as pd import numpy as […]

¿Cuál es la forma más eficiente de crear un diccionario de dos columnas de Dataframe de pandas?

¿Cuál es la forma más eficiente de organizar el siguiente Dataframe de pandas: datos = Position Letter 1 a 2 b 3 c 4 d 5 e en un diccionario como alphabet[1 : ‘a’, 2 : ‘b’, 3 : ‘c’, 4 : ‘d’, 5 : ‘e’] ?

Uso de Pandas para agregar columnas iterativamente a un dataframe

Tengo un código relativamente simple que estoy luchando para armar. Tengo un CSV que he leído en un dataframe. El CSV es datos de panel (es decir, observaciones únicas de compañía y año para cada fila). Tengo dos columnas en las que quiero realizar una función y luego quiero crear nuevas variables basadas en la […]

AttributeError: el objeto ‘Series’ no tiene atributo ‘notna’

Tengo un archivo csv con varias columnas que contienen cadenas vacías. Al leer el csv en el dataframe de pandas, las cadenas vacías se convierten a NaN . Ahora quiero añadir una tag- cadena a las cadenas que ya están presentes en las columnas, pero solo a las que tienen algunos valores y no a […]

Combinando dos archivos csv usando pandas

¿Alguien puede ver si hay algún error en mi código? Quiero que combine dos archivos csv en un archivo csv. He intentado buscar en Google y todavía no puedo fusionarlo, creará un nuevo archivo pero no mostrará nada dentro. https://stackoverflow.com/a/16266144/7624469 a.csv ID User A1 Fi A2 Ki b.csv ID User A4 Fsdi A5 Kisd La […]

Necesidad de aplicar diferentes fórmulas basadas en el número de fila en el dataframe

Estoy trabajando para encontrar algún tipo de media móvil en un dataframe. La fórmula cambiará según el número de la fila para la que se está calculando. El escenario real es donde necesito calcular la columna Z. Edit-2: Abajo están los datos reales con los que estoy trabajando Date Open High Low Close 0 01-01-2018 […]