Articles of dataframe de los

Actualice el dataframe según la coincidencia en otro dataframe si se cumple la condición

Tengo dos marcos de datos y quiero actualizar el primero. df1 contiene diferentes Mercados (M1, M2, etc.) y algunos Códigos para cada uno de ellos (números o Dummy) import pandas as pd labels = [“Market”,”Code”] values = [[“M1″,”1234”],[“M1″,”Dummy”],[“M1″,”1234”],[“M2″,”Dummy”],[“M1″,”1234”]] df = pd.DataFrame.from_records(values,columns=labels) print(df) Market Code 0 M1 1234 1 M1 Dummy 2 M1 1234 3 M2 […]

Agrupación de pandas: valores como porcentaje de totales agrupados que no funcionan

Utilizando un dataframe y pandas, estoy tratando de averiguar qué es cada valor como un porcentaje del total general para la categoría “agrupar por” Por lo tanto, utilizando la base de datos de consejos, quiero ver, para cada sexo / fumador, cuál es la proporción de la factura total para mujeres fumadoras / todas mujeres […]

Combinar la primera fila con los encabezados de columna en un dataframe

Estoy tratando de limpiar un archivo de Excel para una investigación más a fondo. Problema que tengo, quiero unir la primera y la segunda fila. El código que tengo ahora: xl = pd.ExcelFile(“nanonose.xls”) df = xl.parse(“Sheet1”) df = df.drop(‘Unnamed: 2’, axis=1) ## Tried this line but no luck ##print(df.head().combine_first(df.iloc[[0]])) La salida de esto es: Nanonose […]

pandas: filtrado iterativo de las filas de un DataFrame

Supongamos que tengo un DataFrame como tal, df = pd.DataFrame([[‘x’, 1, 2], [‘x’, 1, 3], [‘y’, 2, 2]], columns=[‘a’, ‘b’, ‘c’]) Para seleccionar todas las filas donde c == 2 y a == ‘x’ , podría hacer algo como: df[(df[‘a’] == ‘x’) & (df[‘c’] == 2)] O podría refinar iterativamente haciendo variables temporales, df1 = […]

¿Cómo insertar n DataFrame en otra fila nth en Pandas?

Por ejemplo, tengo un DataFrame A como sigue A 0 1 2 Ahora quiero insertar cada 2 filas en DataFrame B en A cada 1 fila y B es como sigue B 3 3 4 4 5 5 finalmente quiero A 0 3 3 1 4 4 2 5 5 ¿Cómo puedo conseguir esto?

¿Cómo puedo verificar el tipo de contenido de una columna en los pandas python?

Esta pregunta está relacionada con la forma de verificar el tipo de columna de los pandas python . Se crea un dataframe de pandas vacío. A continuación, se llena de datos. ¿Cómo puedo verificar si alguna de sus columnas contiene tipos complex ? index = [np.array([‘foo’, ‘qux’])] columns = [“A”, “B”] df = pd.DataFrame(index=index, columns=columns) […]

Cómo dividir la cadena de la columna para crear un dataframe de formato largo

Si tengo el dataframe que se muestra a continuación, ¿cómo hago un dataframe de formato largo (es decir, un término por gen por fila)? Supongo que tendré que apply o asignar una split(“,”) a la columna Term , pero ¿qué hago después de eso? import pandas as pd from StringIO import StringIO df = pd.read_table(StringIO(“””Gene […]

Python Pandas copiando la columna de df a otra si los valores son iguales

Tengo dos marcos de datos: DF UNO: ID ABC 1 xyz 1 xyz 2 xyz 2 xyz 2 xyz 3 xyz DF DOS: ID DEF 1 ab c1 2 ab c2 3 ab c3 Quiero tomar la columna E por ejemplo, de DF TWO, y ponerla en DF ONE, si el ID es el mismo, […]

Dataframe jerarquización indexación acelerada

Tengo un dataframe como este +—-+————+————+————+ | | | type | payment | +—-+————+————+————+ | id | res_number | | | +—-+————+————+————+ | a | 1 | toys | 20000 | | | 2 | clothing | 30000 | | | 3 | food | 40000 | | b | 4 | food | 40000 […]

Creación de un nuevo dataframe de pandas a partir de ciertas columnas del dataframe existente

He leído cargar un archivo csv en un dataframe de pandas y quiero hacer algunas manipulaciones simples en el dataframe. No puedo descubrir cómo crear un nuevo dataframe basado en columnas seleccionadas de mi dataframe original. Mi bash: names = [‘A’,’B’,’C’,’D’] dataset = pandas.read_csv(‘file.csv’, names=names) new_dataset = dataset[‘A’,’D’] Me gustaría crear un nuevo dataframe con […]