Articles of fusionan

Fusionar múltiples pandas de dataframe

Intento combinar varios nuevos marcos de datos en uno principal. Supongamos dataframe principal: key1 key2 0 0.365803 0.259112 1 0.086869 0.589834 2 0.269619 0.183644 3 0.755826 0.045187 4 0.204009 0.669371 Y trato de fusionar los 2 siguientes conjuntos de datos dentro del principal, Nuevos datos1: key1 key2 new feature 0 0.365803 0.259112 info1 Nuevos datos2: […]

Cómo fusionar columnas superpuestas

Tengo dos conjuntos de datos como este import pandas as pd import numpy as np df1 = pd.DataFrame({‘id’: [1, 2,3,4,5], ‘first’: [np.nan,np.nan,1,0,np.nan], ‘second’: [1,np.nan,np.nan,np.nan,0]}) df2 = pd.DataFrame({‘id’: [1, 2,3,4,5, 6], ‘first’: [np.nan,1,np.nan,np.nan,0, 1], ‘third’: [1,0,np.nan,1,1, 0]}) Y quiero conseguir result = pd.merge(df1, df2, left_index=True, right_index=True,on=’id’, how= ‘outer’) result[‘first’]= result[[“first_x”, “first_y”]].sum(axis=1) result.loc[(result[‘first_x’].isnull()) & (result[‘first_y’].isnull()), ‘first’] = […]

¿Por qué la unión interna de Pandas da ValueError: len (left_on) debe ser igual al número de niveles en el índice de “derecho”?

Estoy tratando de unir internamente DataFrame A a DataFrame B y estoy teniendo un error. Aquí está mi statement de unión: merged = DataFrameA.join(DataFrameB, on=[‘Code’,’Date’]) Y aquí está el error: ValueError: len(left_on) must equal the number of levels in the index of “right” No estoy seguro de que el orden de la columna sea importante […]

pandas fusionando marcos de datos en un bucle

Creé un bucle para leer la base de datos sqlite en un dataframe de pandas, y estoy tratando de fusionarlos en base al “Code” … df = pandas.Dataframe() # Creating an empty dataframe for merging at the end items = [“tb1”, “tb2”, “tb3”] for each_item in items: my_value = pandas.read_sql_query(‘select “Code”, “Name”, “Value” from {tb_name} […]

Pivote duplica filas en nuevas columnas Pandas

Tengo un dataframe como este y estoy tratando de remodelar mi dataframe usando Pivot de Pandas de manera que pueda mantener algunos valores de las filas originales mientras hago las filas de duplicados en columnas y les cambio el nombre. A veces tengo filas con 5 duplicados Lo he estado intentando, pero no lo consigo. […]

Mejorar el rendimiento de Pandas Merge

Específicamente no tengo problemas de rendimiento con Pands Merge, como sugieren otras publicaciones, pero tengo una clase en la que hay muchos métodos que se fusionan en los conjuntos de datos. La clase tiene alrededor de 10 grupos por y alrededor de 15 se fusionan. Mientras que groupby es bastante rápido, fuera del tiempo total […]

Fusionar pandas DataFrame en la columna de valores flotantes

Tengo dos marcos de datos que estoy tratando de combinar. Marco de datos A: col1 col2 sub grade 0 1 34.32 xa 1 1 34.32 xb 2 1 34.33 yc 3 2 10.14 zb 4 3 33.01 za Marco de datos B: col1 col2 group ID 0 1 34.32 tz 1 1 54.32 sw 2 […]

pandas: fusionar en la columna de colecciones. ¿Buscar objetos (o incluso simplemente dictar) objetos?

Necesito realizar una combinación de dos Pandas DataFrames usando columnas con collections.Counter Objetos de encuentro ( https://docs.python.org/2/library/collections.html#collections.Counter ). La fusión provoca un error extraño. Ver ejemplo de código ejecutable a continuación. import pandas as pd from collections import Counter a = pd.DataFrame([(120000.0, 120000.0, 0.0, 120000.0), (120000.0, 280000.0, 120000.0, 120000.0), (280000.0, 280000.0, 120000.0, 280000.0), (280000.0, 420000.0, […]

Fusionar dos marcos de datos en pandas

Estoy fusionando dos csv (dataframe) usando el siguiente código: import pandas as pd a = pd.read_csv(file1,dtype={‘student_id’: str}) df = pd.read_csv(file2) c=pd.merge(a,df,on=’test_id’,how=’left’) c.to_csv(‘test1.csv’, index=False) Tengo los siguientes archivos CSV archivo1: test_id, student_id 1, 01990 2, 02300 3, 05555 archivo2: test_id, result 1, pass 3, fail después de fusionar test_id, student_id , result 1, 1990, pass 2, […]

Pandas de Python – La columna numérica en el dataframe está en el número del exponente

Recientemente comencé a enfrentar este problema donde en una columna pocos valores están en forma exponencial y el rest son números regulares. Quiero unir dos columnas pero no está dando ningún resultado para la que está en forma de exponente. Me gustaría cómo puedo superar este problema para combinar 2 marcos de datos. ejemplo df1 […]