Articles of fusionan

Fusionando 2 conjuntos de datos csv con Python en una columna de ID común, uno csv tiene múltiples registros para una ID única

Soy muy nuevo en Python. Cualquier soporte es muy apreciado. Tengo dos archivos csv que estoy intentando fusionar utilizando una columna Student_ID y crear un nuevo archivo csv. csv 1: cada entrada tiene una ID de estudiante única Student_ID Age Course startYear 119 24 Bsc 2014 csv2: tiene varios registros para un ID de estudiante […]

“Anti-merge” en pandas (Python)

¿Cómo puedo distinguir la diferencia entre columnas del mismo nombre en dos marcos de datos? Quiero decir que tengo el dataframe A con una columna llamada X y el dataframe B con la columna llamada X, si hago pd.merge(A, B, on=[‘X’]) , obtendré los valores X comunes de A y B, pero ¿cómo puedo obtener […]

Python Pandas Merge causa desbordamiento de memoria

Soy nuevo en Pandas y estoy tratando de combinar algunos subconjuntos de datos. Estoy dando un caso específico en el que esto sucede, pero la pregunta es general: ¿Cómo / por qué sucede y cómo puedo solucionarlo? La información que cargo es de aproximadamente 85 megas, pero a menudo veo que mi sesión de python […]

Fusionar múltiples pandas de dataframe

Intento combinar varios nuevos marcos de datos en uno principal. Supongamos dataframe principal: key1 key2 0 0.365803 0.259112 1 0.086869 0.589834 2 0.269619 0.183644 3 0.755826 0.045187 4 0.204009 0.669371 Y trato de fusionar los 2 siguientes conjuntos de datos dentro del principal, Nuevos datos1: key1 key2 new feature 0 0.365803 0.259112 info1 Nuevos datos2: […]

Cómo fusionar columnas superpuestas

Tengo dos conjuntos de datos como este import pandas as pd import numpy as np df1 = pd.DataFrame({‘id’: [1, 2,3,4,5], ‘first’: [np.nan,np.nan,1,0,np.nan], ‘second’: [1,np.nan,np.nan,np.nan,0]}) df2 = pd.DataFrame({‘id’: [1, 2,3,4,5, 6], ‘first’: [np.nan,1,np.nan,np.nan,0, 1], ‘third’: [1,0,np.nan,1,1, 0]}) Y quiero conseguir result = pd.merge(df1, df2, left_index=True, right_index=True,on=’id’, how= ‘outer’) result[‘first’]= result[[“first_x”, “first_y”]].sum(axis=1) result.loc[(result[‘first_x’].isnull()) & (result[‘first_y’].isnull()), ‘first’] = […]

¿Por qué la unión interna de Pandas da ValueError: len (left_on) debe ser igual al número de niveles en el índice de “derecho”?

Estoy tratando de unir internamente DataFrame A a DataFrame B y estoy teniendo un error. Aquí está mi statement de unión: merged = DataFrameA.join(DataFrameB, on=[‘Code’,’Date’]) Y aquí está el error: ValueError: len(left_on) must equal the number of levels in the index of “right” No estoy seguro de que el orden de la columna sea importante […]

pandas fusionando marcos de datos en un bucle

Creé un bucle para leer la base de datos sqlite en un dataframe de pandas, y estoy tratando de fusionarlos en base al “Code” … df = pandas.Dataframe() # Creating an empty dataframe for merging at the end items = [“tb1”, “tb2”, “tb3”] for each_item in items: my_value = pandas.read_sql_query(‘select “Code”, “Name”, “Value” from {tb_name} […]

Pivote duplica filas en nuevas columnas Pandas

Tengo un dataframe como este y estoy tratando de remodelar mi dataframe usando Pivot de Pandas de manera que pueda mantener algunos valores de las filas originales mientras hago las filas de duplicados en columnas y les cambio el nombre. A veces tengo filas con 5 duplicados Lo he estado intentando, pero no lo consigo. […]

Mejorar el rendimiento de Pandas Merge

Específicamente no tengo problemas de rendimiento con Pands Merge, como sugieren otras publicaciones, pero tengo una clase en la que hay muchos métodos que se fusionan en los conjuntos de datos. La clase tiene alrededor de 10 grupos por y alrededor de 15 se fusionan. Mientras que groupby es bastante rápido, fuera del tiempo total […]

Fusionar pandas DataFrame en la columna de valores flotantes

Tengo dos marcos de datos que estoy tratando de combinar. Marco de datos A: col1 col2 sub grade 0 1 34.32 xa 1 1 34.32 xb 2 1 34.33 yc 3 2 10.14 zb 4 3 33.01 za Marco de datos B: col1 col2 group ID 0 1 34.32 tz 1 1 54.32 sw 2 […]