Articles of fusionan

pandas fusionando marcos de datos en un bucle

Creé un bucle para leer la base de datos sqlite en un dataframe de pandas, y estoy tratando de fusionarlos en base al “Code” … df = pandas.Dataframe() # Creating an empty dataframe for merging at the end items = [“tb1”, “tb2”, “tb3”] for each_item in items: my_value = pandas.read_sql_query(‘select “Code”, “Name”, “Value” from {tb_name} […]

Pivote duplica filas en nuevas columnas Pandas

Tengo un dataframe como este y estoy tratando de remodelar mi dataframe usando Pivot de Pandas de manera que pueda mantener algunos valores de las filas originales mientras hago las filas de duplicados en columnas y les cambio el nombre. A veces tengo filas con 5 duplicados Lo he estado intentando, pero no lo consigo. […]

Mejorar el rendimiento de Pandas Merge

Específicamente no tengo problemas de rendimiento con Pands Merge, como sugieren otras publicaciones, pero tengo una clase en la que hay muchos métodos que se fusionan en los conjuntos de datos. La clase tiene alrededor de 10 grupos por y alrededor de 15 se fusionan. Mientras que groupby es bastante rápido, fuera del tiempo total […]

Fusionar pandas DataFrame en la columna de valores flotantes

Tengo dos marcos de datos que estoy tratando de combinar. Marco de datos A: col1 col2 sub grade 0 1 34.32 xa 1 1 34.32 xb 2 1 34.33 yc 3 2 10.14 zb 4 3 33.01 za Marco de datos B: col1 col2 group ID 0 1 34.32 tz 1 1 54.32 sw 2 […]

pandas: fusionar en la columna de colecciones. ¿Buscar objetos (o incluso simplemente dictar) objetos?

Necesito realizar una combinación de dos Pandas DataFrames usando columnas con collections.Counter Objetos de encuentro ( https://docs.python.org/2/library/collections.html#collections.Counter ). La fusión provoca un error extraño. Ver ejemplo de código ejecutable a continuación. import pandas as pd from collections import Counter a = pd.DataFrame([(120000.0, 120000.0, 0.0, 120000.0), (120000.0, 280000.0, 120000.0, 120000.0), (280000.0, 280000.0, 120000.0, 280000.0), (280000.0, 420000.0, […]

Fusionar dos marcos de datos en pandas

Estoy fusionando dos csv (dataframe) usando el siguiente código: import pandas as pd a = pd.read_csv(file1,dtype={‘student_id’: str}) df = pd.read_csv(file2) c=pd.merge(a,df,on=’test_id’,how=’left’) c.to_csv(‘test1.csv’, index=False) Tengo los siguientes archivos CSV archivo1: test_id, student_id 1, 01990 2, 02300 3, 05555 archivo2: test_id, result 1, pass 3, fail después de fusionar test_id, student_id , result 1, 1990, pass 2, […]

Pandas de Python – La columna numérica en el dataframe está en el número del exponente

Recientemente comencé a enfrentar este problema donde en una columna pocos valores están en forma exponencial y el rest son números regulares. Quiero unir dos columnas pero no está dando ningún resultado para la que está en forma de exponente. Me gustaría cómo puedo superar este problema para combinar 2 marcos de datos. ejemplo df1 […]

Las pandas se unen en columnas con diferentes nombres

Tengo dos marcos de datos diferentes en los que quiero realizar algunas operaciones de SQL. Desafortunadamente, como ocurre con los datos con los que trabajo, la ortografía a menudo es diferente. Vea a continuación un ejemplo de cómo pensé que se vería la syntax donde el ID de usuario pertenece a df1 y el nombre […]

Usando Combinar en una columna e Índice en Pandas

Tengo dos marcos de datos separados que comparten un número de proyecto. En type_df , el número del proyecto es el índice. En time_df , el número del proyecto es una columna. Me gustaría contar el número de filas en type_df que tienen un Project Type de Project Type de 2 . Estoy tratando de […]

Python Pandas: Combinar o filtrar DataFrame por otro. ¿Hay una mejor manera?

Una situación que a veces encuentro es que tengo dos marcos de datos ( df1 , df2 ) y quiero crear un nuevo dataframe ( df3 ) basado en la intersección de varias columnas entre df1 y df2 . Por ejemplo, quiero crear df3 filtrando df1 por las columnas Campaign y Group . import pandas […]