Creé un bucle para leer la base de datos sqlite en un dataframe de pandas, y estoy tratando de fusionarlos en base al “Code” … df = pandas.Dataframe() # Creating an empty dataframe for merging at the end items = [“tb1”, “tb2”, “tb3”] for each_item in items: my_value = pandas.read_sql_query(‘select “Code”, “Name”, “Value” from {tb_name} […]
Tengo un dataframe como este y estoy tratando de remodelar mi dataframe usando Pivot de Pandas de manera que pueda mantener algunos valores de las filas originales mientras hago las filas de duplicados en columnas y les cambio el nombre. A veces tengo filas con 5 duplicados Lo he estado intentando, pero no lo consigo. […]
Específicamente no tengo problemas de rendimiento con Pands Merge, como sugieren otras publicaciones, pero tengo una clase en la que hay muchos métodos que se fusionan en los conjuntos de datos. La clase tiene alrededor de 10 grupos por y alrededor de 15 se fusionan. Mientras que groupby es bastante rápido, fuera del tiempo total […]
Tengo dos marcos de datos que estoy tratando de combinar. Marco de datos A: col1 col2 sub grade 0 1 34.32 xa 1 1 34.32 xb 2 1 34.33 yc 3 2 10.14 zb 4 3 33.01 za Marco de datos B: col1 col2 group ID 0 1 34.32 tz 1 1 54.32 sw 2 […]
Necesito realizar una combinación de dos Pandas DataFrames usando columnas con collections.Counter Objetos de encuentro ( https://docs.python.org/2/library/collections.html#collections.Counter ). La fusión provoca un error extraño. Ver ejemplo de código ejecutable a continuación. import pandas as pd from collections import Counter a = pd.DataFrame([(120000.0, 120000.0, 0.0, 120000.0), (120000.0, 280000.0, 120000.0, 120000.0), (280000.0, 280000.0, 120000.0, 280000.0), (280000.0, 420000.0, […]
Estoy fusionando dos csv (dataframe) usando el siguiente código: import pandas as pd a = pd.read_csv(file1,dtype={‘student_id’: str}) df = pd.read_csv(file2) c=pd.merge(a,df,on=’test_id’,how=’left’) c.to_csv(‘test1.csv’, index=False) Tengo los siguientes archivos CSV archivo1: test_id, student_id 1, 01990 2, 02300 3, 05555 archivo2: test_id, result 1, pass 3, fail después de fusionar test_id, student_id , result 1, 1990, pass 2, […]
Recientemente comencé a enfrentar este problema donde en una columna pocos valores están en forma exponencial y el rest son números regulares. Quiero unir dos columnas pero no está dando ningún resultado para la que está en forma de exponente. Me gustaría cómo puedo superar este problema para combinar 2 marcos de datos. ejemplo df1 […]
Tengo dos marcos de datos diferentes en los que quiero realizar algunas operaciones de SQL. Desafortunadamente, como ocurre con los datos con los que trabajo, la ortografía a menudo es diferente. Vea a continuación un ejemplo de cómo pensé que se vería la syntax donde el ID de usuario pertenece a df1 y el nombre […]
Tengo dos marcos de datos separados que comparten un número de proyecto. En type_df , el número del proyecto es el índice. En time_df , el número del proyecto es una columna. Me gustaría contar el número de filas en type_df que tienen un Project Type de Project Type de 2 . Estoy tratando de […]
Una situación que a veces encuentro es que tengo dos marcos de datos ( df1 , df2 ) y quiero crear un nuevo dataframe ( df3 ) basado en la intersección de varias columnas entre df1 y df2 . Por ejemplo, quiero crear df3 filtrando df1 por las columnas Campaign y Group . import pandas […]