Paquete dfply de Python – Uniones

Viniendo de R e intentando simular el paquete dplyr con dfply en Python. Necesito ayuda.

Tengo dos preguntas aquí y por favor ayuda.

  1. ¿Cómo puedo unir dos conjuntos de datos si esas columnas tienen nombres diferentes?
  2. ¿Hay alguna forma de unirme más que a la columna? Según la documentación, puedo unirme solo por una columna.

https://github.com/kieferk/dfply#joining

Me gusta el paquete dfply pero carece de funcionalidad crítica. Gracias por tu ayuda. O ayúdame con otros paquetes en Python como R dplyr

El paquete dfply se basa en el gran paquete de pandas en Python. Su documentación sirve principalmente para guiarlo hacia sus funcionalidades subyacentes. Si va a su repository github y encuentra el archivo join.py, puede ver que la implementación subyacente de varias combinaciones depende de la función df.merge de pandas.

así que para responder a tus preguntas (esperemos que no sea demasiado tarde):

  1. ¿Cómo puedo unir dos conjuntos de datos si esas columnas tienen nombres diferentes?

    df>> inner_join(other, by=('A_c1','B_c1')) 
  2. ¿Hay alguna forma de unirme más que a la columna? Según la documentación, puedo unirme solo por una columna.

     df>> inner_join(other, by=[('A_c1','B_c1'),('A_c2','B_c2')]) 

Una cosa que debo agregar es que, al momento de escribir este artículo, octubre de 2018, debe instalar la versión de desarrollo del paquete, que tiene la funcionalidad de unión de varias columnas agregada.