Convertir PDF a DOC (Python / Bash)

He visto algunas páginas que permiten al usuario cargar PDF y devuelve un archivo DOC , como PdfToWord

¿Hay alguna forma de convertir un archivo PDF un archivo DOC/DOCX usando Python o cualquier comando de Unix?

Gracias por adelantado

Si tienes instalado LibreOffice

 lowriter --invisible --convert-to doc '/your/file.pdf' 

Si quieres usar Python para esto:

 import os import subprocess for top, dirs, files in os.walk('/my/pdf/folder'): for filename in files: if filename.endswith('.pdf'): abspath = os.path.join(top, filename) subprocess.call('lowriter --invisible --convert-to doc "{}"' .format(abspath), shell=True) 

Esto es difícil porque los PDF están orientados a la presentación y los documentos de Word están orientados al contenido. He probado ambos y puedo recomendar los siguientes proyectos.

  1. PyPDF2
  2. PDFMiner

Sin embargo, definitivamente perderá aspectos de presentación en la conversión.