¿Existe una biblioteca para eliminar contraseñas de archivos PDF mediante progtwigción?

¿Existe una biblioteca que elimine las contraseñas de “propietario” de los documentos PDF para que el texto se pueda extraer de ellos mediante progtwigción? Algo así como la herramienta de recuperación de contraseña de PDF Technologies , pero que se puede llamar desde la línea de comandos o desde Python. Una interfaz gráfica de usuario no es realmente útil para mí, ya que la cantidad de documentos es muy grande.

Por favor, no hay comentarios sobre la legalidad del proceso. Los PDF en cuestión son de su propiedad, y el texto debe extraerse para formar nubes de palabras clave para el conjunto de documentos.

No sé acerca de las bibliotecas de Python, pero para la eliminación por lotes de contraseñas de documentos PDF, mis colegas han tenido una buena experiencia con PwdRemover (no gratis).

Aquí hay otras dos herramientas (de código abierto) para el procesamiento de la línea de comandos:

QPDF: un sistema de transformación de PDF que preserva el contenido :

qpdf --password=PASSWORD --decrypt SECURED.pdf UNSECURED.pdf 

pdftk – el kit de herramientas pdf :

 pdftk SECURED.pdf input_pw PASSWORD output UNSECURED.pdf 

Si ha olvidado la contraseña o el empleado que cifró los documentos desde que dejó la compañía, puede usar PDFCrack para recuperar la (s) contraseña (s).