Articles of pdf

¿Cómo acceder a las líneas en una página pdf programáticamente y darles diferentes colores en python?

Quiero acceder directamente a una página pdf y acceder a líneas individuales. Quiero cambiar el color de cada línea de manera diferente. Estoy usando linux y quiero progtwigr en python. ¿Podría alguien, por favor, decirme la biblioteca y el código de muestra para hacerlo? Muchas gracias.

Imagen PDF en documento PDF usando ReportLab (Python)

Guardé algunas plots de matplotlib en un formato PDF porque parece ofrecer una mejor calidad. ¿Cómo incluyo la imagen PDF en un documento PDF usando ReportLab? El método de conveniencia Imagen (ruta de archivo) no funciona para este formato. Gracias.

¿Cómo puedo continuar un contenido a la página siguiente en Reportlabs – Python?

Estoy haciendo una tabla, donde la tabla puede ser pequeña o grande, dependiendo de los datos que se reciban. Mientras estaba proporcionando un gran conjunto de datos, noté que aunque la tabla se está haciendo pero mi contenido no está allí, ya que ocupa solo 1 página para eso. Entonces, mi pregunta es ¿Cómo puedo […]

Como cambiar de pagina de pdf ya abierto en python

Tengo el enlace pdf estándar creado para abrir un archivo a una página específica, pero si el archivo ya está abierto, la página no cambia, la secuencia de comandos simplemente abre el archivo ya abierto, ¿cómo puedo navegar dentro de un archivo abierto? ¿O como solución alternativa, observe que el archivo está abierto, ciérrelo y […]

PDF con QWebView: falta actualizar / repintar después de cargar

Uso el QWebView (python 3.3 + pyside 1.1.2 + Qt 4.8) como FileViewer. Imagen, texto, HTML, … todo bien, pero el PDF tiene un problema de visualización. He probado dos formas posibles. Visor de pdf interno: después de usar webview.load(file) se carga, pero la pantalla está en blanco, después de cargar otro archivo, todo funciona […]

La extracción de texto de pdf con pdfminer da múltiples copias.

Estoy tratando de extraer texto de un archivo PDF utilizando PDFMiner (el código que se encuentra en ¿ Extraer texto de un archivo PDF utilizando PDFMiner en python? ). No cambié el código excepto la ruta / a / pdf. Sorprendentemente, el código devuelve varias copias del mismo documento. Obtuve el mismo resultado con otros […]

Comparte la imagen de mpldatacursor con otros

Estoy usando el ejemplo en Cómo mostrar tags de datos cuando pasas el mouse sobre los datos para hacer una imagen donde aparecen los datos cuando pasas el mouse sobre los puntos. Esto funciona realmente bien, pero ¿hay alguna forma de guardarlo para que pueda enviar la imagen a otros? No estoy seguro de qué […]

Recortar una página en Python usando pyPdf

Estoy escribiendo un script para extraer algunos datos de un PDF. El PDF en sí es bastante complicado, ya que tiene varias columnas. Así que me di cuenta de que debería recortar cada columna y concatenar las columnas para crear un nuevo PDF que sea mejor para analizar usando pyPdf. Este es mi código: for […]

Tabula extraer tablas por coordenadas de área

Se nos da la opción de extraer tablas de un documento PDF especificando sus coordenadas. Para los usuarios de Windows, para obtener las coordenadas, debe cargar el archivo PDF en la página web de Tabula y exportar el script que contiene las coordenadas y luego ingresar las coordenadas en su código. Para usuarios de Mac, […]

¿Por qué mi código no divide correctamente todas las páginas en un PDF escaneado?

Actualización: Gracias a stardt cuyo script funciona! El pdf es una página de otra. Probé la secuencia de comandos en la otra, y también escupí correctamente cada página del pdf, pero el orden de los números de página a veces es correcto y otras es incorrecto. Por ejemplo, en la página 25-28 del archivo pdf, […]