Articles of pdf

Resaltar texto en un PDF con Python

Estoy trabajando en un motor de búsqueda personalizado para mi corpus de datos PDF. Tengo una capa de transformación que puede volcar contenido de PDF a texto (usando Apache Tika y GROBID). He terminado las capas de búsqueda y la vista que devuelve el listado de resultados de búsqueda. Ahora, me gustaría agregar la función […]

¿Encontrar los nombres de campo de los campos de formulario de entrada en un documento PDF?

¿Encontrar los nombres de campo de los campos de formulario de entrada en un documento PDF? Tengo un formulario PDF editable que estoy tratando de automatizar la entrada de campos de formulario en el uso de python. Para hacer esto, debo conocer los “nombres” de los campos de formulario en los datos FDF para ingresar. […]

El resaltado de syntax de Pandoc en PDF no funciona

pandoc –version rendimientos pandoc 1.12.2.1 Compiled with texmath 0.6.5.2, highlighting-kate 0.5.5.1. Syntax highlighting is supported for the following languages: actionscript, ada, apache, asn1, asp, awk, bash, bibtex, boo, c, changelog, clojure, cmake, coffee, coldfusion, commonlisp, cpp, cs, css, curry, d, diff, djangotemplate, doxygen, doxygenlua, dtd, eiffel, email, erlang, fortran, fsharp, gnuassembler, go, haskell, haxe, html, […]

Matplotlib fill_between () no se guarda correctamente como pdf con el sombreado

Me estoy topando con el siguiente problema cuando bash guardar un gráfico de matplotlib fill_between () como pdf en ipython. import matplotlib.pyplot as plt A =[1,2,3,4,5,6] B = [10,20,30,40,50,60] plt.fill_between(A,A,B,color=”none”, hatch=”\\\\\\\\\\\\”, edgecolor=”grey”, linewidth=0.0,alpha=1) plt.savefig(‘test.pdf’) cuando ejecuto esto, encuentro el siguiente gráfico en el cuaderno de ipython: Sin embargo, cuando abro el archivo guardado, se ve […]

Necesita una forma de determinar si un archivo está hecho para ser escrito

La situación en la que estoy es: hay un proceso que está escribiendo en un archivo, a veces el archivo es bastante grande, por ejemplo, de 400 a 500 MB. Necesito saber cuando se termine de escribir. ¿Cómo puedo determinar esto? Si miro en el directorio, lo veré allí, pero es posible que no se […]

Django pdf pregunta con pisa

Quiero generar una plantilla html a un archivo pdf usando pisa. Creo que tengo todos los paquetes que necesito, pero parece que tengo problemas para hacerlo. Aquí está mi opinión abajo hasta ahora lo que he hecho. EDITAR: Aquí está mi última url, vistas y plantilla. url.py (r’^index/render_pdf/(?P\d+)/$’, render_pdf), vistas.py def fetch_resources(uri, rel): path = […]

El módulo _imaging C no está instalado (en Windows)

Estoy intentando generar algún pdf con django / PIL / Imaging y todo está bien hasta que bash poner algunas imágenes en el pdf: Exception Type: ImportError Exception Value: The _imaging C module is not installed Exception Location: D:\install\python27\lib\site-packages\PIL\Image.py in __getattr__, line 37 Python Executable: D:\install\python27\python.exe Python Version: 2.7.1 Python Path: [‘D:\\~Sasha\\Portman’, ‘D:\\install\\python27\\lib\\site-packages\\setuptools-0.6c11-py2.7.egg’, ‘D:\\install\\python27\\lib\\site-packages\\pisa-3.0.33-py2.7.egg’, ‘D:\\install\\python27\\lib\\site-packages\\html5lib-0.95-py2.7.egg’, […]

Cómo adjuntar páginas PDF usando PyPDF2

¿Alguien tiene experiencia combinando dos páginas de un archivo PDF en una usando Python lib PyPDF2? Cuando bash page1.mergePage(page2) , aparece page2 superpuesto page1. ¿Cómo hacerlo para agregar page2 al final de la página1?

Cambio de estilo de la salida de PDF-Latex a través de la conversión de IPython Notebook

Actualmente con el siguiente comando de mi archivo .ipynb : $ ipython nbconvert –to latex –post PDF Untitled1.ipynb –SphinxTransformer.author=”John Doe” [NbConvertApp] Using existing profile dir: u’/Users/me-macmini/.ipython/profile_default’ [NbConvertApp] Converting notebook Untitled1.ipynb to latex [NbConvertApp] Support files will be in Untitled1_files/ [NbConvertApp] Loaded template article.tplx [NbConvertApp] Writing 12876 bytes to Untitled1.tex [NbConvertApp] Building PDF [NbConvertApp] Running pdflatex […]

leer, resaltar, guardar PDF programáticamente

Me gustaría escribir una pequeña secuencia de comandos (que se ejecutará en un servidor Linux sin cabeza) que lea un PDF, resalte el texto que coincida con cualquier elemento de una serie de cadenas que pase, y luego guarde el PDF modificado. Me imagino que terminaré usando algo así como los enlaces de python a […]