Articles of python docx

Cómo crear un dataframe a partir de una tabla en un archivo de documento de Word (.docx) usando pandas

Tengo un archivo de palabras (.docx) con tabla de datos, estoy intentando crear un dataframe de pandas utilizando esa tabla, he usado el módulo docx y pandas. Pero no pude crear un dataframe. from docx import Document document = Document(‘req.docx’) for table in document.tables: for row in table.rows: for cell in row.cells: print (cell.text) y […]

Celda que abarca varias columnas en la tabla usando python-docx

Estoy tratando de crear una tabla como esta, usando el módulo python-docx . Trabajando desde el código de ejemplo para crear una tabla en example-makedocument.py y leyendo el código en docx.py, pensé que algo similar a esto funcionaría: tbl_rows = [ [‘A1’], [‘B1’, ‘B2’ ], [‘C1’, ‘C2’ ] ] tbl_colw = [ [100], [25, 75], […]

Extraiga la posición de la imagen del archivo .docx usando python-docx

Estoy tratando de obtener el índice de imagen del archivo .docx usando la biblioteca python-docx . Soy capaz de extraer el nombre de la imagen, la altura de la imagen y el ancho. Pero no el índice donde se encuentra en el archivo de palabras. import docx doc = docx.Document(filename) for s in doc.inline_shapes: print […]

Intentando instalar python-docx (error: No se puede encontrar vcvarsall.bat)

Lo he intentado todo y no tengo idea de a dónde ir desde aquí. Cuando llamo al comando pip install python-docx obtengo esto: running build_ext building ‘lxml.etree’ extension error: Unable to find vcvarsall.bat —————————————- Command “c:\users\alex\appdata\local\programs\python\python35-32\python.exe -c “import setuptools, tokenize;__file__=’C:\\Users\\Alex\\AppData\\Local\\Temp\\pip-build-u2i_l872\\lxml\\setup.py’;exec(compile(getattr(tokenize, ‘open’, open)(__file__).read().replace(‘\r\n’, ‘\n’), __file__, ‘exec’))” install –record C:\Users\Alex\AppData\Local\Temp\pip-26nq6ot7-record\install-record.txt –single-version-externally-managed –compile” failed with error code 1 […]

Aceptando todos los cambios en un documento de MS Word usando Python

Quiero poder aceptar todos los cambios de un documento de MS Word (.docx) de Python, preferiblemente usando el módulo python-docx . Sé cómo hacerlo en Perl (ver más abajo para referencia) pero me gustaría tener código nativo en mi progtwig Python para hacer lo mismo. Ide ¿Alguna idea? use strict; use Win32::OLE qw(in with valof […]

Establecer fuente de párrafo en python-docx

Estoy usando python-docx 0.7.6. Parece que no puedo entender cómo configurar la familia de fonts y el tamaño para un párrafo determinado. Hay .style propiedad .style pero style=”Times New Roman” no funciona. ¿Alguien por favor me puede dar un ejemplo? Gracias.

¿Cómo copio el contenido de un documento de Word?

Quiero escribir un progtwig que copia texto de un documento de Word y lo pega en otro. Estoy tratando de hacer eso usando la biblioteca python-docx . Pude hacerlo con el siguiente código, pero no copia las partes en negrita , cursiva , subrayadas ni coloreadas como son y solo su texto: from docx import […]

Cómo identificar saltos de página usando python-docx de docx

Tengo varios archivos .docx que contienen una serie de bloques de texto similares: archivos docx que contienen más de 300 comunicados de prensa de 1 a 2 páginas cada uno, que deben separarse en archivos de texto individuales. La única forma coherente de diferenciar entre artículos es que siempre hay y solo un salto de […]

Texto-Reemplace en docx y guarde el archivo modificado con python-docx

Estoy intentando usar el módulo python-docx para reemplazar una palabra en un archivo y guardar el nuevo archivo con la advertencia de que el nuevo archivo debe tener exactamente el mismo formato que el archivo anterior, pero con la palabra reemplazada. ¿Cómo se supone que debo hacer esto? El módulo docx tiene un savedocx que […]

Generar el documento MS Word en Django.

Actualmente estoy generando los informes en formato pdf. Pero ahora quiero generar los informes en formato ms word o docx. mi archivo api.py def export_pdf(request,id): report = Report.objects.get(id=id) options1 = ReportPropertyOption.objects.filter(report=report,is_active=True) locations = [] out_string = “” map = None for option in options1: option.property = get_property_name(option.property) option.exterior_images = ReportExteriorImages.objects.filter(report = option) option.interior_images = ReportInteriorImages.objects.filter(report […]