Articles of ms word

PyInstaller y el módulo python-docx no funcionan juntos

Estoy tratando de hacer un ejecutable de mi progtwig para dar a mi equipo FTC. Todo funciona, pero cuando bash usar mi script que incluye python-docx en él pero no lo completa todo. Funciona cuando lo ejecuto en PyCharm y desde la terminal. Aquí está el código. Tengo python3. from tkinter import * import sys,math,random,datetime,os,time […]

Extracción de elementos de formato de documento de MS Word junto con información de texto sin formato

En esta publicación, @mikemaccana describe cómo usar python-docx para extraer datos de texto sin procesar de un documento de MS Word desde python. Me gustaría ir un paso más allá. En lugar de extraer simplemente la información de texto sin procesar, también puedo usar este módulo para recostackr información sobre la fuente (por ejemplo, negrita […]

Extracción de tablas de un documento de DOCX Word en python

Estoy tratando de extraer un contenido de tablas en el documento DOCX Word y, por supuesto, soy nuevo en xml / xpath. from docx import * document = opendocx(‘someFile.docx’) tableList = document.xpath(‘/w:tbl’) Esto activa el error “XPathEvalError: prefijo de espacio de nombres no definido”. Estoy seguro de que es solo el primero que se espera […]

Control remoto o script Open Office para editar documentos de Word desde Python

Quiero (preferiblemente en Windows) iniciar Open Office en un documento en particular, buscar una cadena fija y reemplazarla con otra cadena seleccionada por mi progtwig. ¿Cómo hago eso, desde un progtwig externo de Python? OLE-algo? ¿La solución nativa de scripts de Python? (El documento está en el formato de Word 97-2003, pero probablemente no sea […]

Palabra y Python – Crear tabla de contenidos

Estoy usando la extensión pywin32.client para python y estoy creando un documento de Word. He intentado una buena cantidad de métodos para generar un ToC pero todos han fallado. Creo que lo que quiero hacer es llamar al objeto ActiveDocument y crear uno con algo como este ejemplo de la página de MSDN: Set myRange […]

Convertir documento de Word a PDF – Python

Necesito rellenar un documento y luego intentar convertirlo en un PDF. ¿Alguna idea de cómo puedo hacer esto?

¿Cómo convertir un documento de Word en HTML muy simple en Python?

De vez en cuando recibo un documento de Word que debo mostrar como una página web. Actualmente estoy usando las páginas planas de Django para lograr esto al tomar el contenido html generado por MS Word. El html generado es bastante desordenado. ¿Existe una mejor manera de generar html muy simple para resolver este problema […]

Carácter no deseado en la celda de Excel en Python

Estoy enfrentando un problema con la configuración de un valor de Excel Cell. Obtengo datos de una celda de la tabla en el documento de MS-Word (dcx) e imprimo en la consola de salida. El problema es que los datos de la celda son solo una palabra, “Hora”, sin ningún otro carácter imprimible al principio […]

¿Cómo puedo usar el corrector ortográfico / gtwigtical de Microsoft Word programáticamente?

Quiero procesar un número mediano o grande de fragmentos de texto utilizando un corrector ortográfico / gtwigtical para obtener una aproximación y clasificación aproximada de su “calidad”. La velocidad tampoco es realmente una preocupación, por lo que creo que la forma más fácil es escribir un script que pase los fragmentos a Microsoft Word (2007) […]

Cómo usar python-docx para reemplazar texto en un documento de Word y guardar

El módulo oodocx mencionado en la misma página remite al usuario a una carpeta / examples que no parece estar allí. He leído la documentación de python-docx 0.7.2, además de todo lo que pude encontrar en Stackoverflow sobre el tema, así que, por favor, crea que he hecho mi “tarea”. Python es el único idioma […]