¿Hay alguna forma de obtener de manera eficiente el número de páginas de un documento de Word (.doc, .docx) con Python?
¿Y para un archivo .odt?
Quiero usar esto para una aplicación web basada en Web2py en Linux.
Gracias !
Puedes leer el valor
CountValue
desde docProps / app.xml en el paquete docx o
formar meta.xml en el paquete odt.
Si estos valores no existen (son opcionales), tiene que hacer un cálculo de todo el documento, de hecho realizar la representación, que es mucho más difícil
Solo para quienes buscan esta entrada de blog ….
from win32com.client import Dispatch #open Word word = Dispatch('Word.Application') word.Visible = False word = word.Documents.Open(doc_path) #get number of sheets word.Repaginate() num_of_sheets = word.ComputeStatistics(2)