Problema al analizar una página xhtml usando Python

Hola, estoy intentando analizar una página en xhtml con python pero recibo este error:

**xml.parsers.expat.ExpatError: unbound prefix: line 6, column 0** [Fri Mar 25 09:58:21 2011] [error] [client 127.0.0.1] mod_wsgi (pid=9156): Exception occurred processing WSGI script '/home/hidura/webapps/karinapp/Suite/Gate.py'. [Fri Mar 25 09:58:21 2011] [error] [client 127.0.0.1] Traceback (most recent call last): [Fri Mar 25 09:58:21 2011] [error] [client 127.0.0.1] File "/home/hidura/webapps/karinapp/Suite/Gate.py", line 32, in application [Fri Mar 25 09:58:21 2011] [error] [client 127.0.0.1] response = assistant(buildReq.extrctEnv(environ, location))#Here the assistant takes the parameters and begins the work [Fri Mar 25 09:58:21 2011] [error] [client 127.0.0.1] File "/home/hidura/webapps/karinapp/Suite/wsgi/Utilities/Assistant/Assistant.py", line 114, in __init__ [Fri Mar 25 09:58:21 2011] [error] [client 127.0.0.1] self.websearch()#Finding the web. [Fri Mar 25 09:58:21 2011] [error] [client 127.0.0.1] File "/home/hidura/webapps/karinapp/Suite/wsgi/Utilities/Assistant/Assistant.py", line 364, in websearch [Fri Mar 25 09:58:21 2011] [error] [client 127.0.0.1] websource = self.manage.string2parse(result[0][1])#Transforming the web page into a tree. [Fri Mar 25 09:58:21 2011] [error] [client 127.0.0.1] File "/home/hidura/webapps/karinapp/Suite/wsgi/Writer/tagsmanip.py", line 56, in string2parse [Fri Mar 25 09:58:21 2011] [error] [client 127.0.0.1] self.doc = parseString(newData) [Fri Mar 25 09:58:21 2011] [error] [client 127.0.0.1] File "/usr/local/lib/python3.1/xml/dom/minidom.py", line 1937, in parseString [Fri Mar 25 09:58:21 2011] [error] [client 127.0.0.1] return expatbuilder.parseString(string) [Fri Mar 25 09:58:21 2011] [error] [client 127.0.0.1] File "/usr/local/lib/python3.1/xml/dom/expatbuilder.py", line 940, in parseString [Fri Mar 25 09:58:21 2011] [error] [client 127.0.0.1] return builder.parseString(string) [Fri Mar 25 09:58:21 2011] [error] [client 127.0.0.1] File "/usr/local/lib/python3.1/xml/dom/expatbuilder.py", line 223, in parseString [Fri Mar 25 09:58:21 2011] [error] [client 127.0.0.1] parser.Parse(string, True) [Fri Mar 25 09:58:21 2011] [error] [client 127.0.0.1] xml.parsers.expat.ExpatError: unbound prefix: line 6, column 0 

Este es el código de la página:

 KarinApp(Karina application web maker)window.onload = function(){postLoad(); } function __init__(){main();}
<!--empty-->

¡Gracias por adelantado!

El problema es que expat es usar fb como el prefijo de espacio de nombres, pero esa etiqueta es FB:LOGIN-BUTTON . Expat ve FB como sin consolidar. La especificación XHTML señala que todos los elementos y atributos HTML deben estar en minúsculas ya que XML distingue entre mayúsculas y minúsculas.

Probé su documento utilizando el analizador XML lxml y convirtió automáticamente los prefijos a minúsculas. Tal vez usted puede cambiar a un analizador diferente:

 import lxml.etree data = open('fb.xhtml', 'rb').read() tree = lxml.etree.fromstring(data) ns_map = {'fb': 'http://www.facebook.com/2008/fbml'} print tree.xpath('.//fb:LOGIN-BUTTON', namespaces=ns_map) 

Salida:

 [] 

Creo que el problema es que http://www.facebook.com/2008/fbml es una página que no se encuentra