BeautifulSoup no puede analizar el estado de la vista larga

Intento usar BeautifulSoup4 para analizar el html recuperado de http://exporter.nih.gov/ExPORTER_Catalog.aspx?index=0 Si imprimo la sopa resultante, termina así:

kZXI9IjAi"/> 

Buscando los últimos caracteres 9IjaI en el html en bruto, encontré que está en medio de un gran estado de vista. BeautifulSoup parece tener un problema con esto. ¿Alguna pista sobre lo que podría estar haciendo mal o cómo analizar esa página?

BeautifulSoup usa un analizador de HTML conectable para construir la “sopa”; debe probar diferentes analizadores, ya que cada uno tratará una página rota de manera diferente.

Sin embargo, no tuve problemas para analizar esa página con ninguno de los analizadores:

 >>> from beautifulsoup4 import BeautifulSoup >>> import requests >>> r = requests.get('http://exporter.nih.gov/ExPORTER_Catalog.aspx?index=0') >>> for parser in ('html.parser', 'lxml', 'html5lib'): ... print repr(str(BeautifulSoup(r.text, parser))[-60:]) ... ';\r\npageTracker._trackPageview();\r\n\n\n\n' '();\r\npageTracker._trackPageview();\r\n\n' '();\npageTracker._trackPageview();\n\n\n\n' 

Asegúrese de tener el último paquete BeautifulSoup4 instalado, he visto problemas constantes en la serie 4.1 resueltos en 4.2.