Obtener los contenidos de la página web con Python?

Estoy usando Python 3.1, si eso ayuda.

De todos modos, estoy tratando de obtener los contenidos de esta página web. Busqué en Google un poco y probé cosas diferentes, pero no funcionaron. Supongo que esto debería ser una tarea fácil, pero … no puedo entenderlo. : /.

Resultados de urllib, urllib2:

>>> import urllib2 Traceback (most recent call last): File "", line 1, in  import urllib2 ImportError: No module named urllib2 >>> import urllib >>> urllib.urlopen("http://www.python.org") Traceback (most recent call last): File "", line 1, in  urllib.urlopen("http://www.python.org") AttributeError: 'module' object has no attribute 'urlopen' >>> 

Solución de Python 3

Gracias, Jason. :RE.

 import urllib.request page = urllib.request.urlopen('http://services.runescape.com/m=hiscore/ranking?table=0&category_type=0&time_filter=0&date=1519066080774&user=zezima') print(page.read()) 

Debido a que está usando Python 3.1, necesita usar las nuevas API de Python 3.1 .

Tratar:

 urllib.request.urlopen('http://www.python.org/') 

Alternativamente, parece que estás trabajando con ejemplos de Python 2. Escríbalo en Python 2, luego use la herramienta 2to3 para convertirlo. En Windows, 2to3.py está en \ python31 \ tools \ scripts. ¿Alguien más puede indicar dónde encontrar 2to3.py en otras plataformas?

Editar

En estos días, escribo código compatible con Python 2 y 3 utilizando seis.

 from six.moves import urllib urllib.request.urlopen('http://www.python.org') 

Suponiendo que tiene seis instalados, que se ejecutan tanto en Python 2 como en Python 3.

La mejor manera de hacer esto en estos días es usar la biblioteca de ‘solicitudes’:

 import requests response = requests.get('http://hiscore.runescape.com/index_lite.ws?player=zezima') print (response.status_code) print (response.content) 

Si me preguntas. prueba este

 import urllib2 resp = urllib2.urlopen('http://hiscore.runescape.com/index_lite.ws?player=zezima') 

y leer la forma normal es decir

 page = resp.read() 

Buena suerte aunque

Mechanize es un gran paquete para “actuar como un navegador”, si desea manejar el estado de las cookies, etc.

http://wwwsearch.sourceforge.net/mechanize/

Puedes usar urlib2 y analizar el HTML tú mismo.

O prueba Beautiful Soup para que te haga un análisis.

Una solución con trabajos con Python 2.X y Python 3.X:

 try: # For Python 3.0 and later from urllib.request import urlopen except ImportError: # Fall back to Python 2's urllib2 from urllib2 import urlopen url = 'http://hiscore.runescape.com/index_lite.ws?player=zezima' response = urlopen(url) data = str(response.read()) 

Supongamos que desea obtener el contenido de una página web. El siguiente código lo hace:

 # -*- coding: utf-8 -*- # python # example of getting a web page from urllib import urlopen print urlopen("http://xahlee.info/python/python_index.html").read()