Articles of urllib

NameError: el nombre ‘urllib’ no está definido “

CÓDIGO: import networkx as net from urllib.request import urlopen def read_lj_friends(g, name): # fetch the friend-list from LiveJournal response=urllib.urlopen(‘http://www.livejournal.com/misc/fdata.bml?user=’+name) ERROR: Traceback (most recent call last): File “”, line 1, in NameError: name ‘urllib’ is not defined

¿Cómo leer el contenido de un sitio web?

Soy nuevo en web-crawler usando Python 2.7. 1. Antecedentes Ahora, quiero recostackr datos útiles de AQICN.org, que es un excelente sitio web que ofrece datos de calidad del air en todo el mundo. Quiero usar Python para obtener todos los datos de los sitios de China por hora. Pero estoy atascado en este momento. 2. […]

Python: haciendo clic en un botón

Tengo problemas al hacer clic en este botón que se ve en código HTML como este: y la url que debe generarse se ve así: http://mysite.com/management.php?Category=2&id_user=19&deteletree=6&pushed=Delete+Tree Actualización: intenté esto, pero no funciona: form_data = urllib.urlencode({‘Category’ : ‘2’, ‘suid’ : ’19’, ‘deletetree’ : ‘6’, ‘pushed’ : ‘Delete+Tree’ }) urllib2.urlopen(“management.php”, form_data) Así es como me conecto: cj […]

Imprimir código fuente de la página web en python

Quiero imprimir el código fuente de una página web, pero el comando de impresión en Python solo imprime un espacio vacío y creo que se debe a su gran tamaño. ¿Hay alguna forma de imprimir el código fuente de la página en shell o en la lista en un archivo? He intentado imprimir en un […]

Obtenga los primeros n bytes de la URL

¿Es posible obtener solo un número de bytes de alguna URL y luego cerrar la conexión con urllib / urllib2? ¿O incluso puede ser una parte de n-th byte a k-th? Hay una página en ese lado y no necesito cargar toda la página, solo una parte.

Error de E / S (error de socket): Se rechazó la conexión

Tengo un progtwig que usa urllib para buscar periódicamente una url, y veo errores intermitentes como: Error de E / S (error de socket): [Errno 111] Se rechazó la conexión. Funciona el 90% del tiempo, pero al r10% falla. Si vuelve a intentar la búsqueda inmediatamente después de que falle, tiene éxito. No puedo entender […]

AttributeError: el módulo ‘urllib’ no tiene atributo ‘parse’

python 3.5.2 código 1 import urllib s = urllib.parse.quote(‘”‘) print(s) dio este error: AttributeError: el módulo ‘urllib’ no tiene atributo ‘parse’ código 2 from urllib.parse import quote # import urllib # s = urllib.parse.quote(‘”‘) s = quote(‘”‘) print(s) funciona… código3 from flask import Flask # from urllib.parse import quote # s = quote(‘”‘) import urllib […]

Consulta relevante sobre cómo obtener una clave pública del servidor de claves públicas

import urllib response = urllib.urlopen(‘http://pool.sks-keyservers.net/’) print ‘RESPONSE:’, response print ‘URL :’, response.geturl() headers = response.info() print ‘DATE :’, headers[‘date’] print ‘HEADERS :’ print ‘———‘ print headers data = response.read() print ‘LENGTH :’, len(data) print ‘DATA :’ print ‘———‘ print data Este código me permite ver información y contenidos de algunas páginas web. Lo que en […]

Iniciar sesión en quora usando python

Intenté iniciar sesión en quora usando python. Pero me da el siguiente error. urllib2.HTTPError: HTTP Error 500: Internal Server Error Este es mi código hasta ahora. También trabajo detrás de un proxy. import urllib2 import urllib import re import cookielib class Quora: def __init__(self): ”’Initialising and authentication”’ auth = ‘http://name:password@proxy:port’ cj = cookielib.CookieJar() logindata = […]

Imprimir código de página web con python y urllib

Estoy tratando de usar python y urllib para mirar el código de una determinada página web. Lo he intentado y lo he logrado en otras páginas web utilizando el código: from urllib import * url = code = urlopen(url).read() print code Pero no devuelve nada en absoluto. Supongo que es porque la página tiene muchos […]