Articles of urllib2

En un script de Python 2.4, me gustaría ejecutar una llamada al sistema del sistema `ls -l` o` curl` por ejemplo y capturar la salida en una variable. ¿Como hacer esto?

Estoy escribiendo un script de python en un servidor remoto con una versión antigua de python 2.4. En el script, quiero emitir comandos como curl -XPUT ‘http://somerul/_search’ -d file.txt o ls -ltrh y capturar los resultados de estos comandos en una variable. Para el comando curl, la salida será un formato json que analizaré (por […]

¿Los objetos creados por urllib2.urlopen () representan una conexión constante?

En el siguiente código, ¿se mantiene abierta la conexión al servidor remoto hasta que se llama a close() o se vuelve a crear cada vez que se llama a read() ? En el siguiente código, veo que ocurre una nueva comunicación de red cada vez que se llama a read() , en lugar de que […]

Añadir archivo SSL CA usando urllib2

Necesito poder especificar la raíz CA de certificado SSL, pero poder insertar una cookie HTTP con Python 2.7.10 urllib2 library ssl_handler = urllib2.HTTPSHandler() opener = urllib2.build_opener(ssl_handler) opener.addheaders.append((“Cookie”,”foo=blah”)) res = opener.open(https://example.com/some/info) Sé que urllib2 admite cafile param, ¿dónde debería usarlo en mi código?

Seleccione radiobutton con python urllib2

Estoy tratando de seleccionar un radiobutón de este formulario con python urllib2 y enviar el formulario a través de un botón: OPTION OPTION OPTION OPTION OPTION OPTION OPTION OPTION OPTION OPTION OPTION OPTION OPTION OPTION OPTION OPTION OPTION OPTION OPTION OPTION Estoy un poco perdido en esta tarea, y la información que encontré está relacionada […]

urllib2.urlopen sin tampón

Tengo cliente para la interfaz web para el proceso de larga ejecución. Me gustaría que la salida de ese proceso se muestre tal como aparece. Funciona muy bien con urllib.urlopen() , pero no tiene un parámetro de timeout . Por otro lado, con urllib2.urlopen() la salida está en búfer. ¿Hay una manera fácil de deshabilitar […]

¿Cómo publico caracteres no ASCII utilizando httplib cuando el tipo de contenido es “aplicación / xml”?

He implementado un módulo de API Pivotal Tracker en Python 2.7. La API de Pivotal Tracker espera que los datos POST sean un documento XML y “application / xml” sea el tipo de contenido. Mi código usa urlib / httplib para publicar el documento como se muestra: request = urllib2.Request(self.url, xml_request.toxml(‘utf-8’) if xml_request else None, […]

raspar resultados de google con python

Me gustaría obtener el número de resultados estimado de google para una palabra clave. Estoy usando Python3.3 y trato de realizar esta tarea con BeautifulSoup y urllib.request. Este es mi código simple hasta ahora def numResults(): try: page_google = ”’http://www.google.de/#output=search&sclient=psy-ab&q=pokerbonus&oq=pokerbonus&gs_l=hp.3..0i10l2j0i10i30l2.16503.18949.0.20819.10.9.0.1.1.0.413.2110.2-6j1j1.8.0….0…1c.1.19.psy-ab.FEBvxrgi0KU&pbx=1&bav=on.2,or.r_qf.&bvm=bv.48705608,d.Yms&”’ req_google = Request(page_google) req_google.add_header(‘User Agent’, ‘Mozilla/5.0 (Windows NT 6.1; WOW64; rv:15.0) Gecko/20120427 Firefox/15.0a1’) html_google = […]

¿Listar todos los archivos en un directorio en línea con Python?

Hola, solo me preguntaba que estoy intentando crear una aplicación de Python que descarga archivos de Internet, pero en este momento solo descarga un archivo con el nombre que conozco … ¿hay alguna manera de que pueda obtener una lista de archivos en ¿Un directorio en línea y los descargué? Te mostraré mi código para […]

Error 503 al intentar acceder a Google Patents usando python

Anteriormente, hoy pude extraer datos de Google Patents usando el siguiente código import urllib2 url = ‘http://www.google.com/search?tbo=p&q=ininventor:”John-Mudd”&hl=en&tbm=pts&source=lnt&tbs=ptso:us’ req = urllib2.Request(url, headers={‘User-Agent’ : “foobar”}) response = urllib2.urlopen(req) Ahora cuando voy a ejecutarlo obtengo el siguiente error 503. Solo había repasado este código tal vez 30 veces (estoy tratando de obtener todas las patentes de una lista […]

Python obtiene encabezados solo usando urllib2

Tengo que implementar una función para obtener encabezados solamente (sin hacer un GET o POST) usando urllib2. Aquí está mi función: def getheadersonly(url, redirections = True): if not redirections: class MyHTTPRedirectHandler(urllib2.HTTPRedirectHandler): def http_error_302(self, req, fp, code, msg, headers): return urllib2.HTTPRedirectHandler.http_error_302(self, req, fp, code, msg, headers) http_error_301 = http_error_303 = http_error_307 = http_error_302 cookieprocessor = urllib2.HTTPCookieProcessor() […]