Articles of Python que

No se puede cargar la página ASP.NET utilizando Python urllib2

Estoy intentando hacer una solicitud POST a https://www.paoilandgasreporting.state.pa.us/publicreports/Modules/WellDetails/WellDetails.aspx para raspar los datos. Aquí está mi código actual: from urllib import urlencode import urllib2 # Configuration uri = ‘https://www.paoilandgasreporting.state.pa.us/publicreports/Modules/WellDetails/WellDetails.aspx’ headers = { ‘HTTP_USER_AGENT’: ‘Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.0.13) Gecko/2009073022 Firefox/3.0.13’, ‘HTTP_ACCEPT’: ‘application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5’, ‘Accept-Charset’: ‘ISO-8859-1,utf-8;q=0.7,*;q=0.3’, ‘Accept-Encoding’: ‘gzip,deflate,sdch’, ‘Accept-Language’: ‘en-US,en;q=0.8’, ‘Content-Type’: ‘application/x-www-form-urlencoded’ } formFields = […]

Python: ¿Qué encoding se usa para procesar sys.argv?

¿En qué encoding están los elementos de sys.argv , en Python? ¿Están codificados con la encoding sys.getdefaultencoding() ? sys.getdefaultencoding (): devuelve el nombre de la encoding de cadena predeterminada actual utilizada por la implementación de Unicode. PD : Como se señaló en algunas de las respuestas, sys.stdin.encoding sería una mejor suposición . ¡Me encantaría ver […]

Python: codifica de forma compacta y reversible un entero grande como base64 o base16 con longitud variable o fija

Quiero codificar de forma compacta un entero grande sin signo o con signo que tenga un número arbitrario de bits en una representación base64, base32 o base16 (hexadecimal). La salida se utilizará en última instancia como una cadena que se usará como un nombre de archivo, pero esto no debería ir al punto. Estoy usando […]

UnicodeEncodeError: el codec ‘ascii’ no puede codificar el carácter en la posición 0: ordinal no está en el rango (128)

Estoy trabajando en una secuencia de comandos de Python que usa el carácter de tijera (9986 – ✂) y estoy tratando de portar mi código a Mac, pero estoy teniendo este error. El carácter de tijera aparece bien cuando se ejecuta desde IDLE (Python 3.2.5 – OS X 10.4.11 iBook G4 PPC) y el código […]

Obtener el proxy de la dirección IP utilizando para rastrear

Yo uso Tor para rastrear páginas web. Comencé el servicio de tor y polipo y agregué class ProxyMiddleware(object): # overwrite process request def process_request(self, request, spider): # Set the location of the proxy request.meta[‘proxy’] = “127.0.0.1:8123” Ahora, ¿cómo puedo asegurarme de que scrapy utiliza una dirección IP diferente para las solicitudes?

Error de syntax del carácter no ASCII

Estoy tratando de analizar xml que contiene algunos caracteres no ASCII, el código se ve a continuación from lxml import etree from lxml import objectify content = u’Order date : 05/08/2013 12:24:28′ mail.replace(‘\xa0′,’ ‘) xml = etree.fromstring(mail) pero me muestra un error en la línea ‘contenido = …’ como syntaxError: Non-ASCII character ‘\xc2’ in file […]

marca de tiempo difusa que analiza con Python

¿Existe un módulo de Python para interpretar marcas de tiempo difusas como el comando date en unix: > date -d “2 minutes ago” Tue Aug 11 16:24:05 EST 2009 Lo más cercano que he encontrado hasta ahora es dateutil.parser, que falla para el ejemplo anterior. Gracias

¿Cómo descargar cualquier página web (!) Con el conjunto de caracteres correcto en python?

Problema Al raspar la pantalla de una página web usando python, uno tiene que saber la encoding de caracteres de la página. Si obtienes una encoding de caracteres incorrecta, tu salida se desordenará. La gente usualmente usa alguna técnica rudimentaria para detectar la encoding. Utilizan el conjunto de caracteres del encabezado o el conjunto de […]

Huellas dactilares de coincidencia / reconocimiento / algoritmos / implementaciones

A lo largo de este día, he estado invirtiendo tiempo en algoritmos / implementaciones de comparación / reconocimiento de huellas dactilares en el mundo de la progtwigción. Aunque es un poco vago porque parece que no puedo encontrar nada realmente relacionado. Básicamente estoy buscando dos cosas siguientes: Reconocimiento de huellas dactilares: verifique que la imagen […]

Enmascarar la entrada del usuario en Python con asteriscos

Estoy tratando de enmascarar lo que el usuario escribe en IDLE con asteriscos para que las personas que los rodean no puedan ver lo que están escribiendo / han escrito. Estoy usando información básica en bruto para recostackr lo que escriben. key = raw_input(‘Password :: ‘) Ideal IDLE después de que el usuario escriba la […]