Articles of Python que

Proxies rotativos para raspado web

Tengo un rastreador web de Python y quiero distribuir las solicitudes de descarga entre muchos servidores proxy diferentes, probablemente ejecutando squid (aunque estoy abierto a alternativas). Por ejemplo, podría funcionar en forma de round-robin, donde request1 va a proxy1, request2 a proxy2, y eventualmente se recupera. ¿Alguna idea de cómo configurar esto? Para hacerlo más […]

Python Base64 codifica a cadena

Quiero codificar algunos datos como Base64, y luego conciliar los datos codificados en una cadena. Cuando lo hago: four=base64.urlsafe_b64encode(bytes(MAIL, “utf-8″)) print (four) el resultado será: b’YWxleEBhbGV4LmFsZXg=’ Quiero eliminar la b ” de cuatro. De modo que solo se muestra YWxleEBhbGV4LmFsZXg =. ¿Cómo hago para obtener solo la cadena YWxleEBhbGV4LmFsZXg = sin el tipo de byte?

¿Cómo representar el contenido de una etiqueta en Unicode en BeautifulSoup?

Esta es una sopa de una página de detalles de WordPress: content = soup.body.find(‘div’, id=re.compile(‘post’)) title = content.h2.extract() item[‘title’] = unicode(title.string) item[‘content’] = u”.join(map(unicode, content.contents)) Quiero omitir la etiqueta div adjunta al asignar el item[‘content’] . ¿Hay alguna forma de representar todas las tags secundarias de una etiqueta en Unicode? Algo como: item[‘content’] = content.contents.__unicode__() […]

¿Cómo solucionar el problema de “Los mensajes de error de Windows no están correctamente codificados”?

Es un problema cuando Python generó un error de Windows, la encoding del mensaje de la excepción es siempre codificada nativamente. Por ejemplo: import os os.remove(‘does_not_exist.file’) Bueno, aquí tenemos una excepción: Traceback (most recent call last): File “”, line 1, in WindowsError: [Error 2] 系統找不到指定的檔案。: ‘does_not_exist.file’ Como el idioma de mi Windows7 es el chino […]

Usando Stanford Tregex en Python

Soy un novato en PNL y Python. Estoy tratando de extraer un subconjunto de frases nominales de los árboles analizados desde StanfordCoreNLP utilizando la herramienta Tregex y la biblioteca de subproceso Python. En particular, estoy tratando de encontrar y extraer frases nominales que coincidan con el siguiente patrón: ‘(NP [$ VP]> S) | (NP [$ […]

Análisis de un archivo de idioma CS: GO con encoding en Python

Este tema está relacionado con el archivo de script Parsing a CS: GO en el tema de Python , pero hay otro problema. Estoy trabajando en un contenido de CS: GO y ahora estoy tratando de hacer que una herramienta de Python importe todos los datos de la carpeta / scripts / a los diccionarios […]

encontrar el mejor subconjunto de la lista de cadenas para que coincida con una cadena dada

Tengo una cuerda s = “mouse” y una lista de cuerdas sub_strings = [“m”, “o”, “se”, “e”] Necesito averiguar cuál es el mejor y más corto subconjunto coincidente de subcadenas de la lista que coincide con s. ¿Cuál es la mejor manera de hacer esto? El resultado ideal sería [“m”, “o”, “se”] ya que juntos […]

.format () devuelve ValueError cuando usa {0: g} para eliminar los ceros finales

Estoy tratando de generar una cadena que involucra una flotación ocasional con ceros al final. Este es un MWE de la cadena de texto y mi bash de eliminarlos con {0:g} : xn, cod = ‘r’, ‘abc’ ccl = [546.3500, 6785.35416] ect = [12.350, 13.643241] text = ‘${}_{{t}} = {0:g} \pm {0:g}\;{}$’.format(xn, ccl[0], ect[0], cod) […]

Cómo usar la instrucción IF ALL en Python

Tengo una función llamada verificador (números) que tiene un argumento que luego recibirá una lista. Lo que quiero hacer con esa lista es verificar si cada elemento es mayor o igual al anterior. Ejemplo: Tengo una lista [1, 1, 2, 2, 3] y tengo que verificar si cumple con la condición. Como lo hace, la […]

El analizador lento generado por ANTLR4 en Python, pero rápido en Java

Estoy tratando de convertir la gramática ANTLR3 a una gramática ANTLR4 , para usarla con el tiempo de ejecución antlr4-python2. Esta gramática es un analizador difuso C / C ++. Después de convertirlo (básicamente eliminando operadores de árbol y predicados semánticos / sintácticos), generé los archivos de Python2 usando: java -jar antlr4.5-complete.jar -Dlanguage=Python2 CPPGrammar.g4 Y […]