Articles of encoding de

¿Cómo arreglar la encoding en Python Mechanize?

Aquí está el código de ejemplo: from mechanize import Browser br = Browser() page = br.open(‘http://hunters.tclans.ru/news.php?readmore=2’) br.form = br.forms().next() print br.form El problema es que el servidor devuelve una encoding incorrecta (windows-cp1251). ¿Cómo puedo configurar manualmente la encoding de la página actual en mecanizar? Error: Traceback (most recent call last): File “/tmp/stackoverflow.py”, line 5, in […]

Prevenir errores de encoding en Python

Tengo scripts que imprimen mensajes por el sistema de registro o, a veces, comandos de impresión. En la consola de Windows recibo mensajes de error como Traceback (most recent call last): File “C:\Python32\lib\logging\__init__.py”, line 939, in emit stream.write(msg) File “C:\Python32\lib\encodings\cp850.py”, line 19, in encode return codecs.charmap_encode(input,self.errors,encoding_map)[0] UnicodeEncodeError: ‘charmap’ codec can’t encode character ‘\u2019’ in position […]

La mejor forma de descodificar la encoding Unicoding desconocida en Python 2.5

¿Lo tengo todo bien? De todos modos, estoy analizando un montón de html, pero no siempre sé qué encoding tiene que ser (un sorprendente número de mentira). El siguiente código muestra fácilmente lo que he estado haciendo hasta ahora, pero estoy seguro de que hay una mejor manera. Tus sugerencias serían muy apreciadas. import logging […]

Sklearn: no se pueden usar datos codificados en un clasificador de bosque aleatorio

Soy nuevo en scikit-learn. Estoy tratando de usar preprocesamiento. OneHotEncoder para codificar mi entrenamiento y datos de prueba. Después de la encoding, intenté entrenar un clasificador de bosque aleatorio utilizando esos datos. Pero me sale el siguiente error al encajar. (Aquí la traza del error) 99 model.fit(X_train, y_train) 100 preds = model.predict_proba(X_cv)[:, 1] 101 C:\Python27\lib\site-packages\sklearn\ensemble\forest.pyc […]

El códec ‘ascii’ no puede decodificar el byte (problema al usar django)

Escribí una clase de análisis HTML simple en Python y parece que funciona bien y luego trato de usarlo con django y me sale este error: ‘ascii’ codec can’t decode byte 0xc2 in position 54465: ordinal not in range(128) lo cual es extraño porque agregué esto: # encoding: utf-8 al tope de mi clase. Realmente […]

UnicodeDecodeError durante el uso de cyryllic

Tengo un módulo que contiene solo (es solo un ejemplo. El problema está en un módulo mucho más grande): # -*- coding: utf-8 -*- “януари” Mientras la ejecución me sale: File “C:\Program Files\JetBrains\PyCharm 107.130\helpers\pydev\pydevd.py”, line 1184, in debugger.run(setup[‘file’], None, None) File “C:\Program Files\JetBrains\PyCharm 107.130\helpers\pydev\pydevd.py”, line 947, in run line = stream.readline() #Should not raise an […]

Mejor manera en Python para contar la cadena en otra cadena.

Este código funciona, pero al leer las publicaciones aquí, tengo la impresión de que probablemente no sea una solución muy “Pythonic”. ¿Hay una manera mejor y más eficiente de resolver este problema específico: Lo que hace este código: cuenta las instancias de una cadena encontrada en otra y devuelve el conteo. Provoca un error en […]

Extrae archivos con caracteres no válidos en el nombre de archivo con Python

Utilizo el módulo zipfile de python para extraer un archivo .zip (Tomemos este archivo en http://img.dafont.com/dl/?f=akvaleir por ejemplo) f = zipfile.ZipFile(‘akvaleir.zip’, ‘r’) for fileinfo in f.infolist(): print fileinfo.filename f.extract(fileinfo, ‘.’) Su salida: Akval ir_Normal_v2007.ttf Akval ir, La police – The Font – Fr – En.pdf Ambos archivos son inaccesibles después de la extracción porque hay […]

Problemas con diéresis en la variable de entorno de aplicación de python

No puedo encontrar una manera correcta de obtener la variable de entorno para la ruta de datos de aplicación en Python. El problema es que mi nombre de usuario incluye caracteres especiales (el alemán ae y ue). Hice una solución alternativa con PyQt para Vista y Windows 7, pero no funciona para sistemas XP. ¿Alguien […]

Python csv: UnicodeDecodeError

Estoy leyendo en un archivo con el módulo csv de Python, y tengo otra pregunta de encoding (lo siento, hay muchos aquí). En el archivo CSV, hay signos £. Después de leer la fila e imprimirla, se han convertido en \ xa3. Intentar codificarlos como Unicode produce un UnicodeDecodeError : row = [unicode(x.strip()) for x […]