Articles of codificación

Conversión de utf-16 a utf-8 en Python 3

Estoy progtwigndo en Python 3 y tengo un pequeño problema que no puedo encontrar ninguna referencia a él en la red. Por lo que entiendo, la cadena predeterminada es utf-16, pero debo trabajar con utf-8, no puedo encontrar el comando que se convertirá del predeterminado a utf-8. Apreciaría mucho tu ayuda.

¿Buscando contenidos de archivos de texto con varias codificaciones con Python?

Estoy teniendo problemas con la encoding de texto variable al abrir archivos de texto para encontrar una coincidencia en el contenido de los archivos. Estoy escribiendo un script para escanear el sistema de archivos en busca de archivos de registro con contenidos específicos para copiarlos en un archivo. Los nombres a menudo se cambian, por […]

¿Cómo puedo resolver UnicodeDecodeError en Django?

Estoy recibiendo este error en Django: UnicodeDecodeError at /category/list/ ‘utf8’ codec can’t decode byte 0xf5 in position 7: invalid start byte Request Method: GET Request URL: … Django Version: 1.3.1 Exception Type: UnicodeDecodeError Exception Value: ‘utf8’ codec can’t decode byte 0xf5 in position 7: invalid start byte Exception Location: /Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/json/encoder.py in iterencode, line 264 … […]

manejar cadenas de código no ascii en python

Es realmente confuso manejar el código no-ascii en python. ¿Alguien puede explicar? Estoy intentando leer un archivo de texto plano y reemplazar todos los caracteres no alfabéticos con espacios. Tengo una lista de personajes: ignorelist = (‘!’, ‘-‘, ‘_’, ‘(‘, ‘)’, ‘,’, ‘.’, ‘:’, ‘;’, ‘”‘, ‘\”, ‘?’, ‘#’, ‘@’, ‘$’, ‘^’, ‘&’, ‘*’, ‘+’, […]

¿Cómo resolver este extraño problema de encoding de Python?

Estoy realizando algunas tareas de PNL en un corpus de cadenas de la web, y como usted espera, hay problemas de encoding. Aquí hay algunos ejemplos: they don’t serve sushi : the apostrophe in don’t is not standard ‘ but \xe2\x80\x99 Delicious food – Wow : the hyphen before wow is \xe2\x80\x93 Así que ahora, […]

problema de encoding en Python cuando urlopen () una página gbk

Mi código aquí: # coding:utf-8 if __name__ == ‘__main__’: from urllib2 import urlopen url = ‘http://iccna.blog.sohu.com/164572951.html’ data = urlopen(url).read() soup = BeautifulSoup(data,fromEncoding=’gb18030′) print WebExtractor(soup) pero al depurar, los datos como este: 5h , 4 H 5 VM \ ¿Qué debo hacer para obtener los datos correctos para BeautifulSoup? ¡Gracias!

Python: sugerencias para mejorar un código trozo a trozo para leer varios millones de puntos

Escribí un código para leer el archivo *.las en Python. *las archivo es un archivo especial ascii donde cada línea es x,y,z valor de puntos. Mi función lee N número de puntos y compruebe si están dentro de un polígono con points_inside_poly . Tengo las siguientes preguntas: Cuando llego al final del archivo, LASException: LASError […]

¿Por qué recibo un error de encoding ASCII con datos Unicode en Python 2.4 pero no en 2.7?

Tengo un progtwig que, cuando se ejecuta en Python 2.7, produce una salida Unicode adecuada a la salida estándar. Cuando se ejecuta en Python 2.4, obtengo UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 1-4: ordinal not in range(128) . ¿Qué cambió entre la versión 2.4 y 2.7 que esto funciona ahora?

¿Errores en mi código para detectar la encoding de archivos de texto con Python?

Sé más acerca de la reparación de bicicletas, el uso de motosierras y la seguridad de las zanjas que de Python o encoding de texto; Con eso en mente… La encoding de texto en Python parece ser un problema perenne (mi propia pregunta: ¿ buscando contenidos de archivos de texto con varias codificaciones con Python? […]

Python y el tema de la encoding scrapy

Simplemente no puedo entender! 🙁 Estoy desechando datos de un sitio codificado en utf-8, bueno, eso es al menos lo que dice: Content-Type: text/html;charset=utf-8 Estoy obteniendo una lista de cadenas regulares de Unicode con XPath selector extract () call: item[‘city’]= element.select(‘//div[@id=”bubble_2″]/div/text()’).extract() Esta es la lista: [u’Westbahnhofstr.\xa010′, u’72070\xa0T\xfcbingen’] Ahora me uno a la lista en una […]