Articles of python unicode

UnicodeDecodeError cuando se usa Python 2.x unicodecsv

Estoy intentando escribir un archivo csv con caracteres Unicode, así que estoy usando el paquete unicodecsv. Desafortunadamente, todavía estoy recibiendo UnicodeDecodeErrors: # -*- coding: utf-8 -*- import codecs import unicodecsv raw_contents = ‘He observes an “Oversized Gorilla” near Ashford’ encoded_contents = unicode(raw_contents, errors=’replace’) with codecs.open(‘test.csv’, ‘w’, ‘UTF-8′) as f: w = unicodecsv.writer(f, encoding=’UTF-8’) w.writerow([“1”, encoded_contents]) […]

Tratar con los nombres de usuario de Unicode en Python mkdtemp

Fui mordido por http://bugs.python.org/issue1681974 – citando desde allí: mkdtemp falla en Windows si el nombre de usuario de Windows tiene algún carácter no ASCII, como ä o ö, en él. mkdtemp lanza un error de encoding. Esto parece ser porque el directorio temporal predeterminado en Windows es “c:\documents and settings\\local settings\temp” La solución que utiliza […]

Cómo convertir una cadena que contiene unicode escape \ u #### en una cadena utf-8

Estoy intentando esto desde la mañana. Mi sample.txt choice = \u9078\u629e Código: with open(‘sample.txt’, encoding=’utf-8′) as f: for line in f: print(line) print(“選択” in line) print(line.encode(‘utf-8’).decode(‘utf-8’)) print(line.encode().decode(‘utf-8’)) print(line.encode(‘utf-8’).decode()) print(line.encode().decode(‘unicode-escape’).encode(“latin-1”).decode(‘utf-8’)) # as suggested. out: choice = \u9078\u629e False choice = \u9078\u629e choice = \u9078\u629e choice = \u9078\u629e UnicodeEncodeError: ‘latin-1’ codec can’t encode characters in position 9-10: […]

Python 3: os.walk () rutas de archivos UnicodeEncodeError: el codec ‘utf-8’ no puede codificar: no se permiten sustitutos

Este código: for root, dirs, files in os.walk(‘.’): print(root) Me da este error: UnicodeEncodeError: ‘utf-8’ codec can’t encode character ‘\udcc3’ in position 27: surrogates not allowed ¿Cómo paso por un árbol de archivos sin obtener cadenas tóxicas como esta?

Google App Engine: UnicodeDecodeError: el códec ‘ascii’ no puede decodificar el byte 0xe2 en la posición 48: ordinal no está dentro del rango (128)

Estoy trabajando en una pequeña aplicación que utiliza el motor de aplicaciones de Google que utiliza el canal RSS de Quora. Existe un formulario y, en función de la entrada introducida por el usuario, generará una lista de enlaces relacionados con la entrada. Ahora, las aplicaciones funcionan bien para las consultas de una letra y […]

Unicode en Python

Ahora uso elixir con mi base de datos mysql y la redispy con redis y selecciono UTF-8 en todo el lugar. Quiero escribir algunos datos en chino como {‘Info’:’8折’,’Name’:’家乐福’} pero lo que obtuve es así: {‘Info’: u’8\u6298′, ‘Name’: u’\u5bb6\u4e50\u798f’} y después de que guarde este dictamen para redisparlo y sacarlo de nuevo, se vuelve: {“Info”: […]

Imprima la cadena Unicode para consolar, pero falla cuando se redirige a un archivo. ¿Como arreglar?

Tengo Python 2.7.1 en una versión en chino simplificado de Windows XP, y tengo un progtwig como este (windows_prn_utf8.py): #!/usr/bin/env python # -*- coding: utf8 -*- print unicode(‘\xE7\x94\xB5’, ‘utf8′) Si lo ejecuto en la consola de Windows CMD, genera el carácter chino correcto ‘电’; sin embargo, si bash redirigir la salida del comando a un […]

Python caracteres latinos y Unicode

Tengo una estructura de árbol en la que las palabras clave pueden contener algunos caracteres latinos. Tengo una función que recorre todas las hojas del árbol y agrega cada palabra clave a una lista bajo ciertas condiciones. Aquí está el código que tengo para agregar estas palabras clave a la lista: print “Adding: ” + […]

Python para mostrar caracteres especiales

Sé que hay un montón de subprocesos con respecto a este problema, pero no he logrado encontrar uno que resuelva mi problema. Estoy intentando imprimir una cadena pero cuando se imprime no muestra caracteres especiales (por ejemplo, æ, ø, å, ö y ü). Cuando imprimo la cadena usando repr() esto es lo que obtengo: u’Von […]

Argumento de la cadena de Python sin una encoding

Estoy intentando ejecutar este fragmento de código, y sigue dando un error que dice “argumento de cadena sin una encoding” ota_packet = ota_packet.encode(‘utf-8’) + bytearray(content[current_pos:(final_pos)]) + ‘\0’.encode(‘utf-8’) ¿Alguna ayuda?