Articles of python unicode

Python 3: os.walk () rutas de archivos UnicodeEncodeError: el codec ‘utf-8’ no puede codificar: no se permiten sustitutos

Este código: for root, dirs, files in os.walk(‘.’): print(root) Me da este error: UnicodeEncodeError: ‘utf-8’ codec can’t encode character ‘\udcc3’ in position 27: surrogates not allowed ¿Cómo paso por un árbol de archivos sin obtener cadenas tóxicas como esta?

Google App Engine: UnicodeDecodeError: el códec ‘ascii’ no puede decodificar el byte 0xe2 en la posición 48: ordinal no está dentro del rango (128)

Estoy trabajando en una pequeña aplicación que utiliza el motor de aplicaciones de Google que utiliza el canal RSS de Quora. Existe un formulario y, en función de la entrada introducida por el usuario, generará una lista de enlaces relacionados con la entrada. Ahora, las aplicaciones funcionan bien para las consultas de una letra y […]

Unicode en Python

Ahora uso elixir con mi base de datos mysql y la redispy con redis y selecciono UTF-8 en todo el lugar. Quiero escribir algunos datos en chino como {‘Info’:’8折’,’Name’:’家乐福’} pero lo que obtuve es así: {‘Info’: u’8\u6298′, ‘Name’: u’\u5bb6\u4e50\u798f’} y después de que guarde este dictamen para redisparlo y sacarlo de nuevo, se vuelve: {“Info”: […]

Imprima la cadena Unicode para consolar, pero falla cuando se redirige a un archivo. ¿Como arreglar?

Tengo Python 2.7.1 en una versión en chino simplificado de Windows XP, y tengo un progtwig como este (windows_prn_utf8.py): #!/usr/bin/env python # -*- coding: utf8 -*- print unicode(‘\xE7\x94\xB5’, ‘utf8′) Si lo ejecuto en la consola de Windows CMD, genera el carácter chino correcto ‘电’; sin embargo, si bash redirigir la salida del comando a un […]

Python caracteres latinos y Unicode

Tengo una estructura de árbol en la que las palabras clave pueden contener algunos caracteres latinos. Tengo una función que recorre todas las hojas del árbol y agrega cada palabra clave a una lista bajo ciertas condiciones. Aquí está el código que tengo para agregar estas palabras clave a la lista: print “Adding: ” + […]

Python para mostrar caracteres especiales

Sé que hay un montón de subprocesos con respecto a este problema, pero no he logrado encontrar uno que resuelva mi problema. Estoy intentando imprimir una cadena pero cuando se imprime no muestra caracteres especiales (por ejemplo, æ, ø, å, ö y ü). Cuando imprimo la cadena usando repr() esto es lo que obtengo: u’Von […]

Argumento de la cadena de Python sin una encoding

Estoy intentando ejecutar este fragmento de código, y sigue dando un error que dice “argumento de cadena sin una encoding” ota_packet = ota_packet.encode(‘utf-8’) + bytearray(content[current_pos:(final_pos)]) + ‘\0’.encode(‘utf-8’) ¿Alguna ayuda?

UnicodeDecodeError: (códec ‘utf-8’) al leer un archivo csv

lo que estoy intentando es leer un csv para hacer un dataframe — hacer cambios en una columna — nuevamente actualizar / reflejar el valor cambiado en el mismo csv (to_csv) – nuevamente tratar de leer ese csv para hacer otro dataframe … allí estoy recibiendo un error UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xe7 […]

Codificaciones de cadena implícitas / predeterminadas de Python

¿Cuándo, dónde y cómo aplica Python implícitamente las codificaciones a las cadenas o hace transcodificaciones (conversiones) implícitas? ¿Y cuáles son esas codificaciones “predeterminadas” (es decir, implícitas)? Por ejemplo, ¿cuáles son las codificaciones: de cadenas literales? s = “Byte string with national characters” us = u”Unicode string with national characters” de las cadenas de bytes cuando […]

Método sys.getsizeof de python que devuelve diferentes tamaños en diferentes versiones de python

sys.getsizeof está devolviendo un tamaño diferente para una cadena Unicode en diferentes versiones de Python. sys.getsizeof(u’Hello World’) devuelve 96 en Python 2.7.3 y devuelve 72 en Python 2.7.11