Articles of unicode

¿Cuál es la diferencia entre el prefijo u ” y unicode () en python?

¿Cuál es la diferencia entre u” prefijo u” y unicode() ? # -*- coding: utf-8 -*- print u’上午’ # this works print unicode(‘上午’, errors=’ignore’) # this works but print out nothing print unicode(‘上午’) # error Para la tercera print , el error muestra: UnicodeDecodeError: el códec ‘ascii’ no puede decodificar el byte 0xe4 en la […]

Python unicode rendering: cómo saber si falta un carácter Unicode en la fuente

En Python cuando represento un carácter Unicode, por ejemplo, un carácter chino, con una fuente seleccionada, a veces la fuente está incompleta con respecto a los caracteres comunes de Unicode y no puede representar el carácter Unicode en cuestión. En esos casos, si llamo a la función “imprimir”, la salida generalmente se ve como una […]

Python obtener código de caracteres en diferente encoding?

Dado un código de carácter como número entero en una encoding, ¿cómo puede obtener el código de carácter en, digamos, utf-8 y nuevamente como entero?

Python JSON cargas / vuelcos rompe Unicode?

El volcado de una cadena que contiene caracteres Unicode como json produce secuencias de escape extrañas de Unicode: text = “⌂⚘いの法嫁” print(text) # output: ⌂⚘いの法嫁 import json json_text = json.dumps(text) print(json_text) # output: “\u2302\u2698\u3044\u306e\u6cd5\u5ac1” Me gustaría obtener esta salida en su lugar: “⌂⚘いの法嫁” ¿Cómo puedo volcar caracteres Unicode como caracteres en lugar de secuencias de […]

Codificación Python para pipe.communicate

Estoy llamando a pipe.communicate desde el módulo de subprocess de Python desde Python 2.6. Me sale el siguiente error de este código: from subprocess import Popen pipe = Popen(cwd) pipe.communicate( data ) Para un cwd arbitrario, y donde los data que contienen unicode (específicamente 0xE9): Exec. exception: ‘ascii’ codec can’t encode character u’\xe9′ in position […]

¿Un equivalente a string.ascii_letters para cadenas Unicode en Python 2.x?

En el módulo “string” de la librería estándar, string.ascii_letters ## Same as string.ascii_lowercase + string.ascii_uppercase es ‘abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ’ ¿Existe una constante similar que incluya todo lo que se considera una letra en Unicode?

Mejores prácticas para Python UnicodeDecodeError

Yo uso Pylons framework, plantilla Mako para una aplicación basada en web. Realmente no me molesté demasiado en la forma en que Python maneja las cadenas Unicode. Tuve un momento tenso cuando vi que mi sitio se bloqueaba cuando la página estaba renderizada y más tarde supe que estaba relacionada con UnicodeDecodeError . Después de […]

¿Cómo doblo una cadena en Python 2?

Python 3.3 agrega el método casefold al tipo str, pero en 2.x no tengo nada. ¿Cuál es la mejor manera de evitar esto?

Cómo imprimir una cadena Unicode en Python en la consola de Windows

Estoy trabajando en una aplicación de Python que puede imprimir texto en varios idiomas en la consola en múltiples plataformas. El progtwig funciona bien en todas las plataformas UNIX, pero en Windows hay errores al imprimir cadenas Unicode en la línea de comandos. Ya hay un hilo relevante con respecto a esto: ( el cambio […]

Convertir octetos UTF-8 a puntos de código Unicode

Tengo un conjunto de octetos UTF-8 y necesito convertirlos de nuevo a puntos de código Unicode. ¿Cómo puedo hacer esto en python. por ejemplo, el octeto UTF-8 [‘0xc5’, ‘0x81’] debe convertirse en punto de código 0x141.