Articles of unicode

Convertir Unicode en python

Posible duplicado: Convertir Unicode a UTF-8 Python Soy un progtwigdor de python muy nuevo, trabajando en mi primer script. el script extrae texto de una cadena de plist, luego le hace algunas cosas y luego lo empaqueta como un correo electrónico HTML. De algunas de las entradas, recibo el error Unicode “fuera de lo ordinal […]

Leyendo JSON: ¿qué encoding es “\ u00c5 \ u0082”? ¿Cómo llego a un objeto Unicode?

Uno de los valores en un archivo JSON que estoy analizando es Wroc\u00c5\u0082aw . ¿Cómo puedo convertir esta cadena en un objeto Unicode que produce “Wrocław” (que es la deencoding correcta en este caso)?

Tipo y formato de sys.exc_info () en Python 2.71

En Python 2.71 en Windows XP necesito usar FTP. Mi código es: try: ftp = FTP(trec.address) ftp.login(trec.login, trec.passw) s = ftp.retrlines(‘LIST ‘ + trec.filetype) ftp.quit() except: (type, value, tb) = sys.exc_info() reponse = “%s” % value Pero tengo un error en la última línea: UnicodeDecodeError: el códec ‘ascii’ no puede decodificar el byte 0xea en […]

SQLAlchemy Unicode Error – Consultando la base de datos Teradata

Estoy tratando de usar la biblioteca SQLAlchemy de Python para consultar una base de datos Teradata. Pude crear bien el motor usando el siguiente código. from sqlalchemy import create_engine td_engine = create_engine(‘teradata://’ + ‘usrname’ + ‘:’ + ‘pswrd’ + ‘@’ + ‘myOdbcDataSource’ + ‘:22/?charset=UTF8’) Pero cuando bash usar el motor, aparece el siguiente error. ValueError: […]

entendiendo decode () y encode () unicode

Simplemente no puedo ver cómo funcionan las funciones decode() y encode() en python2.7 Probé la siguiente statement >>> s = u’abcd’ >>> s.encode(‘utf8’) ‘abcd’ >>> s.encode(‘utf16’) ‘\xff\xfea\x00b\x00c\x00d\x00’ >>> s.encode(‘utf32’) ‘\xff\xfe\x00\x00a\x00\x00\x00b\x00\x00\x00c\x00\x00\x00d\x00\x00\x00’ Hasta aquí, creo que está claro; encode() traduce un código Unicode en la cadena de bytes utf-8/16/32 correspondiente. Pero cuando codifico: >>> s.decode(‘utf8′) u’abcd’ >>> […]

Error de caracteres ilegales de la ttwig de datos de Python en el error de deencoding del códec ‘ascii’

Estoy intentando escribir un dataframe de pandas para excel. Inicialmente, recibí openpyxl.utils.exceptions.IllegalCharacterError que resolví con: def export_file(clients): clients = clients.applymap(lambda x: x.encode(‘unicode_escape’). decode(‘utf-8’) if isinstance(x, str) else x) clients.to_excel(‘all_clients.xlsx’) return() Que luego resultó en: UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xe2 in position 17: ordinal not in range(128) Sin embargo, si resuelvo el error de […]

Python: el archivo fuente Unicode agrega espacios (en realidad nulos bytes) entre caracteres

Soy un novato Sin embargo, logré extraer algunas líneas de un archivo txt (Unicode) y escribirlas en otro archivo. lines = InFile.readlines() OutFile.writelines(lines[3:]) Está funcionando pero (creo) debido a un problema de encoding hay un espacio agregado entre cada carácter en el archivo de salida. Ejemplo de un resultado: 2 0 1 3 – 1 […]

Conversión de doble barra diagonal utf-8

¡No puedo conseguir que esto funcione! Tengo un archivo de texto de un analizador de archivos de juegos guardados con un montón de nombres chinos UTF-8 en forma de byte, como este en source.txt: \ xe6 \ x89 \ x8e \ xe5 \ x8a \ xa0 \ xe6 \ x8b \ x89 Pero, no importa […]

Python unicode Decode Error SUDs

Bien, tengo # -*- coding: utf-8 -*- en la parte superior de mi script y funcionó para poder extraer datos de la base de datos que tenían caracteres divertidos (Ñ, Õ, é, -, -, ‘ , …) en él y almacene esos datos en variables … pero me he encontrado con otros problemas, veo que […]

strip () y strip (string.whitespace) dan resultados diferentes a pesar de que la documentación sugiere que deberían ser iguales

Tengo una cadena Unicode con algunos espacios que no se rompen al principio y al final. Obtengo resultados diferentes cuando uso strip() vs. strip(string.whitespace) . >>> import string >>> s5 = u’\xa0\xa0hello\xa0\xa0′ >>> print s5.strip() hello >>> print s5.strip(string.whitespace) hello La documentación para la strip() dice: “Si se omite o None , el argumento chars […]