Articles of utf 8

¿Cómo convertir el asunto del correo electrónico de “? UTF-8? …? =” A una cadena legible?

Posible duplicado: cadena de encoding / deencoding Ahora el tema se ve como: =? UTF-8? B? 0J / RgNC + 0LLQtdGA0LrQsA ==? =

django.utils.encoding.DjangoUnicodeDecodeError

Recibí el siguiente error cuando intenté agregar una entrada a un modelo de Django a través de relaciones genéricas. django.utils.encoding.DjangoUnicodeDecodeError: ‘utf8’ codec can’t decode byte 0xb8 in position 24: unexpected code byte. You passed in ‘ASL/60Styles_Timeless-3_\xb8 CaLe.asl’ () El modelo es así: class MD5(models.Model): value = models.CharField(max_length=32, db_index=True) filename = models.CharField(max_length=100) content_type = models.ForeignKey(ContentType) object_id […]

¿Cómo utilizo el tipo de contenido Django y UTF-8 para la plantilla?

Cuando lo hago: return render_to_response() en Django. ¿Cómo configuro el tipo de contenido en UTF-8? ¿Así que todo lo que se muestra es UTF-8?

Archivo CSV de Python 3 que proporciona UnicodeDecodeError: el códec ‘utf-8’ no puede decodificar un error de byte cuando imprimo

Tengo el siguiente código en Python 3, que está destinado a imprimir cada línea en un archivo csv. import csv with open(‘my_file.csv’, ‘r’, newline=”) as csvfile: lines = csv.reader(csvfile, delimiter = ‘,’, quotechar = ‘|’) for line in lines: print(‘ ‘.join(line)) Pero cuando lo ejecuto, me da este error: UnicodeDecodeError: ‘utf-8’ codec can’t decode byte […]

Python 2.7: Extraño comportamiento Unicode

Estoy experimentando el siguiente comportamiento en Python 2.7: >>> a1 = u’\U0001f04f’ #1 >>> a2 = u’\ud83c\udc4f’ #2 >>> a1 == a2 #3 False >>> a1.encode(‘utf8’) == a2.encode(‘utf8’) #4 True >>> a1.encode(‘utf8’).decode(‘utf8’) == a2.encode(‘utf8’).decode(‘utf8′) #5 True >>> u’\ud83c\udc4f’.encode(‘utf8’) #6 ‘\xf0\x9f\x81\x8f’ >>> u’\ud83c’.encode(‘utf8’) #7 ‘\xed\xa0\xbc’ >>> u’\udc4f’.encode(‘utf8’) #8 ‘\xed\xb1\x8f’ >>> ‘\xd8\x3c\xdc\x4f’.decode(‘utf_16_be’) #9 u’\U0001f04f’ ¿Cuál es la […]

UnicodeDecodeError: el codec ‘utf-8’ no puede decodificar un error de byte

Estoy intentando obtener una respuesta de urllib y decodificarla en un formato legible. El texto está en hebreo y también contiene caracteres como { y / La encoding de la página superior es: # -*- coding: utf-8 -*- cadena cruda es: b’\xff\xfe{\x00 \x00\r\x00\n\x00″\x00i\x00d\x00″\x00 \x00:\x00 \x00″\x001\x004\x000\x004\x008\x003\x000\x000\x006\x004\x006\x009\x006\x00″\x00,\x00\r\x00\n\x00″\x00t\x00i\x00t\x00l\x00e\x00″\x00 \x00:\x00 \x00″\x00\xe4\x05\xd9\x05\xe7\x05\xd5\x05\xd3\x05 \x00\xd4\x05\xe2\x05\xd5\x05\xe8\x05\xe3\x05 \x00\xd4\x05\xea\x05\xe8\x05\xe2\x05\xd4\x05 \x00\xd1\x05\xde\x05\xe8\x05\xd7\x05\xd1\x05 \x00″\x00,\x00\r\x00\n\x00″\x00d\x00a\x00t\x00a\x00″\x00 \x00:\x00 \x00[\x00]\x00\r\x00\n\x00}\x00\r\x00\n\x00\r\x00\n\x00′ Ahora estoy […]

Problemas de MariaDB / Python con personajes emoji

Tengo una cadena en x[‘foo’] , a veces es una cadena normal, otras veces es un emoji o arte de texto … Por lo tanto, recibo este error al intentar enviar el contenido a la base de datos. Advertencia: Valor de cadena incorrecto: ‘\ xE4 \ xB8 \ xBA Co …’ para la columna ‘descripción’ […]

Python: UnicodeDecodeError: el codec ‘utf8’ no puede decodificar el byte

Estoy leyendo un montón de archivos RTF en cadenas de python. En algunos textos, me sale este error: Traceback (most recent call last): File “11.08.py”, line 47, in X = vectorizer.fit_transform(texts) File “C:\Python27\lib\site-packages\sklearn\feature_extraction\text.py”, line 716, in fit_transform X = super(TfidfVectorizer, self).fit_transform(raw_documents) File “C:\Python27\lib\site-packages\sklearn\feature_extraction\text.py”, line 398, in fit_transform term_count_current = Counter(analyze(doc)) File “C:\Python27\lib\site-packages\sklearn\feature_extraction\text.py”, line 313, in […]

hash Unicode cadena en Python

Intento hash algunas cadenas de Unicode: hashlib.sha1(s).hexdigest() UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position 0-81: ordinal not in range(128) donde s es algo como œ∑¡ ™ £ ¢ ∞§¶ • ªº– ≠ œ∑´® † ¥ ¨ˆøπ “’åß∂ƒ © ˙∆˚¬… æΩ≈ç√∫˜µ≤≥ ÷ åйцук е щ щ щ щ щ щ щ π π π щ […]

CSV, DictWriter, Unicode y utf-8

Estoy teniendo problemas con los caracteres DictWriter y no ascii. Una versión corta de mi problema: #!/usr/bin/env python # -*- coding: utf-8 -*- import codecs import csv f = codecs.open(“test.csv”, ‘w’, ‘utf-8’) writer = csv.DictWriter(f, [‘field1′], delimiter=’\t’) writer.writerow({‘field1′:u’å’.encode(‘utf-8’)}) f.close() Da este Traceback: Traceback (most recent call last): File “test.py”, line 10, in writer.writerow({‘field1′:u’å’.encode(‘utf-8’)}) File “/Library/Frameworks/Python.framework/Versions/2.5/lib/python2.5/csv.py”, […]