Articles of codificación de

Manejo de errores de Unicode con líneas de lectura de Python 3 ()

Sigo recibiendo este error mientras leo un archivo de texto. ¿Es posible manejarlo / ignorarlo y proceder? UnicodeEncodeError: el codec ‘charmap’ no puede decodificar el byte 0x81 en la posición 7827: el carácter se asigna a no definido.

Códec personalizado de Python Charmap

Estoy tratando de escribir un codec de Python personalizado. Aquí hay un breve ejemplo: import codecs class TestCodec(codecs.Codec): def encode(self, input_, errors=’strict’): return codecs.charmap_encode(input_, errors, { ‘a’: 0x01, ‘b’: 0x02, ‘c’: 0x03, }) def decode(self, input_, errors=’strict’): return codecs.charmap_decode(input_, errors, { 0x01: ‘a’, 0x02: ‘b’, 0x03: ‘c’, }) def lookup(name): if name != ‘test’: return […]

Interpretar “texto plano” como texto utf-8 en python

Tengo un archivo de texto con texto que debería haber sido interpretado como utf-8 pero no fue (me fue dado de esta manera). Aquí hay un ejemplo de una línea típica del archivo: \ u30ed \ u30f3 \ u30c9 \ u30f3 \ u5728 \ u4f4f que debería haber sido: ン ド ン ン 住 Ahora, […]

Error de encoding Django de Python, carácter no ASCII ‘\ xe5’

Hola, me encontré con un error de encoding con Python Django. En mi views.py, tengo lo siguiente: from django.shortcuts import render from django.http import HttpResponse from django.template.loader import get_template from django.template import Context # Create your views here. def hello(request): name = ‘Mike’ html = ‘Hi %s, this seems to have !!!!worked!’ % name return […]

Problemas de encoding y deencoding de correo electrónico de Python

Básicamente, quiero leer todos los nuevos correos electrónicos de una bandeja de entrada y ponerlos en una base de datos. La razón por la que uso python es porque tiene imaplib , pero no sé nada al respecto. Actualmente, tengo algo como esto: def primitive_get_text_blocks(email_message_instance): maintype = email_message_instance.get_content_maintype() if maintype == ‘multipart’: return_parts = “” […]

¿Por qué recibo un error de encoding en python warnings.formatwarning en una cadena de formato?

Me sale un error de encoding en esta línea: s = “%s:%s: %s: %s\n” % (filename, lineno, category.__name__, message) UnicodeEncodeError: el codec ‘ascii’ no puede codificar el carácter u ‘\ xc4’ en la posición 44: ordinal no está dentro del rango (128) Intenté reproducir este error pasando todas las combinaciones de parámetros al formato de […]

LabelBinarizer de Scikit-learn contra OneHotEncoder

¿Cuál es la diferencia entre los dos? Parece que ambas crean nuevas columnas, cuyo número es igual al número de categorías únicas en la característica. Luego asignan 0 y 1 a los puntos de datos según la categoría en la que se encuentren.

Problema de encoding imprimible entre el correo electrónico de Python

Estoy extrayendo correos electrónicos de Gmail utilizando lo siguiente: def getMsgs(): try: conn = imaplib.IMAP4_SSL(“imap.gmail.com”, 993) except: print ‘Failed to connect’ print ‘Is your internet connection working?’ sys.exit() try: conn.login(username, password) except: print ‘Failed to login’ print ‘Is the username and password correct?’ sys.exit() conn.select(‘Inbox’) # typ, data = conn.search(None, ‘(UNSEEN SUBJECT “%s”)’ % subject) […]