Articles of codificación de

UnicodeDecodeError: el codec ‘gbk’ no puede decodificar el byte 0x80 en la posición 0 de una secuencia de multibytes ilegal

Yo uso Python 3.4 con el sistema Win 7 de 64 bits. Corrí el siguiente código: 6 “”” load single batch of cifar “”” 7 with open(filename, ‘r’) as f: —-> 8 datadict = pickle.load(f) 9 X = datadict[‘data’] El mensaje incorrecto es UnicodeDecodeError: ‘gbk’ codec can’t decode byte 0x80 in position 0: illegal multibyte […]

Creando un archivo de video MPEG4 con Python desde marcos en bruto

Tengo una fuente de video en bruto a la que puedo acceder en Python. Me gustaría crear un video MPEG4 a partir de esto, con música de fondo MP3. ¿Qué tipo de herramientas y bibliotecas están disponibles en Python para esta tarea? Preferiblemente, me gustaría tener una API para la que pueda alimentar el nombre […]

Ofuscando cuerdas con ASCII y base 128

Supongamos que una cadena es un sistema numérico donde cada cosa, puede ser un char, DEL o cualquier cosa ASCII, tiene un número correspondiente según esta tabla ASCII. ¿Cómo puedes convertir una cadena arbitraria de la propiedad a un número en Python? Un ejemplo #car = 35*128**3+99*128**2+97*128**1+114*128**0=75034866

Manejo de errores de Unicode con líneas de lectura de Python 3 ()

Sigo recibiendo este error mientras leo un archivo de texto. ¿Es posible manejarlo / ignorarlo y proceder? UnicodeEncodeError: el codec ‘charmap’ no puede decodificar el byte 0x81 en la posición 7827: el carácter se asigna a no definido.

Códec personalizado de Python Charmap

Estoy tratando de escribir un codec de Python personalizado. Aquí hay un breve ejemplo: import codecs class TestCodec(codecs.Codec): def encode(self, input_, errors=’strict’): return codecs.charmap_encode(input_, errors, { ‘a’: 0x01, ‘b’: 0x02, ‘c’: 0x03, }) def decode(self, input_, errors=’strict’): return codecs.charmap_decode(input_, errors, { 0x01: ‘a’, 0x02: ‘b’, 0x03: ‘c’, }) def lookup(name): if name != ‘test’: return […]

Interpretar “texto plano” como texto utf-8 en python

Tengo un archivo de texto con texto que debería haber sido interpretado como utf-8 pero no fue (me fue dado de esta manera). Aquí hay un ejemplo de una línea típica del archivo: \ u30ed \ u30f3 \ u30c9 \ u30f3 \ u5728 \ u4f4f que debería haber sido: ン ド ン ン 住 Ahora, […]

Error de encoding Django de Python, carácter no ASCII ‘\ xe5’

Hola, me encontré con un error de encoding con Python Django. En mi views.py, tengo lo siguiente: from django.shortcuts import render from django.http import HttpResponse from django.template.loader import get_template from django.template import Context # Create your views here. def hello(request): name = ‘Mike’ html = ‘Hi %s, this seems to have !!!!worked!’ % name return […]

Problemas de encoding y deencoding de correo electrónico de Python

Básicamente, quiero leer todos los nuevos correos electrónicos de una bandeja de entrada y ponerlos en una base de datos. La razón por la que uso python es porque tiene imaplib , pero no sé nada al respecto. Actualmente, tengo algo como esto: def primitive_get_text_blocks(email_message_instance): maintype = email_message_instance.get_content_maintype() if maintype == ‘multipart’: return_parts = “” […]

¿Por qué recibo un error de encoding en python warnings.formatwarning en una cadena de formato?

Me sale un error de encoding en esta línea: s = “%s:%s: %s: %s\n” % (filename, lineno, category.__name__, message) UnicodeEncodeError: el codec ‘ascii’ no puede codificar el carácter u ‘\ xc4’ en la posición 44: ordinal no está dentro del rango (128) Intenté reproducir este error pasando todas las combinaciones de parámetros al formato de […]

LabelBinarizer de Scikit-learn contra OneHotEncoder

¿Cuál es la diferencia entre los dos? Parece que ambas crean nuevas columnas, cuyo número es igual al número de categorías únicas en la característica. Luego asignan 0 y 1 a los puntos de datos según la categoría en la que se encuentren.