Articles of codifica

Python 3: Desmitificando los métodos de encoding y deencoding

Digamos que tengo una cadena en Python: >>> s = ‘python’ >>> len(s) 6 Ahora encode esta cadena como esta: >>> b = s.encode(‘utf-8’) >>> b16 = s.encode(‘utf-16’) >>> b32 = s.encode(‘utf-32’) Lo que obtengo de las operaciones anteriores es una matriz de bytes, es decir, b , b16 y b32 son solo matrices de […]

Cambie la encoding de “Imprimido por comillas” a “utf-8”

Estoy tratando de leer el correo electrónico con imaplib. Me sale este cuerpo de correo: =C4=EE=E1=F0=FB=E9 =E4=E5=ED=FC! Eso es Quoted-printable encoding Quoted-printable comillas. Necesito obtener utf-8 de esto. Debe ser Добрый день! Lo busqué en Google, pero es demasiado desordenado con las versiones de Python. Ya está unicode en Python 3, no puedo usar .encode(‘utf-8’) […]

Cómo codificar (utf8mb4) en Python

¿Cómo puedo codificar algo en ut8mb4 en Python? Tengo dos conjuntos de datos: los datos que estoy migrando a mi nueva base de datos MySQL desde Parse, y los datos en adelante (que solo se refieren a mi nueva base de datos). Mi base de datos es utf8mb4 para almacenar emoji y letras acentuadas. El […]

BeautifulSoup4 stripped_strings me da los objetos byte?

Estoy tratando de sacar el texto de un blockquote que se ve así: 01 Oyasumi 02 DanSin’ 03 wts 04 Lovism 05 NoName 06 Gakkou 07 Happy☆Day 08 Endless End. Lo que estoy tratando de hacer es esto en Python 2.7 (no puede decodificar el carácter ☆, por lo que traté de usar encoding): soup […]

Python: ¿Qué encoding se usa para procesar sys.argv?

¿En qué encoding están los elementos de sys.argv , en Python? ¿Están codificados con la encoding sys.getdefaultencoding() ? sys.getdefaultencoding (): devuelve el nombre de la encoding de cadena predeterminada actual utilizada por la implementación de Unicode. PD : Como se señaló en algunas de las respuestas, sys.stdin.encoding sería una mejor suposición . ¡Me encantaría ver […]

Python 2.7: LookupError: encoding desconocida: cp65001

Instalé Python 2 (64 bits), en Windows 8.1 (64 bits) y quería saber la versión pip y para eso disparé pip –version pero está dando error. C:\Users\ADMIN>pip –version Traceback (most recent call last): File “c:\dev\python27\lib\runpy.py”, line 162, in _run_module_as_main “__main__”, fname, loader, pkg_name) File “c:\dev\python27\lib\runpy.py”, line 72, in _run_code exec code in run_globals File “C:\dev\Python27\Scripts\pip.exe\__main__.py”, […]

UnicodeEncodeError: el codec ‘ascii’ no puede codificar el carácter u ‘\ xe9’ en la posición 7: ordinal no está dentro del rango (128)

Tengo este codigo printinfo = title + “\t” + old_vendor_id + “\t” + apple_id + ‘\n’ # Write file f.write (printinfo + ‘\n’) Pero me sale este error al ejecutarlo: f.write(printinfo + ‘\n’) UnicodeEncodeError: ‘ascii’ codec can’t encode character u’\xe9′ in position 7: ordinal not in range(128) Es tener problemas para escribir esto: Identité secrète […]

Python: codifica de forma compacta y reversible un entero grande como base64 o base16 con longitud variable o fija

Quiero codificar de forma compacta un entero grande sin signo o con signo que tenga un número arbitrario de bits en una representación base64, base32 o base16 (hexadecimal). La salida se utilizará en última instancia como una cadena que se usará como un nombre de archivo, pero esto no debería ir al punto. Estoy usando […]

¿Debo usar la statement de encoding en Python 3?

Python 3 usa la encoding UTF-8 para los archivos de código fuente de forma predeterminada. ¿Debo seguir utilizando la statement de encoding al comienzo de cada archivo fuente? Me gusta # -*- coding: utf-8 -*-

UnicodeEncodeError: el codec ‘ascii’ no puede codificar el carácter en la posición 0: ordinal no está en el rango (128)

Estoy trabajando en una secuencia de comandos de Python que usa el carácter de tijera (9986 – ✂) y estoy tratando de portar mi código a Mac, pero estoy teniendo este error. El carácter de tijera aparece bien cuando se ejecuta desde IDLE (Python 3.2.5 – OS X 10.4.11 iBook G4 PPC) y el código […]