Articles of codificación

¿Cómo utilizo el tipo de contenido Django y UTF-8 para la plantilla?

Cuando lo hago: return render_to_response() en Django. ¿Cómo configuro el tipo de contenido en UTF-8? ¿Así que todo lo que se muestra es UTF-8?

Python 2.7: Extraño comportamiento Unicode

Estoy experimentando el siguiente comportamiento en Python 2.7: >>> a1 = u’\U0001f04f’ #1 >>> a2 = u’\ud83c\udc4f’ #2 >>> a1 == a2 #3 False >>> a1.encode(‘utf8’) == a2.encode(‘utf8’) #4 True >>> a1.encode(‘utf8’).decode(‘utf8’) == a2.encode(‘utf8’).decode(‘utf8′) #5 True >>> u’\ud83c\udc4f’.encode(‘utf8’) #6 ‘\xf0\x9f\x81\x8f’ >>> u’\ud83c’.encode(‘utf8’) #7 ‘\xed\xa0\xbc’ >>> u’\udc4f’.encode(‘utf8’) #8 ‘\xed\xb1\x8f’ >>> ‘\xd8\x3c\xdc\x4f’.decode(‘utf_16_be’) #9 u’\U0001f04f’ ¿Cuál es la […]

Python analizando JSON con comillas dobles escapadas

Considera este json válido: {“a”: 1, “b”: “{\”c\”:2}”} El módulo json de Python se lanza cuando bash analizarlo. Parece que el \” está desechando: json.loads (‘{“a”: 1, “b”: “{\” c \ “: 2}”}’) Rastreo (llamadas recientes más última): Archivo “”, línea 1, en Archivo “/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/json/__init__.py”, línea 338, en cargas devuelve _default_decoder.decode (s) Archivo “/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/json/decoder.py”, línea […]

¿Cómo servir un archivo estático con un nombre hebreo en una botella de python?

Recibo una solicitud del cliente para descargar algún archivo del servidor. El nombre del archivo está en hebreo. @bottle.get(“/download//”) def download(folder_name, file_name): file_name = file_name.decode(‘utf-8’) folder_name = folder_name.decode(‘utf-8’) if os.path.exists(os.path.join(folder_name, file_name)): return bottle.static_file(file_name, root=folder_name, download=True) La última línea falla: return bottle.static_file(file_name, root=folder_name, download=True) Me sale una excepción: UnicodeEncodeError: ‘ascii’ codec can’t encode characters in position […]

Codificación en PostgreSQL, Python, Jinja2

Tengo un problema con la encoding en mi aplicación y no encontré la solución en ningún sitio web. Aquí está el escenario: PostgreSQL con encoding UTF-8 ( CREATE DATABASE xxxx WITH ENCODING ‘UTF8’ ) Lógica de Python también con encoding UTF-8 ( # -*- coding: utf-8 -*- ) Jinja2 para mostrar mis páginas HTML. Python […]

“Surrogateescape” no puede escapar de ciertos personajes

Con respecto a la lectura y escritura de archivos de texto en Python, uno de los principales colaboradores de Python menciona esto con respecto al surrogateescape errores Unicode de surrogateescape : [surrogateescape] maneja los errores de deencoding guardando los datos en una pequeña parte del espacio de puntos de código Unicode. Al codificar, convierte esos […]

¿Es Python 3.3 mejor que 2.7 para descodificar y volver a codificar texto web raspado a UTF-8? Como mucho mejor?

Aparentemente hay un millón de preguntas relacionadas con los errores de Python Unicode donde el …ordinal [is] not in range(128) . Aparentemente, la gran mayoría involucra Python 2.x. Sé de estos errores porque actualmente estoy codificando, decodificando el infierno. Para un proyecto paralelo, rasco las páginas web e bash normalizar los datos de texto para […]

¿Cómo escribo una encoding personalizada en Python para limpiar mis datos?

Sé que he hecho esto antes en otro trabajo, pero no puedo recordar lo que hice. Tengo una base de datos llena de campos varchar y memo que se cortaron y pegaron desde Office, páginas web y quién sabe dónde más. Esto está empezando a causar errores de encoding para mí. Ya que Python tiene […]

UnicodeDecodeError al leer un archivo CSV en Pandas con Python para el cirílico búlgaro

Recibo UnicodeDecodeError al leer un archivo CSV en Pandas con Python. UnicodeDecodeError: el codec ‘utf-8’ no puede decodificar el byte 0xc0 en la posición 0: el byte de inicio no es válido. No hay ningún símbolo cirílico en los datos. ¿Es debido a la configuración para el cirílico búlgaro? ¿Sabes qué poner? Intenté con el […]

cómo interpretar este error “UnicodeDecodeError: el códec ‘ascii’ no puede decodificar el byte 0xe2 en la posición 164: ordinal no está en el rango (128)”

Estoy tratando de ejecutar el siguiente código en Python 3: def func(file): for file in os.listdir(cwd): if file.endswith(‘.html’): f = open(file, “r+”) text = re.sub(r’cat’,’ ‘, f.read()) f.close() f = open(file, “w”) f.write(text) f.close() file = os.listdir(cwd) func(file) Luego obtuve el File “/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/encodings/ascii.py”, line 26, in decode return codecs.ascii_decode(input, self.errors)[0] error File “/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/encodings/ascii.py”, line 26, […]