Articles of encoding de

Extrae archivos con caracteres no válidos en el nombre de archivo con Python

Utilizo el módulo zipfile de python para extraer un archivo .zip (Tomemos este archivo en http://img.dafont.com/dl/?f=akvaleir por ejemplo) f = zipfile.ZipFile(‘akvaleir.zip’, ‘r’) for fileinfo in f.infolist(): print fileinfo.filename f.extract(fileinfo, ‘.’) Su salida: Akval ir_Normal_v2007.ttf Akval ir, La police – The Font – Fr – En.pdf Ambos archivos son inaccesibles después de la extracción porque hay […]

Problemas con diéresis en la variable de entorno de aplicación de python

No puedo encontrar una manera correcta de obtener la variable de entorno para la ruta de datos de aplicación en Python. El problema es que mi nombre de usuario incluye caracteres especiales (el alemán ae y ue). Hice una solución alternativa con PyQt para Vista y Windows 7, pero no funciona para sistemas XP. ¿Alguien […]

Python csv: UnicodeDecodeError

Estoy leyendo en un archivo con el módulo csv de Python, y tengo otra pregunta de encoding (lo siento, hay muchos aquí). En el archivo CSV, hay signos £. Después de leer la fila e imprimirla, se han convertido en \ xa3. Intentar codificarlos como Unicode produce un UnicodeDecodeError : row = [unicode(x.strip()) for x […]

Forma pythonica de implementar un tokenizador.

Voy a implementar un tokenizador en Python y me preguntaba si podría ofrecer algún consejo de estilo. He implementado un tokenizer antes en C y en Java, así que estoy de acuerdo con la teoría, me gustaría asegurarme de que estoy siguiendo los estilos y las mejores prácticas de Pythonic. Listado de tipos de fichas: […]

Biblioteca estándar de Python para POST multiparte / datos codificados de datos de formulario

Me gustaría publicar datos codificados multiparte / datos de formulario. He encontrado un módulo externo que lo hace: http://atlee.ca/software/poster/index.html, sin embargo, preferiría evitar esta dependencia. ¿Hay alguna manera de hacer esto usando las bibliotecas estándar? Gracias

No se puede ejecutar pip: UnicodeDecodeError

Tengo problemas para usar el pip. Por ejemplo: pip install numpy –upgrade Me da el siguiente error: Collecting numpy Using cached numpy-1.10.2.tar.gz Exception: Traceback (most recent call last): File “/usr/local/lib/python2.7/dist-packages/pip/basecommand.py”, line 211, in main status = self.run(options, args) File “/usr/local/lib/python2.7/dist-packages/pip/commands/install.py”, line 305, in run wb.build(autobuilding=True) File “/usr/local/lib/python2.7/dist-packages/pip/wheel.py”, line 705, in build self.requirement_set.prepare_files(self.finder) File “/usr/local/lib/python2.7/dist-packages/pip/req/req_set.py”, line […]

¿Cómo cambiar la encoding del sistema de archivos a través de python?

>>> import sys >>> sys.getfilesystemencoding() ‘UTF-8’ ¿Cómo cambio eso? Sé cómo cambiar la encoding predeterminada del sistema. >>> reload(sys) >>> sys.setdefaultencoding(‘ascii’) Pero no hay sys.setfilesystemencoding.

¿Biblioteca de Python para convertir texto sin formato (ASCII) en un conjunto de caracteres GSM de 7 bits?

¿Existe una biblioteca de Python para codificar datos ASCII a un conjunto de caracteres GSM de 7 bits (para enviar SMS)?

Python, consola de Windows y codificaciones (cp 850 vs cp1252)

Pensé que sabía todo sobre codificaciones y Python, pero hoy me encontré con un problema extraño: aunque la consola está configurada en la página de códigos 850 (y Python lo informa correctamente), los parámetros que puse en la línea de comandos parecen estar codificados en la página de códigos 1252 . Si bash descodificarlos con […]

Python “string_escape” vs “unicode_escape”

Según los documentos , la cadena incorporada codifica string_escape : Produce [s] una cadena que es adecuada como cadena literal en el código fuente de Python … mientras que el unicode_escape : Produce [s] una cadena que es adecuada como literal Unicode en el código fuente de Python Por lo tanto, deberían tener aproximadamente el […]