Articles of encoding de caracteres

Tratando de obtener la encoding de una página web Python y BeautifulSoup

Estoy intentando recuperar el juego de caracteres de una página web (esto cambiará todo el tiempo). En este momento estoy usando beautifulSoup para analizar la página y luego extraer el conjunto de caracteres del encabezado. Esto estaba funcionando bien hasta que me topé con un sitio que tenía … Mi código hasta ahora y que […]

Añadiendo alias de encoding a Python

¿Hay alguna manera de que pueda agregar un alias a Python para la encoding? Hay sitios en la web que utilizan la encoding ‘windows-1251’ pero tienen su conjunto de caracteres configurado para ganar-1251, por lo que me gustaría que win-1251 sea un alias de windows-1251

Python ASCII y Unicode descodifican error

Recibí este muy frustrante error al insertar una cierta cadena en mi base de datos. Dijo algo como: Python no puede decodificar caracteres de bytes, esperando unicode ” Después de mucho buscar, vi que podía superar este error al codificar mi cadena en Unicode . Intento hacer esto decodificando primero la cadena y luego codificándola […]

Unicode en Python – solo UTF-16?

Me sentí feliz en mi mundo de Python sabiendo que estaba haciendo todo en Unicode y codificando como UTF-8 cuando necesitaba enviar algo a un usuario. Entonces, uno de mis colegas me envió este artículo sobre UTF-8 y me confundió. El autor del artículo indica varias veces que UCS-2, la representación Unicode que Python utiliza […]

Codificación de caracteres en python para reemplazar ‘u2019’ con ‘

He intentado varias formas de codificar esto para el resultado final “BACK RUSHIN'” con el personaje más importante como el apóstrofe correcto ‘ . Me gustaría una forma de llegar a este resultado final utilizando algunas de las funciones integradas que Python tiene donde no hay discriminación entre una cadena normal y una cadena Unicode. […]

Problemas al extraer el XML de un documento de Word en francés con Python: se generan caracteres ilegales

Durante los últimos días he estado intentando crear un script que 1) extraería el XML de un documento de Word, 2) modificara ese XML y 3) usara el nuevo XML para crear y guardar un nuevo documento de Word. Con la ayuda de muchos usuarios de stackoverflow, finalmente pude encontrar un código que parece muy […]

Convertir un valor int a unicode

Estoy usando pyserial y necesito enviar algunos valores inferiores a 255. Si envío el int, el valor ascii del int se envía. Así que ahora estoy convirtiendo el int en un valor Unicode y lo envío a través del puerto serie. unichr(numlessthan255); However it throws this error: ‘ascii’ codec can’t encode character u’\x9a’ in position […]

Envuelve un flujo abierto con io.TextIOWrapper

¿Cómo puedo envolver un flujo binario abierto – un file Python 2, un io.BufferedReader Python 3, un io.BytesIO – en un io.TextIOWrapper ? Estoy tratando de escribir código que funcione sin cambios: Corriendo en Python 2. Corriendo en Python 3. Con flujos binarios generados desde la biblioteca estándar (es decir, no puedo controlar qué tipo […]

¿Cómo creo matrices de caracteres en numpy?

Digamos que tengo la siguiente matriz: import numpy as np a = [‘hello’,’snake’,’plate’] Quiero que esto se convierta en una matriz numpy b para que: b[0,0] = ‘h’ b[0,1] = ‘e’ b[0,2] = ‘l’ b[1,0] = ‘s’ … Quiero que funcionen los trucos numpy estándar, como transmisión, comparación, etc. Como se hace ¿Y dónde está […]

Codificación stdout en python

¿Hay alguna buena razón por la que no debería iniciar todos mis progtwigs de Python con esto? ¿Hay algo especial perdido al hacer un ejecutivo como este? #!/usr/bin/python import os, sys if sys.stdout.encoding == None: os.putenv(“PYTHONIOENCODING”,’UTF-8′) os.execv(sys.executable,[‘python’]+sys.argv) print sys.stdout.encoding Hay 60 preguntas acerca de PYTHONIOENCODING, así que supongo que es un problema común, pero en […]