Articles of encoding de caracteres

Codificación de caracteres en python para reemplazar ‘u2019’ con ‘

He intentado varias formas de codificar esto para el resultado final “BACK RUSHIN'” con el personaje más importante como el apóstrofe correcto ‘ . Me gustaría una forma de llegar a este resultado final utilizando algunas de las funciones integradas que Python tiene donde no hay discriminación entre una cadena normal y una cadena Unicode. […]

Problemas al extraer el XML de un documento de Word en francés con Python: se generan caracteres ilegales

Durante los últimos días he estado intentando crear un script que 1) extraería el XML de un documento de Word, 2) modificara ese XML y 3) usara el nuevo XML para crear y guardar un nuevo documento de Word. Con la ayuda de muchos usuarios de stackoverflow, finalmente pude encontrar un código que parece muy […]

Convertir un valor int a unicode

Estoy usando pyserial y necesito enviar algunos valores inferiores a 255. Si envío el int, el valor ascii del int se envía. Así que ahora estoy convirtiendo el int en un valor Unicode y lo envío a través del puerto serie. unichr(numlessthan255); However it throws this error: ‘ascii’ codec can’t encode character u’\x9a’ in position […]

Envuelve un flujo abierto con io.TextIOWrapper

¿Cómo puedo envolver un flujo binario abierto – un file Python 2, un io.BufferedReader Python 3, un io.BytesIO – en un io.TextIOWrapper ? Estoy tratando de escribir código que funcione sin cambios: Corriendo en Python 2. Corriendo en Python 3. Con flujos binarios generados desde la biblioteca estándar (es decir, no puedo controlar qué tipo […]

¿Cómo creo matrices de caracteres en numpy?

Digamos que tengo la siguiente matriz: import numpy as np a = [‘hello’,’snake’,’plate’] Quiero que esto se convierta en una matriz numpy b para que: b[0,0] = ‘h’ b[0,1] = ‘e’ b[0,2] = ‘l’ b[1,0] = ‘s’ … Quiero que funcionen los trucos numpy estándar, como transmisión, comparación, etc. Como se hace ¿Y dónde está […]

Codificación stdout en python

¿Hay alguna buena razón por la que no debería iniciar todos mis progtwigs de Python con esto? ¿Hay algo especial perdido al hacer un ejecutivo como este? #!/usr/bin/python import os, sys if sys.stdout.encoding == None: os.putenv(“PYTHONIOENCODING”,’UTF-8′) os.execv(sys.executable,[‘python’]+sys.argv) print sys.stdout.encoding Hay 60 preguntas acerca de PYTHONIOENCODING, así que supongo que es un problema común, pero en […]

¿Cómo abrir un archivo html?

Tengo un archivo html llamado test.html que tiene una palabra בדיקה . Abro el test.html e imprimo su contenido usando este bloque de código: file = open(“test.html”, “r”) print file.read() pero se imprime ?????? ¿Por qué sucedió esto y cómo podría arreglarlo? Por cierto Cuando abro el archivo de texto funciona bien. Edit: yo había […]

¿Cómo manejar los caracteres Unicode (no ASCII) en Python?

Estoy progtwigndo en Python y obteniendo información de una página web a través de la biblioteca urllib2 . El problema es que esa página me puede proporcionar caracteres no ASCII, como ‘ñ’ , ‘á’ , etc. En el momento en que urllib2 obtiene este carácter, provoca una excepción, como esta: File “c:\Python25\lib\httplib.py”, line 711, in […]

Escribir una cadena de conexión cuando la contraseña contiene caracteres especiales

Estoy usando SQLalchemy para un proyecto de Python, y quiero tener una cadena de conexión ordenada para acceder a mi base de datos. Así por ejemplo: engine = create_engine(‘postgres://user:pass@host/database’) El problema es que mi contraseña contiene una secuencia de caracteres especiales que se interpretan como delimitadores cuando bash conectarme. Me doy cuenta de que solo […]

La encoding da “el codec ‘ascii’ no puede codificar el carácter … ordinal no está dentro del rango (128)”

Estoy trabajando a través del proyecto de lector de RSS Django aquí . La fuente RSS leerá algo como “OKLAHOMA CITY (AP) – James Harden let”. La encoding de la fuente RSS lee encoding = “UTF-8”, así que creo que estoy pasando el utf-8 a markdown en el fragmento de código a continuación. El tablero […]