Articles of codifica

Problemas con la encoding en la consola de Eclipse y Python

Supongo que necesito ayuda con respecto a las codificaciones en Python (2.6) y Eclipse. Utilicé Google y así busqué e intenté muchas cosas, pero en realidad no lo entiendo. Entonces, ¿cómo logro que la salida en la consola de Eclipse pueda mostrar äöü, etc.? Intenté: declarar la encoding del documento en la primera línea con […]

Python inserta la cadena UTF8 en SQLite

Sé que hay preguntas similares, pero las respuestas son distintas y un poco confusas. Tengo esta cadena: titulo = “Así Habló Zaratustra (Cómic)” Cuando bash insertarlo en la base de datos SQLite, aparece el error: sqlite3.ProgrammingError: You must not use 8-bit bytestrings unless you use a text_factory that can interpret 8-bit bytestrings (like text_factory = […]

Cadenas de Python y encoding y deencoding del método str ()

Veo que el manual de Python menciona los métodos de cadena .encode() y .decode() . Al jugar en la CLI de Python veo que puedo crear cadenas de Unicode u’hello’ con un tipo de datos diferente al de una cadena ‘hello’ normal ‘ ‘hello’ y puedo convertir / lanzar con str() . Pero los problemas […]

usando códigos Ascii extendidos con Python

He creado un diccionario con Python pero tengo problemas con los códigos Ascii extendidos. El bucle que crea el diccionario es: (número ascii 128 a 164: é, à, etc.) #extented ascii codes i = 128 while i <= 165 : dictionnary[chr(i)] = 'extended ascii' i = i + 1 Pero cuando trato de usar el […]

¿Cómo obtengo Cyrillic en la salida, Python?

¿Cómo puedo obtener cirílico en lugar de u’… el codigo es asi def openfile(filename): with codecs.open(filename, encoding=”utf-8″) as F: raw = F.read() do stuff… print some_text huellas dactilares >>>[u’.’, u’,’, u’:’, u’\u0432′, u”, u'(‘, u’)’, u’\u0437′, u’\u0456′]

La salida de Python reemplaza los caracteres no ASCII con

Estoy usando Python 2.7 para leer datos de una tabla MySQL. En MySQL el nombre se ve así: Garasa, Ángel. Pero cuando lo imprimo en Python la salida es Garasa, Ángel El nombre del conjunto de caracteres en MySQL es utf8. Este es mi código Python: # coding: utf-8 import MySQLdb connection = MySQLdb.connect (host=”localhost”,user=”root”,passwd=”root”,db=”jmdb”) […]

Python, Codificación de salida a UTF-8

Tengo una definición que construye una cadena compuesta de caracteres codificados en UTF-8. Los archivos de salida se abren con ‘w+’, “utf-8” argumentos ‘w+’, “utf-8” . Sin embargo, cuando trato de x.write(string) obtengo el UnicodeEncodeError: ‘ascii’ codec can’t encode character u’\ufeff’ in position 1: ordinal not in range(128) Supongo que esto se debe a que […]

Python 2 y 3 csv reader

Estoy tratando de usar el módulo csv para leer un archivo csv utf-8, y tengo algunos problemas para crear un código genérico para Python 2 y 3 debido a la encoding. Aquí está el código original en Python 2.7: with open(filename, ‘rb’) as csvfile: csv_reader = csv.reader(csvfile, quotechar=’\”‘) langs = next(csv_reader)[1:] for row in csv_reader: […]

Cargue gensim Word2Vec computado en Python 2, en Python 3

Tengo un modelo gensim Word2Vec computado en Python 2 así: from gensim.models import Word2Vec from gensim.models.word2vec import LineSentence model = Word2Vec(LineSentence(‘enwiki.txt’), size=100, window=5, min_count=5, workers=15) model.save(‘w2v.model’) Sin embargo, necesito usarlo en Python 3. Si bash cargarlo, import gensim from gensim.models import Word2Vec model = Word2Vec.load(‘w2v.model’) se traduce en un error: UnicodeDecodeError: ‘ascii’ codec can’t decode […]

Especificando la encoding usando NumPy loadtxt / savetxt

El uso de las loadtxt NumPy loadtxt y savetxt falla cuando se trata de caracteres que no son ASCII. Estas funciones son principalmente para datos numéricos, pero también se admiten encabezados / pies de página alfanuméricos. Tanto loadtxt como savetxt parecen estar aplicando la encoding latin-1, que me parece muy ortogonal al rest de Python […]