Articles of codifica

Cargue gensim Word2Vec computado en Python 2, en Python 3

Tengo un modelo gensim Word2Vec computado en Python 2 así: from gensim.models import Word2Vec from gensim.models.word2vec import LineSentence model = Word2Vec(LineSentence(‘enwiki.txt’), size=100, window=5, min_count=5, workers=15) model.save(‘w2v.model’) Sin embargo, necesito usarlo en Python 3. Si bash cargarlo, import gensim from gensim.models import Word2Vec model = Word2Vec.load(‘w2v.model’) se traduce en un error: UnicodeDecodeError: ‘ascii’ codec can’t decode […]

Especificando la encoding usando NumPy loadtxt / savetxt

El uso de las loadtxt NumPy loadtxt y savetxt falla cuando se trata de caracteres que no son ASCII. Estas funciones son principalmente para datos numéricos, pero también se admiten encabezados / pies de página alfanuméricos. Tanto loadtxt como savetxt parecen estar aplicando la encoding latin-1, que me parece muy ortogonal al rest de Python […]

Python os.walk Make It Support Unicode / UTF-8?

He investigado sobre este problema, parece que el uso predeterminado de Python 2.7 es ASCII, no puedo cambiar a python 3 (Unicode predeterminado) debido a las bibliotecas # -*- coding: utf-8 -*- print u’порядке’ parece imprimir bien será ?????? sin u pero: print list(os.walk(ur’c:\somefoler’)) devuelve \u0438\u0442… ¿por qué no legible como primera impresión? También uso […]

Leyendo el archivo UTF-8 con codecs en IronPython

Tengo un archivo .csv codificado en UTF-8, que contiene símbolos latinos y cirílicos. ;F1;F2;abcdefg3;F200 ;ABSOLUTE;NOMINAL;NOMINAL;NOMINAL o1;1;USA;Новосибирск;1223 Estoy intentando ejecutar el siguiente script en IronPython 2.7.1: import codecs f = codecs.open(r”file.csv”, “rb”, “utf-8”) f.next() Durante la ejecución de f.next () ocurre una excepción: Traceback (most recent call last): File “c:\Program Files\Microsoft Visual Studio 10.0\Common7\IDE\Extensions\Microsoft\Python Tools for […]

¿Cómo puedo obtener caracteres Unicode de un parámetro de URL?

Necesito usar una solicitud GET para enviar JSON a mi servidor a través de un cliente de JavaScript, así que comencé a repetir las respuestas para asegurarme de que no se pierda nada en la traducción. No parece haber un problema con el texto normal, pero tan pronto como incluyo un carácter Unicode de cualquier […]

wp.uploadFile xmlrpc de python encode base64

Estoy tratando de cargar un archivo usando xmlrpc en wordpress. He hecho esto usando php pero esta vez debo usar python y algo no está funcionando. Para ser más específico, la forma de hacerlo es llamando a la función xmlrpc wp.uploadFile que se explica en el códice http://codex.wordpress.org/XML-RPC_wp#wp.uploadFile o metaWeblog.newMediaObject. El problema es la encoding. […]

Archivo CSV de Python 3 que proporciona UnicodeDecodeError: el códec ‘utf-8’ no puede decodificar un error de byte cuando imprimo

Tengo el siguiente código en Python 3, que está destinado a imprimir cada línea en un archivo csv. import csv with open(‘my_file.csv’, ‘r’, newline=”) as csvfile: lines = csv.reader(csvfile, delimiter = ‘,’, quotechar = ‘|’) for line in lines: print(‘ ‘.join(line)) Pero cuando lo ejecuto, me da este error: UnicodeDecodeError: ‘utf-8’ codec can’t decode byte […]

¿Hay alguna diferencia entre el operador de formato `%` y `str.format ()` en python con respecto a la encoding Unicode y utf-8?

Asumir que n = u”Tübingen” repr(n) # `T\xfcbingen` # Unicode i = 1 # integer El primero de los siguientes archivos se lanza. UnicodeEncodeError: ‘ascii’ codec can’t encode character u’\xfc’ in position 82: ordinal not in range(128) Cuando hago n.encode(‘utf8’) funciona. El segundo funciona impecable en ambos casos. # Python File 1 # #!/usr/bin/env python […]

Problemas de MariaDB / Python con personajes emoji

Tengo una cadena en x[‘foo’] , a veces es una cadena normal, otras veces es un emoji o arte de texto … Por lo tanto, recibo este error al intentar enviar el contenido a la base de datos. Advertencia: Valor de cadena incorrecto: ‘\ xE4 \ xB8 \ xBA Co …’ para la columna ‘descripción’ […]

¿Cómo debo tratar con un XMLSyntaxError en el lxml de Python mientras analizo un archivo XML grande?

Estoy intentando analizar un archivo XML de más de 2 GB con la biblioteca lxml de Python. Desafortunadamente, el archivo XML no tiene una línea que indique la encoding de caracteres, así que tengo que configurarlo manualmente. Mientras recorre el archivo, todavía hay algunos personajes extraños que aparecen de vez en cuando. No estoy seguro […]