Articles of codificación

Codificación Python para pipe.communicate

Estoy llamando a pipe.communicate desde el módulo de subprocess de Python desde Python 2.6. Me sale el siguiente error de este código: from subprocess import Popen pipe = Popen(cwd) pipe.communicate( data ) Para un cwd arbitrario, y donde los data que contienen unicode (específicamente 0xE9): Exec. exception: ‘ascii’ codec can’t encode character u’\xe9′ in position […]

¿Cómo encontrar caracteres chinos o japoneses en una cadena en Python?

Como: str = ‘sdf344asfasf天地方益3権sdfsdf’ Añadir () a caracteres chinos y japoneses: strAfterConvert = ‘sdfasfasf(天地方益)3(権)sdfsdf’

¿Cómo detectar la encoding de bytes de cadena?

Tengo unos 1000 nombres de archivos leídos por os.listdir() , algunos de ellos están codificados en UTF8 y otros son CP1252. Quiero decodificarlos todos a Unicode para su posterior procesamiento en mi script. ¿Hay alguna manera de hacer que la encoding fuente se decodifique correctamente en Unicode? Ejemplo: for item in os.listdir(rootPath): #Convert to Unicode […]

Volver a codificar la secuencia de Unicode como Ascii ignorando errores

Estoy intentando tomar una secuencia de archivos Unicode, que contiene caracteres impares, y envolverla con un lector de secuencias que la convertirá a Ascii, ignorando o reemplazando a todos los caracteres que no puedan codificarse. Mi flujo se ve como: “EventId”,”Rate”,”Attribute1″,”Attribute2″,”(。・ω・。)ノ” … Mi bash de alterar el flujo sobre la marcha se ve así: import […]

¿Cómo corregir un error de encoding al convertir la lista al formato CSV?

AttributeError: ‘tuple’ object has no attribute ‘encode'” cuando bash escribir mis listas Unicode en un archivo csv: with open(‘assignmentTest.csv’, ‘wb’) as finale: writer = csv.writer(finale) #creates csv file to write final lists into finalRows = zip(firstName, lastName, phdName, universityName, departmentName) #put all of the lists into another lists so that the outputs are in ‘column […]

cadena codificar / decodificar

‘=? KOI8-R? B? W1JFUS0wMDI1NDEtNDc5NzddIO / h7yAi89TSz8rGwdLGz9IiIDs =? = \ R \ n \ t =? KOI8-R? B? Ry43MjkgKDEwKQ == = = ¿Cómo puedo convertir esto en algo legible? Gracias !

Python: parece que Python 3.1 no puede manejar archivos codificados en UTF-16.

Estoy tratando de ejecutar algún código para simplemente ir a través de un montón de archivos y escribir aquellos que sean archivos .txt en el mismo archivo, eliminando todos los espacios. Aquí hay un código simple que debería hacer el truco: for subdir, dirs, files in os.walk(rootdir): for file in files: if ‘.txt’ in file: […]

AttributeError: el objeto ‘list’ no tiene atributo ‘encode’

Tengo una lista de objetos Unicode y quiero codificarlos a utf-8, pero la encoding no parece funcionar. El código está aquí: >>> tmp = [u’ test context’] >>> tmp.encode(‘utf-8’) Traceback (most recent call last): File “”, line 1, in AttributeError: ‘list’ object has no attribute ‘encode’ >>> No puedo entender por qué no hay ningún […]

¿Qué encoding utilizan las cadenas normales de python?

Sé que django usa cadenas Unicode en todo el framework en lugar de cadenas normales de Python. ¿Qué encoding son las cadenas normales de python? ¿Y por qué no usan unicode?

Trabajo a prueba de balas con encoding en Python.

La pregunta sobre Unicode en Python2. Como sé sobre esto, siempre debería decode todo lo que leo desde afuera (archivos, red). decode convierte los bytes externos en cadenas internas de Python usando el conjunto de caracteres especificado en los parámetros. Por lo tanto, decode(“utf8”) significa que los bytes externos son una cadena Unicode y se […]