Articles of python unicode

Lectura de datos en ruso de CSV

Tengo algunos datos en el archivo CSV que están en ruso: 2-комнатная квартира РДТ’, мкр Тастак-3, Аносова — Толе би;Алматы 2-комнатная квартира БГР’, мкр Таугуль, Дулати (Навои) — Токтабаева;Алматы 2-комнатная квартира ЦФМ’, мкр Тастак-2, Тлендиева — Райымбека;Алматы Delimitador es ; símbolo. Quiero leer datos y ponerlos en un array. Intenté leer estos datos usando este […]

Lista de Unicode de impresión de Python

Con el siguiente código lst = [u’\u5de5′, u’\u5de5′] msg = repr(lst).decode(‘unicode-escape’) print msg tengo [u’工’, u’工’] ¿Cómo puedo eliminar la u para que el contenido de msg sea: [‘工’, ‘工’]

¿Una cadena UNICODE que contenga caracteres ASCII siempre será igual a la cadena ASCII?

Noté las siguientes presas: >>> u’abc’ == ‘abc’ True >>> ‘abc’ == u’abc’ True ¿Será esto siempre cierto o podría depender de la configuración regional del sistema? (Parece que las cadenas son unicode en Python 3: por ejemplo, esta pregunta , pero los bytes en 2.x)

Open () y codecs.open () en Python 2.7 se comportan de manera extrañamente diferente

Tengo un archivo de texto con la primera línea de caracteres Unicode y todas las demás líneas en ASCII. Intento leer la primera línea como una variable, y todas las demás líneas como otra. Sin embargo, cuando uso el siguiente código: # -*- coding: utf-8 -*- import codecs import os filename = ‘1.txt’ f = […]

Las funciones TextIOWrapper o BuffereRWPair del módulo Python io no funcionan bien con pySerial

Estoy escribiendo un adaptador en serie para algún hardware científico cuyo conjunto de comandos utiliza codificaciones de caracteres UTF-8. Todas las respuestas del hardware terminan con un retorno de carro (u ‘\ r’). Me gustaría poder usar la función readline() pySerial con un carácter EOL especificado, así que tengo esta configuración, ala este hilo : […]

Python 2.7 en minúsculas

Cuando uso .lower() en Python 2.7, la cadena no se convierte a minúsculas para las letras ŠČŽ . Leo los datos del diccionario. Intenté usar str(tt[“code”]).lower() , tt[“code”].lower() . Alguna sugerencia ?

Python: Traceback codecs.charmap_decode (input, self.errors, decoding_table)

A continuación se muestra un código de muestra, el objective es simplemente fusionar archivos de texto de la carpeta de donaciones y su subcarpeta. Estoy recibiendo Traceback de vez en cuando, así que no estoy seguro de dónde buscar. También necesita ayuda para mejorar el código para evitar que la línea en blanco se combine […]

datos de Unicode de un dataframe a cadenas

Tengo algunos problemas con un dataframe obtenido al leer un archivo xls. Todos los datos en dicho dataframe tienen el tipo ‘Unicode’ y no puedo hacer nada con esto. Quiero cambiarlo a valores de str. Además, si es posible, me gustaría saber la razón de este hecho. Escuché algo sobre ‘datos externos’, y sé que […]

¿Cómo construir un vocabulario regular de emoticons en python?

Tengo una lista de códigos de emoticones dentro de un archivo UTF32.red.codes en texto plano. El contenido plano del archivo es \U0001F600 \U0001F601 \U0001F602 \U0001F603 \U0001F604 \U0001F605 \U0001F606 \U0001F609 \U0001F60A \U0001F60B Basándome en la pregunta , mi idea es crear una expresión regular del contenido del archivo para capturar los emoticones. Este es mi ejemplo […]

Eliminar todos los Emojis del texto

Python ha formulado esta pregunta aquí : Cómo eliminar todos los emojis Sin una solución, tengo un paso hacia la solución. Pero necesito ayuda para terminarlo. Fui y obtuve todos los puntos del código hex de emoji del sitio emoji: https://www.unicode.org/emoji/charts/emoji-ordering.txt Entonces leí en el archivo así: file = open(’emoji-ordering.txt’) temp = file.readline() final_list = […]