Articles of unicode

Convertir conjunto de resultados a cadena y lugar en la lista

Estoy tratando de convertir los valores de mi lista a cadenas normales como listy = [[‘value1′,’value2′,’value3’],[‘value1′,’value2′,’value3′],[ Inicialicé una lista vacía listy = [] y encontré todos los utilizando find_all (‘a’) y produje esto como salida listy = [[… value1, value2, value3, …],[…value4, value5, value6, …],[]] Intenté usar la item.find_all(‘a’).string Sin embargo, recibí este error. AttributeError: […]

¿Cómo encontrar una descripción textual de emoticons, caracteres Unicode y emoji en una cadena (python, perl)?

La detección y el recuento de icons de emoticons se ha abordado anteriormente . Como seguimiento de esta pregunta y la solución provista, me gustaría extenderla con la capacidad de vincular los emoticones, caracteres Unicode y emoji detectados a sus correspondientes descripciones (textuales): emoticones (occidentales y orientales, por ejemplo, Lista de emoticones de Wikipedia) caracteres […]

¿Cómo almacenar texto en árabe en la base de datos mysql usando python?

Tengo una cadena árabe decir txt = u’Arabic (\u0627\u0644\u0637\u064a\u0631\u0627\u0646)’ Quiero escribir este texto en árabe convertido en base de datos mySql. Traté de usar txt = smart_str(txt) o txt = text.encode(‘utf-8′) Ambos de estos no funcionan, ya que cubren la cadena para u’Arabic (\xd8\xa7\xd9\x84\xd8\xb7\xd9\x8a\xd8\xb1\xd8\xa7\xd9\x86)’ También mi conjunto de caracteres de la base de datos ya […]

Pandas, convierte la columna de Unicodes a la columna de la lista de cadenas

Una de mis columnas de dataframe de pandas tiene unicodes de este tipo u’asd,abc,tre,der34,whatever’ . Los resultados finales deben ser una columna de listas de cadenas: [‘asd’,’abc’,’tre’,’der34′,’whatever’] . Una lista de Unicodes también podría hacer: [u’asd’,u’abc’,u’tre’,u’der34′,u’whatever’] . Por cierto, puede suceder que en la columna de Unicodes haya un nan o un u ”. ¿Cualquier […]

Python 3.4 causa UnicodeEncodeError en el servidor Apache2 (Mac) pero funciona bien en la línea de comandos

Estoy tratando de obtener un script Python 3.4 cgi y Apache para generar un carácter ‘ü’ en el navegador (el mismo problema ocurre con cualquier otro carácter Unicode, para el caso). El script python 3.4 cgi causa un UnicodeEncodeError en Apache, mientras que un código similar de python 2.7 funciona bien en el mismo servidor. […]

Extraño comportamiento de impresión en python con unicode.

Me pregunto por qué puedo usar imprimir para imprimir una cadena Unicode en mi OSX Terminal.app, pero si redirecciono la salida estándar a un archivo o la canalizo a “más”, obtengo un Código de Código Unicode. ¿Cómo decide Python si imprime Unicode o si lanza una excepción?

Python unicode write to file se bloquea en la línea de comandos pero no en IDE

Tengo un problema en el que mi código de Python 2.7.3rc2 funciona bien a través de un IDE (Aptana Studio 3 con PyDev), pero se bloquea cuando hago doble clic en el archivo .py o bash ejecutarlo desde la línea de comandos de Windows. La línea problemática es donde bash escribir una cadena que contiene […]

Expresiones de índice Tkinter.Text y Unicode

Consideremos el siguiente código: from tkinter import Tk, Text root = Tk() text = Text(root) text.insert(“end”, “abcdefgh\nабвгґдеє\n一伊依医咿噫欹泆”) print(text.index(“1.4+1l”), text.index(“1.4+2l”)) print(text.index(“3.4-1l”), text.index(“3.4-2l”)) Algunas personas (por ejemplo, yo) esperan que se imprima 2.4 3.4 y 2.4 1.4 , porque se supone que +1l y -1l deben conservar la columna si la línea es lo suficientemente larga. En […]

Python raw_input comportamiento extraño con acentos que contienen cadenas

Estoy escribiendo un progtwig que solicita al usuario una entrada que contenga acentos. La cadena de entrada del usuario se prueba para ver si coincide con una cadena declarada en el progtwig. Como puedes ver a continuación, mi código no funciona: código # -*- coding: utf-8 -*- testList = [‘má’] myInput = raw_input(‘enter something here: […]

Diferencia entre u’string ‘y unicode (cadena)

Este es un progtwig de ejemplo que hice: >>> print u’\u1212′ ሒ >>> print ‘\u1212’ \u1212 >>> print unicode(‘\u1212’) \u1212 ¿por qué \u1212 lugar de ሒ cuando ሒ print unicode(‘\u1212’) ? Estoy creando un progtwig para almacenar datos y no imprimirlos, así que, ¿cómo ሒ lugar de \u1212 ? Ahora obviamente no puedo hacer algo […]