Leyendo JSON: ¿qué encoding es “\ u00c5 \ u0082”? ¿Cómo llego a un objeto Unicode?

Uno de los valores en un archivo JSON que estoy analizando es Wroc\u00c5\u0082aw . ¿Cómo puedo convertir esta cadena en un objeto Unicode que produce “Wrocław” (que es la deencoding correcta en este caso)?

Parece que su JSON no tiene la encoding correcta porque ni \ u00c5 ni \ u0082aw arrojan los caracteres que espera en ninguna encoding.

Pero quizás intentes codificar este valor en UTF8 o UTF16

Parece que cualquier proceso generado que JSON tomó texto codificado en UTF-8 y lo confundió con texto codificado en Latin-1. Para corregir el error, ejecute el mismo proceso a la inversa:

 >>> u'Wroc\u00c5\u0082aw'.encode('iso-8859-1').decode('utf-8') u'Wroc\u0142aw' >>> import unicodedata >>> unicodedata.name(u'\u0142') 'LATIN SMALL LETTER L WITH STROKE'