Python Arabic PNL

Estoy en el proceso de evaluar las capacidades de NLTK en el procesamiento de texto en árabe en una investigación para analizar y extraer sentimientos.

La pregunta es como sigue:

  1. ¿El NTLK es capaz de manejar y permite el análisis de texto en árabe?
  2. ¿Python es capaz de manipular \ tokenizar texto en árabe?
  3. ¿Podré analizar y almacenar texto en árabe usando Python?

Si python y NTLK no son las herramientas para este trabajo, ¿qué herramientas recomendaría (si existieran)?

Gracias.


EDITAR

Basado en la investigación:

  1. NTLK solo es capaz de derivar texto árabe: enlace
  2. Python es capaz de manejar texto en árabe ya que es compatible con unicode UTF-8: Enlace
  3. El análisis y la lematización del texto en árabe se pueden realizar mediante: SNLPG (The Stanford Natural Language Processing Group) Analizador estadístico: enlace

Una simple búsqueda en Google nos lleva a estos enlaces:

Procesamiento del lenguaje natural árabe

Uso de Python con el corpus árabe coránico

CÓMO: Trabajar con Python, Unicode y árabe

¿Alguno de estos es útil?