Cómo analizar tags personalizadas usando nltk.Regexp.parser ()

Mi pregunta es similar a esta pregunta sin respuesta: ¿ Usar tags POS personalizadas para la fragmentación de NLTK? , pero el error que estoy recibiendo es diferente. Estoy tratando de analizar una frase a la que he agregado mis propias tags de dominio específicas.

Por ejemplo:

(u'greatest', 'P'), (u'internet', 'NN'), (u'ever', 'A'), (u',', ','), (u'and', 'CC'), (u'its', 'PRP$'), (u'being', 'VBG'), (u'slow', 'N'), (u'as', 'IN'), (u'hell', 'NN')` 

donde (u'slow', 'N') es una etiqueta personalizada 'N' .

Estoy tratando de analizar esto usando lo siguiente:

 grammar=r""" Chunk:`{?*

+}` """ parser=nltk.RegexpParser(grammar)

Pero estoy recibiendo el siguiente error:

 ValueError: Illegal chunk pattern: `{?*

+}`

¿ nltk.RegexpParser procesa tags personalizadas? ¿Hay algún otro analizador basado en nltk o python que pueda hacer eso?

No estoy familiarizado con NTLK, pero en las expresiones regulares de Python ?* Es un error de syntax. Tal vez quisiste decir *? que es un cuantificador perezoso.