verificar si una oración es gtwigticalmente correcta usando el analizador de stanford

¿Hay algún método para verificar si una oración es gtwigticalmente correcta o no usa el analizador de stanford? A partir de ahora puedo obtener el árbol de análisis de una oración utilizando el analizador de stanford. Me quedé atascado aquí y no sé cómo seguir adelante.

larsmans tiene razón en que esos analizadores no están diseñados para eso, pero aquí hay un hack:

Puedes intentar usar el analizador “confianza”. Cada analizador probabilístico calcula las probabilidades de diferentes tags y asigna la secuencia más probable. He intentado esto con una parte del etiquetador de voz ( http://www.ark.cs.cmu.edu/TweetNLP/ ), donde cada etiqueta se asigna con cierta confianza (0.93, 0.45, etc.), calculo el promedio de confianza de todas las tags en una oración y compárelo con un cierto umbral de confianza (basado en otras oraciones en el corpus).

Obviamente, si la confianza de las tags no es lo suficientemente alta, asumo que la oración es gtwigticalmente incorrecta. Después de algunas heurísticas más, como cuidar la puntuación u oraciones de una palabra, funcionó para mí.

El analizador de Stanford es probabilístico y calcula las probabilidades con seguridad, pero no pude obtener la confianza de la caja. Tal vez tengas que cavar y ver cómo puedes exponerlo.