In der letzten Zeit ist leider nicht viel vorwärts gegangen. Allerdings kann ich verkünden, daß ich jetzt das POS (Part of Speech) integriert habe. Damit können jetzt diese Informationen für die Bewertung hinzugezogen werden.
Die Auswahl der Tagger war nicht ganz einfach, da diese sich nicht native einbinden lassen (keine .Net, kein T-SQL Version gefunden (wer welche kennt, bitte als Kommentar posten)
Zum Testen haben ich mich auf die aus meiner Sicht bekanntesten beschränkt.
http://wiki.languagetool.org/
http://nlp.stanford.edu/software/tagger.shtml#Download
Diese sind als Konsolenapplikation vorhanden und können auf ähnliche Weise eingebunden werden. Beide sind zudem in Java programmiert, daher ist die Einbindung sogar identisch.
Am Ende habe ich mich für die Version von Stanford entschieden. Das Ergebnis des Taggers wird komplett als XML ausgegeben und das lässt sich einfach mit dem SQL Server verarbeiten. Languagetool kann dies auch, jedoch nicht im Betriebsmodus als Tagger. Vielleicht in einer der nächsten Versionen. Den Vorschlag habe ich beim Entwickler eingereicht.