english version
Programme von /Partusch

NASfVI - Ein natürlichsprachiges Anfragesystem

NASfVI ist ein natürlichsprachiges Anfragesystem für Vorlesungsverzeichnisse im Internet. Es versteht Anfragen in natürlichem Deutsch und beantwortet sie ebenfalls auf Deutsch. Das Anfragesystem besteht aus einem mit Java-Servlets entwickelten Server, der in einem beliebigen Servlet-Container ausgeführt werden kann. Der Server beinhaltet eine in Prolog geschriebene Sprachverarbeitungskomponente, die ein Fragment des Deutschen implementiert und ein auf der Optimalitätstheorie basierendes Verfahren benutzt, um eine freie Phrasenstellung zu ermöglichen. Die Sprachverarbeitung ist darauf ausgelegt, möglichst viele Stellungsvarianten verarbeiten zu können.

Der Server verwendet Apache Lucene als Datenspeicher. Aus den natürlichsprachigen Anfragen werden Suchanfragen für Apache Lucene berechnet und dessen Suchindex durchsucht. Aus den zu den Anfragen passenden Dokumenten werden die gesuchten Informationen extrahiert und für die Generierung einer natürlichsprachigen Antwort auf Deutsch genutzt. Der Server unterstützt die OpenSearch-Spezifikationen für Suchmaschinen und Suggestions. NASfVI kann daher in verschiedenen Browsern als Suchmaschine integriert werden.

Außer dem Server liegt dem Anfragesystem auch ein Client bei, der mit dem Google Web Toolkit entwickelt worden ist. Der Client unterstützt die Eingabe der Anfragen und die Anzeige der vom Server berechneten Antwort. Er bereitet außerdem die linguistischen Analysen und Details des Servers auf. Während ein Benutzer eine Anfrage in den Client eingibt, fragt dieser im Hintergrund ab, was für Anfragen mit der bisherigen Eingabe möglich sind. Diese von der Sprachverarbeitung berechneten Vorschläge blendet der Client zur Unterstützung des Benutzers ein.

Screenshot

Eine Anfrage und deren Beantwortung im Client

Screenshot

Automatische Vorschläge für mögliche Anfragen

Die Komponenten des Anfragesystems sind modular aufgebaut, so dass z. B. das Lexikon der Sprachverarbeitungskomponente problemlos gegen eines ausgetauscht werden kann, das nicht auf Vorlesungsverzeichnisse als Themengebiet festgelegt ist. Auch die gesamte Sprachverarbeitungskomponente kann ausgetauscht und durch eine andere ersetzt werden. Aber auch die Verwendung von Apache Lucene ist nicht zwingend. Denn aufgrund der Modularisierung des Systems kann die Volltextsuche ebenfalls für eine andere Suchtechnologie ausgetauscht werden.

NASfVI ist Teil meiner Magisterarbeit "Entwurf und Implementierung eines natürlichsprachigen Anfragesystems für Vorlesungsverzeichnisse im Internet".

Eine kurze Zusammenfassung einiger Merkmale von NASfVI:

Downloadmöglichkeiten