Inhalt des Dokuments
Zusammenfassung
Frederick Reiss et al. haben gezeigt, dass ein massiver Performancegewinn möglich ist, wenn man für rule-based information extraction einen algebraischen Ansatz wählt anstatt cascading regular exprsesions zu verwenden. Basierend auf diesen Ideen, entwickelt die DIMA Gruppe derzeit eine Erweiterung zu einer relationalen Datenbank (INDREX/MIA). Die Bachelorarbeit definiert diese Erweiterung und das ihr zugrunde liegende (Hypergraph-)Schema und zeigt die Probleme auf, welche beim Erstellen von Abfragen entstehen. Darauf aufbauend wird eine erweiterbare DSL vorgeschlagen, welche die Erstellung von grundlegenden Abfragen vereinfacht. Hierzu werden special environments in SQL integriert, die gewissen Regeln folgen. Das Ergebnis ist eine Kurzschreibweise zum Definieren von Annotationen, für den Zugriff auf deren Informationen und dem Erstellen partieller Subgraphen mit Hilfe von patterns.