direkt zum Inhalt springen

direkt zum Hauptnavigationsmenü

Sie sind hier

TU Berlin

Inhalt des Dokuments

Kurzinfo

Bearbeiter: Roland Pfuhl

Betreuer: Torsten Killias

Zusammenfassung

Frederick Reiss et al. haben gezeigt, dass ein massiver Performancegewinn möglich ist, wenn man für rule-based information extraction einen algebraischen Ansatz wählt anstatt cascading regular exprsesions zu verwenden. Basierend auf diesen Ideen, entwickelt die DIMA Gruppe derzeit eine Erweiterung zu einer relationalen Datenbank (INDREX/MIA). Die Bachelorarbeit definiert diese Erweiterung und das ihr zugrunde liegende (Hypergraph-)Schema und zeigt die Probleme auf, welche beim Erstellen von Abfragen entstehen. Darauf aufbauend wird eine erweiterbare DSL vorgeschlagen, welche die Erstellung von grundlegenden Abfragen vereinfacht. Hierzu werden special environments in SQL integriert, die gewissen Regeln folgen. Das Ergebnis ist eine Kurzschreibweise zum Definieren von Annotationen, für den Zugriff auf deren Informationen und dem Erstellen partieller Subgraphen mit Hilfe von patterns.

Zusatzinformationen / Extras