direkt zum Inhalt springen

direkt zum Hauptnavigationsmenü

Sie sind hier

TU Berlin

Inhalt des Dokuments

Kurzinfo

Bearbeiter: Michail Melnikov

Betreuer: Alan Akbik

Zusammenfassung

In der letzten Zeit hat die regelbasierte Informationsextraktion von Texte, welche im Alltag gebraucht werden, die Interesse der Computerlinguistik geweckt. Die Einbeziehung der sogenannten tiefen syntaktischen Informationen, wie typed dependencies, in der Extraktionsregeln bietet die Möglichkeit zur besseren Bezeichnung von grammatischen Strukturen innerhalb eines Satzes. Dies geschieht unter der Verwendung von Abhängigkeitsbaumstrukturen. Trotz dieser potenziellen Möglichkeiten, ist das Erstellen solche Regel von Personen mit geringen NLP-Wissen sehr schwierig. Das Propminer Projekt bringt mit sich eine Arbeitsablauf zur Unterstützung der Benutzer, um gut lesbare SQL-ähnliche Abfragen erstellen zu können. Diese Abfragen beschreiben Teilgraphen der Abhängigkeitsbaumstrukturen, wobei weitere grammatische Einschränkungen für die Knoten eingeführt werden. Die automatische Generierung der Abfragen bzw. der Extraktionsregeln aus markierten Sätzen und die Benutzerfreundlichkeit der Software machen es möglich, schnelle generierte Anfragen über Millionen von Sätzen auszuführen und zu bewerten.
Die vorliegende Bachelorarbeit beschreibt die Anwendung Propminer, welches bei der Erstellung von solcher Regel für Personen ohne entsprechendes Wissen unterstützt und somit einen leichten Einstieg in die Welt der Informationsextraktion ermöglicht.   

Zusatzinformationen / Extras