direkt zum Inhalt springen

direkt zum Hauptnavigationsmenü

Sie sind hier

TU Berlin

Inhalt des Dokuments

Kurzinfo

Bearbeiter: Oresti Konomi

Betreuer: Alan Akbik

Zusammenfassung

Informationsstrukturierung ist ein wichtiges Werkzeug zur Aufbereitung von unstrukturierten Daten, die unter anderem in Form von Texten vorliegen.
Die modernen Informationsstrukturierungssysteme müssen sowohl mit tagtäglich wachsenden Datenmenge skalieren als auch mit besserer Qualität des Ergebnisses aufwarten können. In dieser Ausarbeitung wird daher ein Konzept vorgestellt, wie solch ein System aussehen könnte. Hierbei wird die Verbesserung der Qualität des Ergebnisses auf dem Wege der Nutzung von lexiko-syntaktischen Pattern angestrebt, kombiniert mit der horizontaler Skalierung. Schlussendlich wird anhand von Testreihen ermittelt, wie gut die gewählte Persistenzform sich gegenüber dem RDF-Datenmodell behaupten kann und wie sich die horizontale Skalierung auf die Ausführungszeiten auswirkt. 

Zusatzinformationen / Extras