direkt zum Inhalt springen

direkt zum Hauptnavigationsmenü

Sie sind hier

TU Berlin

Inhalt des Dokuments

Kurzinfo

Bearbeiter: Moritz Ringler

Betreuer: Fabian Hüske

Angestrebter Abschluss: Diplom

Zusammenfassung

Parallele Verarbeitungssysteme wie MapReduce oder Stratosphere bieten Schnittstellen über - in diesem Zusammenhang - niedrige Eingabesprachen. Das erfordert von einem Benutzer das Beherschen einer komplexe Programmiersprache, und dass er sich mit den zugrunde liegenden Datenflüssen auskennt. Außerdem ist ausführliches Wissen über die verwendeten Daten eine Voraussetzung, um performante Pläne zu bekommen. Im Vergleich mit klassischen relationalen Datenbanken erschwert das die Benutzung erheblich.

Wir schlagen eine zusätzliche Schicht oberhalb von Stratosphere vor, welche Anfragen in einer SQL-ähnlichen Sprache verarbeitet. Die Bestimmung der Join-Reihenfolge und die wahl der Operatoren erfolgt entlang der bekannten Optimierungen in klassischen Datenbanksystemen. Der implementierte Prototyp erlaubt es, komplexe PACT-Pläne mit duzenden Operatoren in weniger als einer Sekunde zu erzeugen. Selbst mit nur einfachen verfügbaren Statistiken findet der Optimierer relativ gute Pläne.

Zusatzinformationen / Extras