Page Content
Ein Anfrage-Prozessor für Cloudsysteme (Projekt)
Art | Termine | Raum | Dozent | Download |
---|---|---|---|---|
Projekt | Di 14 - 18 | MA 142 | Prof. Dr. Volker Markl Stephan Ewen | Ankündigung |
Inhalt:
Die Analyse großer Datenmengen (Terabytes) wird massiv parallel durchgeführt. Die Analyseprogramme lassen sich gut mittels funktionaler Operatoren beschreiben, da diese Seiteneffekt frei sind und sich automatisch parallelisieren lassen. Die Open-Source Platform Hadoop stellt ein Framework für die Parallelisierung von Programmen basierend auf den Operatoren 'Map' und 'Reduce' zur Verfügung. Hadoop soll erweitert werden um einen oder mehr weitere funktionale Operatoren, wie Tree oder Merge, um mächtigere Programme abbilden zu können, bzw. verschiedene darstellbare Programme effizienter beschreibbar zu machen. Speziell interessieren wir uns für Programme und Operationen, wie sie relationalen Datenbanksystemen vorkommen, z.B. relationale Joins.
Bemerkung:
Gleichzeitiger Besuch des Seminars "Hot Topics in Information Management - Management von graphisch-strukturierten Daten" (0434 L 453) wird für Studierende in den Diplomstudiengängen Informatik und Technische Informatik dringend empfohlen. Der Besuch des Seminars ist zur Anrechnung der LV als Projekt unbedingt erforderlich.
Sofern möglich wird mit LV "Optimierte Übersetzung von deklarativen Anfragen in funktionale Programme zur parallelen Datenverarbeitung" kooperiert.
Max. 10 Teilnehmer/innen, vorherige Anmeldung erforderlich über http://www.dima.tu-berlin.de ab dem 01.04.2009.
Voraussetzungen:
Kenntnisse im Bereich Datenbanken und weitergehende Kenntnisse in Java.