Page Content
Ein Anfrage-Prozessor für Cloudsysteme (Projekt)
Art | Termine | Raum | Dozent | Download |
---|---|---|---|---|
Projekt | Di 14 - 18 | MA
142 | Prof. Dr. Volker Markl Stephan Ewen | Ankündigung |
Inhalt:
Die Analyse großer Datenmengen
(Terabytes) wird massiv parallel durchgeführt. Die Analyseprogramme
lassen sich gut mittels funktionaler Operatoren beschreiben, da diese
Seiteneffekt frei sind und sich automatisch parallelisieren lassen.
Die Open-Source Platform Hadoop stellt ein Framework für die
Parallelisierung von Programmen basierend auf den Operatoren 'Map' und
'Reduce' zur Verfügung. Hadoop soll erweitert werden um einen oder
mehr weitere funktionale Operatoren, wie Tree oder Merge, um
mächtigere Programme abbilden zu können, bzw. verschiedene
darstellbare Programme effizienter beschreibbar zu machen. Speziell
interessieren wir uns für Programme und Operationen, wie sie
relationalen Datenbanksystemen vorkommen, z.B. relationale Joins.
Bemerkung:
Gleichzeitiger Besuch
des Seminars "Hot Topics in Information Management - Management
von graphisch-strukturierten Daten" (0434 L 453) wird für
Studierende in den Diplomstudiengängen Informatik und Technische
Informatik dringend empfohlen. Der Besuch des Seminars ist zur
Anrechnung der LV als Projekt unbedingt erforderlich.
Sofern möglich wird mit LV "Optimierte Übersetzung von
deklarativen Anfragen in funktionale Programme zur parallelen
Datenverarbeitung" kooperiert.
Max. 10
Teilnehmer/innen, vorherige Anmeldung erforderlich über
http://www.dima.tu-berlin.de [1] ab dem 01.04.2009.
Voraussetzungen:
Kenntnisse im Bereich
Datenbanken und weitergehende Kenntnisse in
Java.