direkt zum Inhalt springen

direkt zum Hauptnavigationsmenü

Sie sind hier

TU Berlin

Inhalt des Dokuments

Ein Anfrage-Prozessor für Cloudsysteme (Projekt)

Termine/Räume
Art
Termine
Raum
Dozent
Download
Projekt
Di 14 - 18
MA 142
Prof. Dr. Volker Markl
Stephan Ewen
Ankündigung


Inhalt:

Die Analyse großer Datenmengen (Terabytes) wird massiv parallel durchgeführt. Die Analyseprogramme lassen sich gut mittels funktionaler Operatoren beschreiben, da diese Seiteneffekt frei sind und sich automatisch parallelisieren lassen. Die Open-Source Platform Hadoop stellt ein Framework für die Parallelisierung von Programmen basierend auf den Operatoren 'Map' und 'Reduce' zur Verfügung. Hadoop soll erweitert werden um einen oder mehr weitere funktionale Operatoren, wie Tree oder Merge, um mächtigere Programme abbilden zu können, bzw. verschiedene darstellbare Programme effizienter beschreibbar zu machen. Speziell interessieren wir uns für Programme und Operationen, wie sie relationalen Datenbanksystemen vorkommen, z.B. relationale Joins.

Bemerkung:

Gleichzeitiger Besuch des Seminars "Hot Topics in Information Management - Management von graphisch-strukturierten Daten" (0434 L 453) wird für Studierende in den Diplomstudiengängen Informatik und Technische Informatik dringend empfohlen. Der Besuch des Seminars ist zur Anrechnung der LV als Projekt unbedingt erforderlich.

Sofern möglich wird mit LV "Optimierte Übersetzung von deklarativen Anfragen in funktionale Programme zur parallelen Datenverarbeitung" kooperiert.

Max. 10 Teilnehmer/innen, vorherige Anmeldung erforderlich über http://www.dima.tu-berlin.de ab dem 01.04.2009.

Voraussetzungen:

Kenntnisse im Bereich Datenbanken und weitergehende Kenntnisse in Java.

Zusatzinformationen / Extras

Quick Access:

Schnellnavigation zur Seite über Nummerneingabe

Auxiliary Functions