TU Berlin

Fachgebiet Datenbanksysteme und InformationsmanagementStratosphere: Information Management above the Clouds

Logo FG DIMA-new  65px

Inhalt

zur Navigation

Stratosphere

Lupe

Stratosphere ist eine von der DFG geförderte Forschergruppe, in der fünf Fachgebiete an drei Universitäten in Berlin und Potsdam das Thema Massiv-parallele Datenverarbeitung in der Cloud aus virtualisierten Rechnern untersuchen. Ziel des Systems ist es, die Analyse von sehr großen Datenmengen, wie sie in Unternehmen und in der Wissenschaft (z.B. Klimaanalyse, Life Sciences) anfallen, zu vereinfachen.

In seiner ersten Version wurden für Stratosphere die Nephele-Ausführungsengine, und das PACT Programmier-Modell entwickelt.  

Nephele ist ein massiv-paralleler Datenflussprozessor, der auf einer virtualisierten on-demand Infrastruktur operiert. Das parallele PACT Programmiermodell stellt eine ausdrucksstarke Abstraktion zur Entwicklung paralleler Datenverarbeitungsprogramme bereit.  

PACT erweitert das klassische MapReduce Programmiermodell um effiziente Konstrukte für die Kombination von mehreren Datensätzen (Joins, Cartesische Produkte, Zeitreihenanalysen) und weiteren hilfreichen Konzepten zur Entwicklung paralleler Programme. PACT Programme werden von einem Compiler optimiert, in Datenflüsse übersetzt und massiv-parallel von der Nephele-Engine ausgeführt.  

Stratosphere ist open-source für Forschung und Lehre verfügbar. Es bietet Nutzern die Möglichkeit einfach parallele Datenverarbeitungsprogramme zu spezifizieren. Systementwicklern aus dem Kontext der parallelen Datenverarbeitung und anderen Interessierten bietet es durch seine klare Architektur die Möglichkeit es einfach weiterzuentwickeln, oder anzupassen.  

Weitere Informationen zu Stratosphere finden Sie unter http://www.stratosphere.eu

Navigation

Direktzugang

Schnellnavigation zur Seite über Nummerneingabe