Datenschutzerklärung|Data Privacy
Impressum

23.05.2011
S. Ewen

Offene Diplom-/Master-Arbeit zu Join-Algorithmen

Offene Diplom-/Master-Arbeit zum Thema moderne Join-Algorithmen

In dieser Abschlussarbeit soll ein kürzlich neu entwickelter Join-Algorithmus (G-Join) in das Stratosphere System implementiert werden. Der G-Join ist ein besonders flexibler Join-Algorithmus, der das Potenzial hat mehrere bestehende Join Algorithmen abzulösen.

Das Stratosphere System ist ein Open-Source Projekt, das gemeinsam von mehreren Universitäten im Raum Berlin/Brandenburg vorangetrieben wird. Ziel des Projektes ist es, eine einfache und effiziente Plattform für die Analyse sehr großer Mengen unstrukturierter Daten bereit zu stellen.

Die effiziente und robuste Implementierung des G-Joins für Stratosphere ist sehr anspruchsvoll - an vielen Stellen müssen noch besondere Designs entworfen werden, damit der Algorithmus seine Effizient ausspielen kann. Ein abschließender Performanz-Vergleich zu den derzeitigen Algorithmen des Systems soll ebenfalls vorgenommen werden.

Erforderlich sind gute Kenntnisse im Bereich Algorithmen & Datenstruckturen, Datenbanken und ihrer Implementierung, so wie sehr gute Java Programmierkenntnisse.

----------------------------------------------------------------

Open Diploma-/Master Thesis concerning modern Join Algorithms

In the course of this Thesis, you will implement the recently proposed G-Join algorithm into the runtime of the Stratosphere system. The G-Join is a particularly flexible join algorithm, which has the potential to replace multiple classical join algorithms.

The Stratosphere system is an Open-Source project, developed jointly by multiple Universities in the Berlin/Brandenburg area. The project aims at providing a simple and efficient platform for the analysis of large scale unstructured data.

The efficient and robust implementation of the G-Joins algorithm in Stratosphere is challenging - multiple careful additions and design need to be made to ensure its efficient behavior. A final performance evaluation, comparing the G-Join to the current state-of-the-art join algorithms in the system will be part of the thesis as well.

As a prerequisite for the thesis, you should be well familiar with algorithms and data structures, as well as database systems and their implementation. Furthermore, you need very good Java programming skills.