Hintergrund der Arbeit
IT-Systeme werden allgemein überlebensfähig genannt wenn sie die Fähigkeit besitzen, ihre Mission innerhalb eines angemessenen Zeitraums zu erfüllen, trotz des Vorhandenseins von Fehlern, Angriffen oder anderen Störfällen (z. B. Katastrophen). Ein wichtiger Punkt ist dabei das Primat der Missionserfüllung - und nicht des Schutzes einzelner Systemkomponenten. Überlebensfähige Systeme sind daher streng mit so genannten essentiellen Diensten und Eigenschaften gekoppelt.
Von besonderem Interesse für die Untersuchung der Überlebensfähigkeit von IT-Systemen sind Fragestellungen, die sich mit der Erkennung von Störungen auseinandersetzen (z. B. intrusion detection), und Fragestellungen, die sich der "Selbstabschaltung" zum Wohle des Ganzen widmen. Dieser letzte Punkt, der "kontrollierte Selbstmord", wird in analogen Fragestellungen der Immunologie auch als Apoptose bezeichnet.
Ein System zeigt also apoptotisches Verhalten wenn seine Komponenten (nicht notwendigerweise alle Komponenten) in der Lage sind, sich aus dem Gesamtsystem (permanent oder zeitlich beschränkt) zurückzuziehen ohne die Gesamtmission zu gefährden. Dies kann entweder nach Eigenanalyse einer Gefahrenlage geschehen oder orchestriert in einem größeren Kontext.
Ziel der Arbeit
In der Theorie sind diese Konzepte trotz vieler offener Fragen nachvollziehbar. Praktische Erfahrungen zur Machbarkeit liegen aber kaum vor. So ist beispielsweise nicht klar, bis zu welchem oder ab welchem Grad Apoptose sinnvoll ist, welche Einschränkungen damit verbunden sind oder welcher Overhead damit generiert wird. Kurz: Ist Apoptose nur ein schönes Konzept oder ist sie auch sinnvoll anwendbar?
Mit dieser Arbeit sollen die praktischen Schwierigkeiten von Apoptose in verteilten Systemen besser verstanden werden. Dazu soll eine Reihe von gezielten Experimenten durchgeführt werden, die für verteilte Systeme (lokal verteilt und Grids) Aufschluss darüber geben, welche Komponenten wann, wie und unter welchen Randbedingungen "geopfert" werden können unter gleichzeitiger Aufrechterhaltung der Mission oder von Teilen der Mission. Aber welcher Teile? Lassen sich daraus Empfehlungen für Policies ableiten? Wenn ja, welche?
Neben der Konzeption (und Analyse) der Experimente umfasst die Arbeit auch die Entwicklung eines einfachen, auf den Experimenten aufbauenden Entscheidungssystems, das sowohl lokal eingesetzt werden kann (eine Komponente "begeht Selbstmord") als auch komponentenübergreifend (Komponenten werden orchestriert aus dem Gesamtsystem genommen).
Aufgabensteller:
Prof. Dr. D. Kranzlmüller
Anforderungen:
Web Services, Grundkenntnisse in Grid Computing (insbesondere Grid Security Infrastructure); Java, C
Dauer der Diplomarbeit bzw. der Masterarbeit: gemäß Studienordnung
Anzahl Bearbeiter: 1
Betreuer:
Dr. Michael Schiffers, Oettingenstr. 67, Raum E 003 (Erdgeschoß), Tel. 2180-9164
Christian Straube