Fachbereich Informatik
Refine
H-BRS Bibliography
- yes (4)
Document Type
- Bachelor Thesis (3)
- Master's Thesis (1)
Year of publication
- 2007 (4) (remove)
Language
- German (4) (remove)
Has Fulltext
- no (4)
Grid Infrastrukturen sind heute in der Lage, auch große Datenmengen verteilt zu verarbeiten. Ein Anwendungsgebiet, das davon profitiert, ist das Textmining. Es zeichnet sich vor allem durch die große Anzahl voneinander unabhängiger Teiljobs aus, in die eine Aufgabe zerlegt werden kann. Um die Gesamtlaufzeit bis zur Fertigstellung eines Textmininglaufes für einen großen Datenbestand zu optimieren, ist Load-Balancing unerlässlich. Dafür muss abgeschätzt werden, wie lange eine Ressource für die Lösung eines Teilproblems benötigt. Diese Abschätzungen beruhen auf den Aufzeichnungen vorangegangener Textminingverarbeitungen. Sind darüber noch keine Daten vorhanden, muss die Laufzeitvorhersage anhand der Leistungsfähigkeit der Hardware einer Ressource prognostiziert werden. Wir stellen in dieser Arbeit Methoden vor, mit denen die Laufzeit für Textmining-Applikationen mittels historischer Daten und Hardwareeigenschaften vorhergesagt werden kann. Dabei nutzen wir Methoden der Statistik und des maschinellen Lernens, um eine Prognose zu berechnen. Anschließend wird ein Dienst vorgestellt, der eine Laufzeitvorhersage im Grid anbietet. Er kann auch für andere Anwendungsgebiete als das Textmining eingesetzt werden und ist in der Lage, Informationen über die Laufzeiten von Jobs auf den Ressourcen abzurufen. Dazu nutzt er bereits vorhandene Dienste der Grid-Middleware und kann sich so dynamisch in bestehende Strukturen eingliedern.
Heutige Grid-Systeme sind in der Lage dem Nutzer verschiedenste Ressourcen einfach, transparent und sicher zur Verfügung zu stellen. Für die Ausführung von komplexen Workflows wird eine Advance Reservation benötigt, welche die Ausführung der einzelnen Workflowelemente zu vorher berechneten oder festgelegten Zeitpunkten ermöglicht. Durch die Advance Reservation werden die benötigten Ressourcen auf den Grid-Sites reserviert. In der von der Fraunhofer Gesellschaft eingesetzten Grid-Middleware-Software UNICORE wird eine solche Reservierung von Ressourcen bisher nicht unterstützt. Um die Reservierung in einem UNICORE Grid zu ermöglichen und die Co-Allokation von Ressourcen vorzunehmen, wurde im VIOLA Projekt der MetaScheduling Service (MSS) entwickelt. Über lokal auf den Grid-Ressourcen installierte Adapter kann der MSS Statusinformationen abfragen und Reservierungen vornehmen. Die Adapter sind als Webservice implementiert, was eine komplexe Installation und Konfiguration erfordert, da die Adapter Zugriff auf das lokale System benötigen. Durch eine doppelte Benutzerverwaltung und einer zur UNICORE Grid-Middleware parallelen Kommunikation wird die Anfälligkeit für Fehler erhöht.
In einem Grid steht Benutzern mit entsprechendem Zugang eine Vielzahl verteilter Ressourcen zur Verfügung. Die daraus entstehenden wirtschaftlichen und technischen Vorteile rechtfertigen die Portierung von bestehenden Desktop-Anwendungen. Die vorliegende Arbeit befasst sich mit der Fragestellung, welche Einflussfaktoren bei der Portierung von Desktop-Anwendungen in ein Grid eine Rolle spielen können und wie diese in Hinblick auf die Machbarkeit zu bewerten sind. Basierend auf den zugrunde liegenden Softwarearchitekturen werden Architekturmerkmale von Desktop-Anwendungen identifiziert und Hypothesen darüber entwickelt, welche Aspekte den Portierungsprozess beeinflussen. Am Beispiel der Portierung der Anwendung „DataFinder“ der Abteilung Verteilte Systeme und Komponentensoftware des DLR werden die entwickelten Hypothesen überprüft. Die Erkenntnisse aus der Beispielportierung werden ausführlich dargestellt und anschließend kritisch diskutiert.