Web-Based Science Gateways for Structural Bioinformatics

DSpace Repository


Dateien:

URI: http://nbn-resolving.de/urn:nbn:de:bsz:21-opus-67822
http://hdl.handle.net/10900/49863
Dokumentart: PhDThesis
Date: 2013
Language: English
Faculty: 7 Mathematisch-Naturwissenschaftliche Fakultät
Department: Informatik
Advisor: Kohlbacher, Oliver (Prof. Dr.)
Day of Oral Examination: 2013-04-10
DDC Classifikation: 004 - Data processing and computer science
Keywords: Portal , Bioinformatik
Other Keywords: Science Gateway , Grid- und Cloud-Computing , Sicherheit , Strukturbioinformatik
Grid and cloud computing , Security , Structural bioinformatics
License: http://tobias-lib.uni-tuebingen.de/doku/lic_mit_pod.php?la=de http://tobias-lib.uni-tuebingen.de/doku/lic_mit_pod.php?la=en
Order a printed copy: Print-on-Demand
Show full item record

Inhaltszusammenfassung:

In der Strukturbioinformatik werden rechnergestützte Methoden angewandt, um Molekularstrukturen zu analysieren und modellieren. Diese Methoden befassen sich mit daten- und rechenintensiven Problemen, die für Datenanalysen in annehmbarer Zeit den Einsatz von Hochleistungsrechnern erfordern. Dadurch sind Anwendungen in der Strukturbioinformatik ideal geeignet für den Einsatz auf sogenannten Grid- und Cloud-Rechnerinfrastrukturen. Diese verteilten Rechnerinfrastrukturen bieten Zugang zu Hochleistungsrechnern und Diensten über organisatorische Grenzen hinweg. Allerdings sind die Interaktionsmöglichkeiten mit den Rechnerinfrastrukturen nicht benutzerfreundlich und die Bedienung der komplexen Methoden der Strukturbioinformatik erfordert viel Erfahrung. Zudem führen Benutzer nicht nur einzelne Jobs sondern primär Workflows zur Datenanalyse aus. Um einen intuitiven Zugang zu Anwendungen auf verteilten Rechnerinfrastrukturen zu erreichen, werden Science Gateways eingesetzt. Im Allgemeinen bieten sie einen einheitlichen Zugang zu verschiedensten Programmen eines spezischen Anwendungsgebiets an und verbergen die komplexe unterliegende Infastruktur vor dem Benutzer. Webbasierte Science Gateways zeichnen sich zusätzlich dadurch aus, dass sie auf der Benutzerseite lediglich einen Computer mit Internetzugang und einen Webbrowser erfordern. Entwickler solcher Science Gateways unterstützen die Benutzer mit voreingestellten Bedienoberflächen, die für das jeweilige Anwendungsgebiet angepasst sind. Der Einsatz von Science Gateways hat zum Ziel, die Bedienung von Software benutzerfreundlicher zu gestalten. Der Fokus dieser Arbeit liegt auf workflowfähigen Grid-Portalen, die den Benutzern die intuitive Verwaltung von Workflows auf verteilten Rechnerinfrastrukturen ermöglichen. Es werden vier Kernaspekte von workflowfähigen Grid-Portalen in dieser Arbeit adressiert: die Sicherheit in Portalen mit Zugriff auf verteilte Rechnerinfrastrukturen, Job- und Workflowverwaltung, die Migration von Workflows zwischen bestehenden Science Gateways und die automatische Generierung von Portlets für Workflows. Wir haben ein granulares Sicherheitskonzept entwickelt, das alle Ebenen der beteiligten Infrastruktur umfasst. Wir konzentrieren uns insbesondere auf eine rollenbasierte Benutzerverwaltung für die rechnergestützte Chemie-Community und die Verwaltung von Berechtigungsdateien. Das workflowfähige Grid-Portal WS-PGRADE (Web Services Parallel Grid Runtime and Developer Environment) ist für den Einsatz von SAML (Security Assertion Markup Language) erweitert worden. Die erzeugten Berechtigungsdateien bilden die Grundlage für die Authentifizierungsprozesse in den angebundenen verteilten Rechnerinfrastrukturen. Wir haben uns aufgrund der skalierbaren service-orientierten Architektur und der zugehörigen Workflow-Engine für UNICORE 6 als Grid-Middleware entschieden. Für die Integration mit WS-PGRADE wurde ein sogenannter Submitter implementiert, über den Jobs an UNICORE 6 geschickt werden können. Ausserdem ermöglicht er das Aktivieren von UNICORE-Workflows in WS-PGRADE und somit Workflow-Interoperabilität. Benutzer werden in die Lage versetzt, UNICORE-Workflows in WS-PGRADE wiederzuverwenden. Die Anwendungsschnittstelle Application Specific Module (ASM) erleichtert Entwicklern die Erstellung von workflowfähigen Portlets in WS-PGRADE. Die Migration von Workflows wird mit einem Programm realisiert, das Galaxy-Workflows in WS-PGRADE-Workflows konvertiert. Galaxy ist ein workflowfähiges Portal für Cloud-Rechnerinfrastrukturen und für lokale Hochleistungsrechner. Es ist weitverbreitet, hat jedoch den Nachteil, das es keine Verbindungsmöglichkeiten zu Grid-Rechnerinfrastrukturen bietet. Deswegen haben wir ein Programm implementiert, das Galaxy-Workflows als WS-PGRADE-Workows exportiert, die sehr einfach von Benutzern importiert und dadurch mit wenig Aufwand wieder benutzt werden können. Ausserdem wird ein Konzept zur automatischen Generierung von graphischen Benutzerschnittstellen für WS-PGRADE über die Software Rapid vorgestellt. Rapid versetzt Benutzer in die Lage, intuitive graphische Benutzerschnittstellen zu realisieren ohne im klassischen Sinne zu programmieren. Entwickler können automatisch XML-Dateien in vollfunktionale Portlets für WS-PGRADE konvertieren. In dem Science Gateway des Projekts MoSGrid (Molecular Simulation Grid) sind die Konzepte und Implementierungen dieser Arbeit umgesetzt. Das Science Gateway stellt einen Anwendungsfall für ein Science Gateway im Bereich der Strukturbioinformatik dar und bietet eine vollständige Lösung für die Anwender von molekularen Simulationen.

Abstract:

Structural bioinformatics applies computational methods to analyse and model three-dimensional molecular structures. These methods address data-intensive and compute-intensive problems, which demand high-performance computing (HPC) to allow data analysis in an acceptable time. Thus, structural bioinformatic applications are ideal candidates for grid and cloud computing infrastructures, so-called DCIs (Distributed Computing Infrastructures). DCIs provide access to HPC facilities and services across organisational boundaries. However, the usability of DCIs is limited and the use of the complex methods in structural bioinformatics requires a lot of experience. In addition, users mainly process and analyse data not only via single jobs but via workflows. An approach to offer easy and intuitive access to applications on DCIs are science gateways. In general, a science gateway provides a single point of entry to a set of tools and data of a specific application domain while hiding the complex underlying infrastructure. Web-based science gateways are additionally characterised by only requiring a computer connected to the Internet and an installed web browser on the users' side. Developers of such gateways support the users with pre-configured user interfaces targeted for a specific application domain. The overall goal for creating science gateways is to increase the usability of applications. This work is focused on workflow-enabled grid portals that are specific web-based science gateways supporting the management of workflows on DCIs. Four major aspects in the context of workflow-enabled grid portals are addressed in this work: security in portals with underlying DCIs, job and workflow management, migration of workflows between diverse science gateways, and the automatic creation of portlets for workflow management. We have developed a granular security concept, which encloses all layers of the involved infrastructure: the user interface, the high-level middleware layer, the grid middleware layer, and the HPC facilities. We are especially focused on the role-based user management concerted for the molecular simulation community and the credential management. The workflow-enabled grid portal WS-PGRADE (Web Services Parallel Grid Runtime and Developer Environment) has been extended for the use of SAML (Security Assertion Markup Language) for trust delegation. The created credential files set the stage for the authentication processes in the connected DCIs. We chose to use DCIs connected via the grid middleware UNICORE 6 because of UNICORE's scalable service-oriented architecture and its workflow engine. For the integration in WS-PGRADE, we implemented a plugin, a so-called submitter, which allows invoking jobs on UNICORE 6. The submitter additionally supports UNICORE workflows to be invoked via WS-PGRADE and thus provides workflow interoperability. Users can seamlessly re-use existing UNICORE 6 workflows in WS-PGRADE. The Application Specific Module (ASM) has been developed to simplify the implementation of workflow-enabled portlets extending WS-PGRADE. The migration of workflows is achieved by a tool for the export of Galaxy workflows to WS-PGRADE workflows. Galaxy is a workflow-enabled portal for cloud infrastructures and for local HPC facilities. It is widely used but has the disadvantage of lacking the possibility to connect to grid infrastructures. Therefore, we implemented the export of Galaxy workflows to WS-PGRADE workflows, which can be easily imported by the users in WS-PGRADE. Furthermore, this work presents a concept for automatically generating graphical user interfaces for a WS-PGRADE portal via the software framework Rapid. Rapid allows creating portlets without programming in the traditional sense. Developers are enabled to automatically convert XML files to a fully functional portlet for WS-PGRADE. The concepts and implementations in this work are applied in the science gateway of the project MoSGrid (Molecular Simulation Grid). It forms a use case for a science gateway for structural bioinformatics and provides a complete solution for the molecular simulation community.

This item appears in the following Collection(s)