Abstract:
Analysis of biological data is complex and requires highly flexible analysis tools. Each of these tools generates vast amounts of biological data. In spite of recent advances in workflow basedÂ
data analysis, little effort has been made in the development of new mechanism for theÂ
automated storage, integration and management of the flow of analysis data. Â
The reproducibility of scientific experiments is one of the most important characteristics inÂ
analysis tools. However, currently available analysis tools have only limited provenance support.Â
The aim of this work is to develop a data management framework (Portable Project Management System) that is optimized to manage, store, integrate and secure the data stream generated during entire analysis processes. A complete recording of the processes is of veryÂ
high scientific importance.Â
The Portable Project Management System (PPMS©) Server was developed as a Soap based WebÂ
Service. This system supports multiple analysis tools; special focus was set on compatibility withÂ
the ARC Analysis Platform. In addition to remote usage mechanism, local storage mechanismsÂ
for offline usage are also supported. Â
The system contains a project model which defines the constraints to pack all analysis data. ItÂ
further has an integrated provenance support which caters for the logging of all the executed processes. A special feature records parameter settings from all analysis runs, and thus enables to rerun legacy pipelines. Â
Finally, as the PPMS© Server is offered as Soap based Web Service, it is accessible to other systems, independent of the platform used.