Intern:Project data management/AWI

Datenarchivierung am AWI
Im Auftrag des wissenschaftlichen Rates der Stiftung Alfred-Wegener-Institut (AWI) wurde vom Informationszentrum ein Konzept entwickelt, um die Primärdaten zu Publikationen des AWI zentral zu erfassen. Dieses dient u.a. der Umsetzung einer Empfehlung aus den Vorschlägen zur Sicherung guter wissenschaftlicher Praxis der DFG (PDF 135 KB). Die konsistente Erfassung von Forschungsdaten unterstützt aber auch eine verbesserte Nachnutzung wissenschaftlicher Ergebnisse, fördert die internationale Kooperation und folgt der Berliner Erklärung über offenen Zugang zu wissenschaftlichem Wissen (PDF 16 KB), nach der Forschungsergebnisse durch Nutzung des Internets im Sinne der Open Access Initiative allgemein verfügbar gemacht werden sollen.

Dem Konzept folgend werden georeferenzierte Messdaten prinzipiell mit einer Beschreibung (Metadaten) in der relationalen Datentabelle von PANGAEA abgelegt. Für Daten, die diesem Modell nicht genügen oder an anderer Stelle archiviert werden müssen, wird eine Beschreibung mit einem Verweis auf die externe Ablage angelegt. Diese muss eine Langzeitverfügbarkeit aufweisen.

Die Daten in PANGAEA sind im Internet über verschiedene Zugriffsmodule verfügbar. Für die einfache Suche mit Google-Syntax wird die Suchmaschine PangaVista empfohlen. Ein Zugriff auf Datensätze oder andere, individuell konfigurierte Inhalte in PANGAEA via Link auf beliebigen Webseiten (pers. Home Page, Projektseiten) ist einfach. Durch die Vernetzung mit anderen Systemen wird PANGAEA zukünftig auch über weitere Portale und Kataloge durchsuchbar sein, wie z.B. bereits über das GeoPortal des Bundes.

Die wissenschaftliche Qualität der Daten liegt in der Verantwortung des Autors (PI, principle investigator). Zu seinen Aufgaben gehört die Vorbereitung der Daten für den Import, die Zusammenstellung der Metadaten und die Kontrolle und Abnahme der publizierten Datensätze. Die Kuratoren leisten in diesem Prozess Unterstützung, stellen die technische Qualität sicher, importieren die Daten und nehmen Korrekturen vor.

Datenerfassung
Die Zusammenstellung umfassender Datensammlungen für eine zuverlässige Nachnutzbarkeit erfordert konsistente Formate, ein Minimum an Standards und die Verknüpfung der Daten mit allen zum Verständnis notwendigen Beschreibungen (Metadaten). Erst durch Konsistenz, Georeferenzierung und Metadaten erhalten die Primärdaten mit der Ablage im PANGAEA-Datenmodell auch einen langfristigen Mehrwert für die Nutzer.

Als Teil der Metadatengrundlage enthält PANGAEA bereits alle Stationen der POLARSTERN und HEINKE-Expeditionen (im wesentlichen auch METEOR und SONNE). Eine laufende Aktualisierung erfolgt automatisch am Ende einer Expedition durch Übernahme des Brückenstationsbuches. Ein Zugriff auf die Stationslisten einzelner Fahrtabschnitte ist möglich über das PanCore-Modul durch Eingabe des Expeditionslabels (z.B. ANT-IV/3) in das Feld Cruise oder über eEXPEDITION.

Daten zu Publikationen sollten mit dem Einreichen erfasst werden. Unter der Voraussetzung, dass die Daten spätestens vor Drucklegung archiviert werden, kann in der Publikation ein Link als Quelle für die Datensätze angegeben werden. Auf den Schiffen erhobene Daten sollen mit der Herausgabe des Fahrtberichtes archiviert werden. Ein temporärer Passwortschutz ist möglich. Zwischen ePIC und PANGAEA besteht eine Verbindung über besagten Link. Dieser wird vom Datenkurator in ePIC eingetragen, wenn die Daten verfügbar sind (Beispiel in ePIC). Unterstützung geben gern der PANGAEA 'data librarian', Hannes Grobe Tel: 1220 und der Datenkurator des AWI Rainer Sieger Tel: 1189.

Datenveröffentlichung
Zukünftig besteht die Möglichkeit Datensätze auch unabhängig von einer wissenschaftlichen Veröffentlichung zu publizieren. Voraussetzung ist die wissenschaftlich und technisch einwandfreie Qualität der Daten, die in einem ergänzenden Text dokumentiert wird. Jede Datenpublikation erhält eine DOI (Digital Object Identifier) - wie in Verbindung mit Publikationen bereits verbreitet - und einen Eintrag in den Bibliothekskatalog der TIB (Beispiel). Daten sind damit nicht nur langfristig gesichert und verfügbar, sondern im Sinne einer Publikation zitierfähig. Es wird in der HGF diskutiert, für Datenveröffentlichungen ein Journal mit Peer Review einzurichten und damit diese ähnlich einer Publikation zu werten.

WDC-MARE
Das AWI betreibt gemeinsam mit dem MARUM das World Data Center for Marine Environmental Sciences (WDC-MARE) als Mitglied des WDC-Systems von ICSU. WDC-MARE übernimmt in internationalen Projekten das Datenmanagement unter Nutzung des Systems PANGAEA für die Archivierung der Projektdaten; nach Abschluss eines Projektes ermöglicht die Reihe WDC-MARE Reports eine Veröffentlichung der Daten auf CD. Die WDC-MARE Reports werden über den ca. 500 Bibliotheken und Adressen umfassenden Verteiler der Berichte zur Polar und Meeresforschung verteilt und stehen auch für die Veröffentlichung umfassender Datensammlungen des AWI zur Verfügung.

Links

 * Wiki zum Pflegen der Geräteakten von Sensoren in den Forschungsplattformen des AWI
 * Polarstern cruise list
 * Tabelle mit Zeitreihen (LTO) und Massendaten (Textdatei auf .../www/curator/LTO)
 * Anleitung Stationsliste