Intern:Project data management/Sonne

FS SONNE - Datenarchivierung und -publikation
Nach den DFG-Regeln zur guten wissenschaftlichen Praxis (link), die in Deutschland von allen Forschungseinrichtungen und Universitäten akzeptiert und unterschrieben wurden, sind Authoren verpflichtet Primärdaten zu einer Publikation in einem gesicherten System zu archivieren. Ist dieses System im Internet verfügbar, erfüllt die Archivierung gleichzeitig die Empfehlung der Berliner Erklärung zukünftig Forschungsergebnisse durch Nutzung des Internets im Sinne der Open Access Initiative allgemein verfügbar zu machen.

Den Nutzern der deutschen Forschungsschiffe steht das von AWI/MARUM betriebene Informationssystem PANGAEA zur Verfügung. PANGAEA erfasst georeferenzierte Daten in einer relationalen Datenbank, auf die im Internet zugegriffen werden kann. Offiziell sind die Daten damit auch am World Data Center for Marine Environmental Sciences (WDC-MARE) archiviert.

Suche, Nachnutzbarkeit und Zusammenstellung umfassender Datensammlungen erfordert konsistente Formate, Standards und die Verknüpfung der Daten mit allen zum Verständnis notwendigen Beschreibungen (Metadaten). Neben der langfristigen und allgemeinen Verfügbarkeit erhalten die Daten durch die Ablage im PANGAEA-Datenmodell einen Mehrwert für die wissenschaftliche Gemeinschaft. Die Vorbereitung der Daten zur Erfassung und die Qualitätskontrolle nach der Veröffentlichung im Internet ist Aufgabe des PI (Principle Investigator) und Teil des vom BMBF/PTJ geförderten Projektes.

Die Erfassung erfolgt in zwei Schritten:

Stationslisten

Nach Beendigung einer Expedition liefert der Fahrtleiter eine Stationsliste, die alle Aktivitäten einer Reise beinhaltet. Die Tabelle sollte weitgehend dem Importformat (Formblatt) entsprechen, mit dem Standardheader versehen sein und im ASCII-Format eingereicht werden. Stationen haben eine Position mit Datum/Uhrzeit, Profile haben zwei für Anfangs- und Endpunkt. PANGAEA enthält einen wesentlichen Teil der SONNE-Stationen (ca. 15 000). Ein Zugriff auf die Stationsdaten zu einzelnen Reisen ist möglich über PanCore durch Eingabe des Expeditionslabels (z.B. SO119) in das Feld Cruise.

Daten

Die auf einer Reise erhobenen Daten (z.B. XBT, CTD, Auswertungen, Beobachtungen, Logging, Fotos, Filme, Beschreibungen und Dokumentationen jeder Art, bathymetrische und seismische Daten) können nach abschliessender Validierung jederzeit in PANGAEA archiviert werden, spätestens sollten sie jedoch in Verbindung mit einer Publikation erfasst werden. Ein temporärer Passwortschutz ist möglich. Grundsätzlich sollen alle Daten zu Publikationen mit dem Einreichen erfasst werden, jeweils verknüpft mit entsprechenden Metadaten (Parameter mit Einheit, Zitat, PI, Projekt, Methode, Kommentare). In einer Publikation kann der genaue Link auf die Datensätze angegeben werden (z.B. http://www.pangaea.de/PangaVista?query=@Ref22648), unter der Voraussetzung, dass die Daten vor Drucklegung in PANGAEA importiert wurden.

Datenpublikation
Zukünftig besteht die Möglichkeit Datensätze unabhängig von einer wissenschaftlichen Veröffentlichung zu publizieren. Die Authorenliste ergibt sich aus den PIs, kann aber individuell angepasst werden. Der Titel kann frei vergeben werden, der Herausgeber ist PANGAEA. Voraussetzung ist die wissenschaftliche und technische Qualität der Daten, die in einem ergänzenden Text zu dokumentieren ist. Jede Datenpublikation erhält eine DOI (Digital Object Identifier) - wie in Verbindung mit Publikationen bereits verbreitet - und einen Eintrag in den Katalog der TIB. Sie ist damit nicht nur langfristig gesichert und verfügbar, sondern im Sinne einer Publikation zitierfähig. Es wird diskutiert, für Datenveröffentlichungen ein Peer Review einzurichten und ihnen damit den Status einer vollwertigen Publikation zu geben.

Datenzugriff
Eine Suche im Gesamtdatenbestand ist durch die Suchmaschine von Pangaea (mit google Syntax) gewährleistet. Zusätzlich besteht die Möglichkeit eine individuelle Auswahl von Datensätzen auf Webseiten (Instituts-, Pojektseiten, persönliche Homepage) per dynamischem Link verfügbar zu machen (Direct download interface). Die Extraktion beliebiger Teilmengen von Metadaten ermöglicht das Advanced retrieval tool (ART) und von Daten das Data warehouse (nur für angemeldete Nutzer).

Anprechpartner und Adressat für die Erfassung von Stationslisten und Daten ist Dr. Hannes Grobe am AWI, Tel: 0471 4831 1220, mailto:hgrobe@pangaea.de

Dr. Barbara Tanner, 15. März 2004 BMBF/Projektträger Jülich (PTJ)