Talk:STD-DOI

Bei Bewilligung und Zwischenbegutachtung wurde von der DFG und den Reviewern ausdrücklich gewünscht, dass man für den neuen Dienst und die Archivierungsmöglichkeit wissenschaftlicher Daten werben möge. Im Folgenden werden Initiativen gelistet, mit denen der Dienst zur Archivierung von Daten angeboten wurde:

2009
 * KoWa, Berlin
 * CO2 BMBF workshop, Kiel

2008
 * AG Daten der geowissenschaftlichen Senatskommissionen der DFG
 * Zeitschriften Polar Biology und Zeitschrift für Geomorphologie

2007
 * Geowissenschaftliche Fachgesellschaften/Fachzeitschriften in Deutschland
 * Deutsche Gesellschaft für Polarforschung/Polarforschung
 * Deutsche Geologische Gesellschaft/Zeitschrift der DGG
 * Deutsche Geophysikalische Gesellschaft/Geophysical Journal International
 * Deutsche Quartärvereinigung/Quaternary Science Journal
 * Paläontologische Gesellschaft/Paläontologische Zeitschrift
 * Geologische Vereinigung/International Journal of Earth Sciences
 * Deutsche Mineralogische Gesellschaft/European Journal of Mineralogy
 * Weikinn-Datensatz, Leibniz-Instituts für Troposphärenforschung, Leipzig

2006
 * DWD Historische Wetteraufzeichnungen
 * KDM Vorschlag gemeinsame Datenarchivierung der Partner Institute
 * GMIT Artikel Der Wert der Daten liegt in ihrer Nutzung
 * Angebot ans UFZ auf Anfrage Olaf Büttner zu Daten der Limnologie

2005
 * DFG Antrag ...Eurasian Arctic Ocean/Compilation of existing data (ARCOD)
 * DOD (mehrere informelle Kooperations-Angebote seit 1996)

2004
 * DFG SPP1054 Evolution of the System Earth in the Late Palaeozoic, Empfehlungen der Gutachter zur Datenarchivierung

2001
 * BMBF/Geotechnologien - Antrag für ein nationales geophysikalisches Datenzentrum im Rahmen des Schwerpunktes Informationssysteme im Erdmanagement

2000
 * GEOMAR (Brief an Direktor)
 * BMBF/Projektträger/DEKLIM (per Brief Angebot das Datenmanagement für alle DEKLIM Projekte zu übernehmen)

1999
 * DFG/BMBF Antrag Gashydrate (Datenmanagement für den Förderschwerpunkt)
 * DFG/BMBF Antrag PanMap (Visualisierungs-Client für Daten aus Pangaea)
 * DFG/BMBF Antrag JGOFS (Datenmanagement für den Förderschwerpunkt)

1997
 * IOW für BMBF Projekt (abgelehnt da zu teuer)

1995
 * GFZ Seesedimente (Negendank)
 * PEP III Bierville

Zitate in ePIC
http://epic.awi.de/epic/Main?list&page=department&group=awi-2005-050410

Projektliste

 * http://www.pangaea.de/projects/

Pangaea Beitrag zum Abschlussbericht
Abschlußbericht DFG-Projekt STD-DOI - Beitrag von PANGAEA mit WDC-MARE Hannes Grobe/AWI	 & Michael Diepenbroek/MARUM 2009-08-28

AP2 Verankerung der Datenpublikation in den Produktionsabläufen der Datenzentren

Die ursprünglich im Projekt vorgesehene reine Datenpublikation mit Zitat, DOI und Eintrag in den Bibliothekskatalog der TIB ist beim derzeitigen Stellenwert einer Datenarchivierung der Wissenschaft nicht vermittelbar. Ein entsprechender Wandel könnte unter der Voraussetzung dauerhafter Unterstützung durch alle am Wissenschaftssystem Beteilligte im Verlauf einer Generation möglich sein. Zur Zeit ist die Archivierung von Daten nicht Standard im wissenschaftlichen Arbeits- und Publikationsprozess. Es zählt nahezu ausschließlich die Publikation mit peer-review in einer etablierten Fachzeitschrift, bevorzugt mit ISI-Referenzierung. Eine Verwendung von Datenzitaten in Publikationslisten z.B. für Begutachtungen ist bisher nicht möglich, da im derzeitigen Begutachtungssystem nicht vorgesehen und damit nicht akzeptiert. Zur Integration der „Datenpublikation“ in den etablierten Publikationsprozess wurde die Zeitschrift Earth System Science Data (ESSD) des Open Access Verlages Copernicus gegründet - eine Zeitschrift mit peer-review (und zukünftig ISI) ausschließlich zur Veröffentlichung umfassender Datensammlungen. Im ersten Beitrag wurden die Ozondaten der Antarktisstation der DDR veröffentlicht, die Archivierung und Publikation erfolgte im Rahmen des STD-DOI Projektes über PANGAEA (doi:10.1594/pangaea.547983).

Bisher haben nur in Einzelfällen Wissenschaftler um eine reine Datenpublikation, verfügbar über Datenzentrum und Bibliothekskatalog, gebeten, z.B. bei der Archivierung umfassender Datensammlungen, die in der vorliegenden Form (noch) nicht in einer wissenschaftlichen Publikation Verwendung finden können/sollen. Das Zitat einer Datenpublikation beinhaltet neben der DOI die Autoren, Jahr, Titel, als Quelle das entsprechende Institut und verpflichtend ein Abstract. (doi:10.1594/pangaea.713861). Häufigere Verwendung findet der Typ „Datenpublikation“ bei der Herausgabe von Kartenwerken, die nicht in gedruckter Form, sondern ausschließlich elektronisch publiziert und verbreitet werden (doi:10.1594/pangaea.138786).

Ein von der Wissenschaft akzeptierter und zunehmend verwendeter Datenpublikationstyp ist das Supplement zu einer Publikation in einer wissenschaftlichen Zeitschrift. In Gespächen mit Editoren wurde deutlich gemacht, dass die Primärdaten auf denen eine wissenschaftliche Aussage in einer Publikation basiert, integraler Bestandteil derselben (und des zugehörigen peer-review) ist. Damit sollte das Datenzitat nicht den Anschein einer eigenständigen Entität erwecken; in der Citation wird dies durch eine entsprechende Formulierung deutlich (doi:10.1594/pangaea.711130). Seit der automatischen DOI-Registrierung wurden über Pangaea 1500 Datensupplements verfügbar gemacht, mit Eintrag in den Katalog der TIB und damit anderer Bibliotheksverbünde.

Technisch sind seit Anfang 2009 die Datenbibliothek Pangaea und der Katalog des Verlages Elsevier gekoppelt (http://www.sciencedirect.com). Über die mit den Datensätzen archivierte DOI der Publikation werden Supplements in Pangaea in ScienceDirect als solche kenntlich und per Link verfügbar gemacht (Beispiel einer Publikation in ScienceDirect mit link auf Supplement in Pangaea doi:10.1016/j.marmicro.2007.09.002 - nur sichtbar, wenn Volltextzugang zur Zeitschrift gewährleistet ist!). Es wird angestrebt diesen Dienst, der bisher nur für ScienceDirect-Kunden verfügbar ist, auch für Gastnutzer zu öffnen. Primärdaten zu Publikationen sollen nach einer Erklärung der Wissenschaftsverlage im Open Access verfügbar sein (Brussels Declaration on STM Publishing).

Der Produktionsablauf bei der Datenarchivierung mit Pangaea ist etabliert. Im Internet ist ausgewiesen, dass jedem die Datenbibliothek zur (bisher freien) Nutzung zur Verfügung steht. Eingehende Daten werden von einem Kurator archiviert, der Autor wird über ihre Verfügbarkeit per DOI informiert und um Überprüfung gebeten. Die Datensätze werden ggf. korrigiert, bis sie den Vorstellungen des Autors entsprechen. Automatisch wird 4 Wochen nach der letzten Änderung die DOI registriert und das Zitat in den Katalog der TIB eingetragen. Diese System sieht vor, dass die auf ein Datensupplement verweisende DOI in die Publikation eingetragen wird um dem Leser einen zuverlässigen und direkten Zugriff auf die Primärdaten zu ermöglichen. Leider erfolgt die Datenlieferung meist erst, nachdem die Veröffentlichung erschienen ist; auf die Daten verweist eine Anmerkung zur Pangaea-Domain.

Der Umfang eingehender Archivierungsanfragen (ca. 1/Woche), die Qualität der Daten/Metadaten und die Kooperationsbereitschaft seitens der Wissenschaft zeigen, dass Datenarchivierung weit davon entfernt ist, Bestandteil der wissenschaftlichen Arbeit zu sein.

AP4 Erprobung der Geschäftsmodelle und Beirat

Das Geschäftsmodel sieht langfristig vor, dass der Aufwand für die Datenarchivierung dem Datenlieferanten in Rechnung gestellt wird. Dies entspricht dem Model von ,page charges‘ bei einigen Wissenschaftsverlagen, die für die Veröffentlichung einer Publikation 40 bis 150 $ pro Seite in Rechnung stellen. Die Etablierung der Datenarchivierung als integraler Bestandteil der Wissenschaft wird noch Jahre dauern, so daß zur Laufzeit des Projektes eine Umsetzung mit Test dieses Models auf Daten nicht möglich war. Der Aufwand für die Datenarchivierung konnte aus dem im Projekt entwickelten Workflow sehr wohl abgeschätzt werden.So erfordert im Mittel die Archivierung supplementärer Daten zu einer Publikation einen halben Arbeitstag eines als Datenkurator beschäftigten Geowissenschaftlers. Dies wird in den meisten Fällen deutlich unter 1 % der für die wissenschaftliche Arbeit verwendeten Mittel betragen. In Projekten wäre dieser Betrag vergleichbar mit „Publikationskosten“ zu beantragen und gegen Rechnung an das Datenarchiv zu zahlen. Für die Erfassung und Publikation größerer Datensammlungen sind die Kosten in Abhängigkeit vom Aufwand individuell auszuhandeln. Auch die Kosten für die DOI-Vergabe werden erst bei einer größeren Anzahl von Datensätzen signifikant.

Das skizierte Geschäftsmodel beinhaltet den spezifischen Aufwand für die Archivierung der zur Publikation vorgesehenen Datenkontingente. Es beinhaltet nicht die Betriebsmittel des Archives. Es wird davon ausgegangen, dass diese aus dem Haushalt der jeweiligen betreibenden und für diesen Dienst zertifizierten Einrichtung getragen werden.

Beirat > TIB

AP5 Übertragungsmodell und Verbreitung in der wissenschaftlichen Gemeinschaft

Die Datenbibliothek Pangaea steht seit 1994 der wissenschaftlichen Gemeinschaft für die Archivierung von Daten zur Verfügung. Bis heute wurde national und international in 160+ Publikationen und Präsentationen für den Dienst geworben. Während der Laufzeit des STD-DOI Projektes seit 2004 wurde das System in 46 Präsentationen vorgeführt; Projekt und die DFG als Zuwendungsgeber wurden immer genannt. Eine Liste aller Veröffentlichungen von PANGAEA wird im Open Access Repository ePIC des AWI geführt: http://epic.awi.de/epic/Main?list&page=department&group=awi-2005-050410

Im Berichtszeitraum wurde Pangaea den geowissenschaftlichen Fachgesellschaften in Deutschland für die Archivierung von Datensupplements zu Artikeln in ihren Zeitschriften schriftlich angeboten (Deutsche Gesellschaft für Polarforschung/Polarforschung, Deutsche Geologische Gesellschaft/Zeitschrift der DGG, Deutsche Geophysikalische Gesellschaft/Geophysical Journal International, Deutsche Quartärvereinigung/Quaternary Science Journal, Paläontologische Gesellschaft/Paläontologische Zeitschrift, Geologische Vereinigung/International Journal of Earth Sciences, Deutsche Mineralogische Gesellschaft/European Journal of Mineralogy, Zeitschrift für Geomorphologie, Polar Biology). Gleichzeitig erschien eine allgemeine Information zum Stand der Archivierung von Geodaten in GMIT, der Informationszeitschrift aller geowissenschaftlichen Fachgesellschaften (hdl:10013/epic.25618).

Weitere Angebote des Dienstes erfolgten an den DWD zur Erfassung der historischen Wetterbeobachtungen von Schiffen aus dem 19. und 20. Jahrhundert, an das Konsortium Deutsche Meeresforschung (KDM) zur Nutzung für die 14 Partnerinstitute, an das Helmholtz-Zentrum für Umweltforschung zur Archivierung von limnologischen Daten, die SK Hydrologie und die BMBF Förderschwerpunkt zur CO2-Speicherung, Gashydrate und Informationssysteme im Erdmanagement. An der Umsetzung wird bei den Gesellschaften und Einrichtungen gearbeitet, der im Rahmen von STD-DOI erarbeitete Datenarchivierungs- und publikationsdienst ist etabliert und steht Projekten und Einrichtungen zur Verfügung.

Pressemitteilung 2005
Innovativer Beitrag der TIB zu einer modernen Informationsvermittlung in den Wissenschaften.

Die TIB hat sich mit führenden Forschungsinstituten aus dem Bereich ‘Erde und Umwelt’ in einem von der DFG geförderten Projekt zusammengeschlossen, um wissenschaftliche Daten und Informationen im Sinne einer bibliothekarischen Erfassung langfristig und allgemein verfügbar zu machen.

Beteiligt sind neben der TIB als zentraler Registrieragentur das Alfred-Wegener-Institut, Bremerhaven und das DFG-Forschungszentrum Ozeanränder, Bremen für den Bereich Meeres- und Polarforschung, das GeoForschungszentrum, Potsdam für die Geowissenschaften und das Max-Planck-Institut für Meteorologie, Hamburg für die Klimaforschung. Das Forschungszentrum L3S in Hannover zeichnet sich verantwortlich für die technische Verbindung zwischen den Datenzentren der beteiligten Einrichtungen, der TIB und dem zentralen Server. Verwendet wir das etablierte System der DOI (Digital Object Identifier), mit dem bisher im wesentlichen Publikationen im Internet direkt findbar sind. Gleichzeitig werden die Zitate in die Bibliothekskataloge eingepflegt. Das System steht allen Wissenschaftbereichen offen, eine Verwendung in der Medizin ist in der Vorbereitung.

Das neue System soll zum einen den einzelnen Wissenschaftler wie auch grosse Projekte motivieren zusätzlich zur klassischen Publikation auch die wissenschaftlichen Daten verfügbar und referenzierbar zu machen. Zur Zeit sind 90 % der in der naturwissenschaftlichen Grundlagenforschung erhobenen Daten bereits nach kurzer Zeit verloren.

Durch die allgemeine Verfügbarkeit der den Publikationen zugrunde liegenden Daten werden diese auch für andere überprüfbar, ihre Erhebung nachvollziehbar. Dies folgt den ‘Regeln guter wissenschaftlicher Praxis’, die auf Grund von Fehlverhalten einzelner Wissenschaftler von der DFG 1998 formuliert wurden und Voraussetzung sind für jedes von der DFG geförderte Projekt. Gleichzeitig liefert dieses Projekt einen der wesentlichen Beiträge zu Realisierung des seit einigen Jahren von den führenden Forschungseinrichtungen geforderten freien Zugang zu jeder Art von wissenschaftlichen Informationen unter Verwendung des Internet (Open Access).

Unter der Voraussetzung, das die Gutachter, Fördereinrichtungen und die Wissenschaft selbst das neue System akzeptiert und zukünftig dokumentierte und validierte und damit zitierfähige Daten in ähnlicher Weise bewertet, wie die klassische Publikation, ist damit dem Verlust wesentlicher Teile unseres wissenschaftskulturellen Erbes Einhalt geboten.