Intern:Concept/Recommendation

Empfehlungen zur Verbesserung der Datenverfügbarkeit und Datenqualität in den Geowissenschaften in Deutschland

(1) Datenzitat

Datensätze sollten unabhängig vom archivierenden System eindeutig identifizierbar, referenzierbar und universell zugreifbar sein (Vergabe von DOI's oder URN's ) und sie sollten ggf. eigenständig publizierbar sein. Letzteres erfordert neue Publikationformen, bestehend etwa aus Kurzbeschreibung und Daten.

Eine Kopplung von Publikation und anhängende Daten/Primärdaten ist dringend notwendig. Insbesondere sollten
 * Zeitschriftenherausgeber, Institutsleitungen, wissenschaftliche Gesellschaften und Fördereinrichtungen auf die Möglichkeit der Datenarchivierung in einem geeigneten Datenzentrum hinweisen und
 * Forschungsinstitute sollten öffentliche Publikationslisten mit Referenz auf die Daten führen.

Von den Fördereinrichtungen sollte eine für Datenurheber wie für Nutzer verbindliche Regelung für die Publikation von Daten geschaffen werden. Die Regelung sollte alle Daten betreffen, die aus mit öffentlichen Mitteln geförderten Projekten resultieren, einschliesslich der nicht ausgewerteten Daten.

(2) Service der Datenzentren


 * Qualifizierte Datenzentren übernehmen die Rolle von allgemein für die Wissenschaft nutzbaren Einrichtungen für die Archivierung und Publikation von wissenschaftlichen Daten. Für die Beurteilung der Qualifikation eines Datenzentren sind einheitliche Richtlinien zu entwickeln.
 * Die aus der naturwissenschaftlichen Grundlagenforschung resultierenden Datengruppen werden den Datenzentren entsprechend ihres Aufgabenbereiches, ihrer Möglichkeiten und ihres wissenschaftlichen Umfeldes zugeordnet.
 * Die Zentren garantieren eine langfristige und freie Verfügbarkeit archivierter Daten
 * Die Zentren garantieren durch Qualitätskontrolle und vollständige Dokumentation die allgemeine Nutzbarkeit der archivierten Daten.
 * Die von den Zentren betriebenen Informationssysteme ermöglichen einen effizienten und nutzerfreundlichen Zugriff auf archivierte Daten
 * Datenzentren stehen mit ihrer Expertise den Fördereinrichtungen, den Gutachtern und der Wissenschaft beratend zur Verfügung.
 * Koordinatoren und Projektträger ausgewiesener Förderprogramme arbeiten vom Beginn an (Ausschreibung) mit den relevanten Datenzentren eng zusammen.
 * Die Datenzentren betreiben aktive Aquise in der Beteiligung an nationalen und internationalen Projekten.
 * Die Datenzentren stellen den Rahmen für ein Datenmanagementkonzept in Projekten bereit. Dieses enthält bereits Hinweise auf den Datenfluss, die benötigten Ressourcen und die 'Deliverables'.


 * Um einen effizienten Einsatz von Projektmitteln zu gewährleisten, sollten die Datenzentren folgendes gewährleisten:
 * Übersicht über die Datenerfassung von Projekten
 * Übersicht über bereits durchgeführte Arbeiten (Activity-Liste) und ggf. vorhandenes und allgemein nutzbares Probenmaterial
 * Nutzung vorhandener Daten durch einfache Verfügbarkeit
 * durch Zusammenfassung, Konsistensierung und Veredelung zu einem Mehrwert der Daten beitragen.


 * Der Fluss wissenschaftlicher Daten von der Quelle in die Informationssysteme sollte, wenn immer möglich, standardisiert und automatisiert werden (So könnten z.B. viele der auf Forschungsschiffen erhobenen Daten nach Abschluss einer Reise sofort allgemein verfügbar gemacht werden, würden sie denn mit einheitlichen Systemen erfasst). Datenzentren stellen sowohl die fachliche Kompetenz als auch die notwendigen technischen Schnittstellen zur Verfügung.
 * Die Datenzentren informieren die wissenschaftliche Gemeinschaft über ihre Strukturen, Tätigkeiten und Produkte auf Tagungen, Workshops, in Publikationen und über ihre Webseiten. Kurse über die Regeln guten wissenschaftlichen Arbeitens, insbesondere den Umgang mit wissenschaftlichen Daten sollten in der Lehre vertreten sein.
 * Ein Nutzerbeirat, der sich aus Forschungseinrichtungen, Datenzentren und Zuwendungsgebern rekrutiert, definiert grundsätzliche Vorgehensweisen, berät und kontrolliert die Datenzentren und vertritt insbesondere die Interessen der Nutzer.

(3) Finanzierung

Die Grundfinanzierung der Datenzentren sollte aus den Haushalten der tragenden Forschungseinrichtungen bestritten werden. Diese übernehmen damit die Verantwortung für einen langfristigen Betrieb. Geeignete Einrichtungen sind Helmholtz-Zentren (dort aus den Aufgaben: fächerübergreifende Querschnittsaufgaben und Systemlösungen) oder andere langfristig angelegte Forschungseinrichtungen, wie z.B. das DFG-Forschungszentrum in Bremen (rcom). Der Basisbetrieb umfasst die Investitionen für Hardware und Software, regelmäßige Weiterentwicklungen und Upgrades, um das System auf dem aktuellen Stand zu halten, Datensicherung und eine schnelle Internetanbindung.

Drittmittelanträge sollten ein Datenmanagementkonzept beinhalten, dass definiert, welche neuen Daten erhoben bzw. existierenden Daten erfasst werden sollen. Das Konzept definiert, wie die Daten gesammelt und vereinheitlicht werden und über welches System oder Datenzentrum sie nach Auslaufen des Projektes verfügbar sein werden. Für diese projektrelevanten Datenmanagementaufgaben sind anteilige Mittel vorzusehen. In EU-Projekten wurden ca. 1-3 % als notwendig definiert; im einzelnen ist der Aufwand jedoch von der Heterogenität, der Komplexität und dem Umfang der erhobenen Daten abhängig.