Forschungsdaten: Was muss bei der Veröffentlichung beachtet werden?
Was sind Forschungsdaten?
Für den Begriff „Forschungsdaten“ gibt es keine festgelegte Definition. Denn wie Forschungsdaten letztlich aussehen, hängt von der jeweiligen Disziplin ab.
Auch sind keine bestimmten Formate festgelegt. Forschungsdaten in den Lebenswissenschaften können Mess-, Erhebungs- und Beobachtungsdaten sowie audio-visuelle Materialien wie Bilder oder Videos, aber auch Softwareentwicklungen sein. Sie entstehen während des Forschungsprozesses und sind die Grundlage für wissenschaftliche Ergebnisse.
Eine Publikation solcher Daten parallel zu einem wissenschaftlichen Artikel erlaubt die Verifikation und Reproduzierbarkeit der Ergebnisse und der daraus gezogenen Schlüsse. Ähnliches gilt für die singuläre Publikation von Forschungsdaten.
FAIR Data-Prinzipien für Forschungsdaten: Was muss beachtet werden?
Die FAIR-Prinzipien sind ein Set von Leitlinien um Forschungsdaten auffindbar (findable), zugänglich (accessible), interoperabel (interoperable) und nachnutzbar (reusable) zu machen. Sie bieten einen Rahmen für das Management wissenschaftlicher Forschungsdaten für alle Beteiligten am Forschungsprozess. Sie wenden sich direkt an Datenproduzent:innen und Autor:innen von Forschungsdatenpublikationen und fördern den größtmöglichen Nutzen für Forschungsdaten.
Siehe auch
Was ist mit Forschungsdatenmanagement gemeint?
Die Veröffentlichung von Forschungsdaten setzt voraus, dass dem Thema von der Antragstellung bis Projektabschluss besondere Aufmerksamkeit gewidmet wird und Voraussetzungen geschaffen werden, damit eine Nachnutzung überhaupt möglich ist. Den Anfang dabei macht die Erstellung eines Datenmanagementplans (engl. Data Management Plan - DMP).
Datenmanagementplan
In dem Plan wird dargelegt, wie die Daten verwendet werden sollen, die im Rahmen eines Projekts erhobenen werden. Es sollten folgende Themen behandelt werden:
- Allgemeine Informationen zum Projekt und den Projektzielen,
- Beschreibung bereits vorhandener Daten, die eventuell nachgenutzt werden können,
- Beschreibung der Daten, die erhoben werden sollen, einschließlich einer Einschätzung der Datenmenge sowie zum Format,
- Angaben zur geplanten Verwaltung und Speicherung der Daten sowie zur Archivierung und Metadatenerstellung,
- Informationen zur Behandlung von administrativen und rechtlichen Aspekten wie zum Beispiel Vorgaben der mittelgebenden Einrichtungen oder Datenschutzaspekte,
- Zuständigkeiten und Zugriffsrechte,
- Angaben zu den benötigten Ressourcen, die zur Umsetzung des Datenmanagementplans vonnöten sind.
Datenmanagementpläne sind in einigen Förderprogrammen verpflichtend. Sie sollen sicherstellen, dass Maßnahmen ergriffen werden, sodass die Daten auch im Sinne einer guten wissenschaftlichen Praxis durch Qualitätssicherungsmaßnahmen publikationsfähig und nachnutzbar sind und rechtliche Aspekte wie z.B. Umgang mit persönlichen Daten mitbedacht wurden.
Der Datenmanagementplan muss immer auch die disziplinspezifischen Gegebenheiten berücksichtigen. Die aus dem Projekt WissGrid entstandene Checkliste zum Forschungsdaten-Management bietet eine gute Orientierung, welche Aspekte im Datenmanagementplan berücksichtigt werden sollten.
Inzwischen sind verschiedene Softwaretools entwickelt worden, die die Erstellung eines DMP unterstützen. In Deutschland setzt sich mittlerweile der im Rahmen eines DFG-Projektes erstellte Research Data Management Organizer (RDMO) durch. „Mit dem Research Data Management Organiser (RDMO) können Institutionen und Forschende das Forschungsdatenmanagement ihrer Projekte strukturiert planen und durchführen. Es erlaubt das Erfassen aller relevanten Planungsinformationen in Datenmanagementplänen und die Verwaltung aller Datenmanagementaufgaben über den gesamten Datenlebenszyklus“ (vgl. https://rdmorganiser.github.io/).
Was sollte bei der Veröffentlichung von Forschungsdaten beachtet werden?
Um Forschungsdaten auffindbar zu machen („findable“), ist insbesondere die Metadatenerfassung wichtig. Über die Metadaten werden die Daten fachgemäß beschrieben. Hierzu haben sich unterschiedliche, fachspezifische Metadatenstandards durchgesetzt, deren Nutzung das Kriterium „interoperable“ unterstützen. Die Verwendung von Standards in maschinenlesbarer - neben der von Menschen lesbaren - Form ist ein wichtiger Beitrag zur Interoperabilität von Forschungsdaten. Ein weiteres Beispiel hierfür ist die Verwendung von Ontologien bei der Schlagwortvergabe, in den Lebenswissenschaften z.B. Medical Subject Heading (MeSH) oder des Multilingual Agricultural Thesaurus AGROVOC.
Eine Möglichkeit bietet auch die Vergabe von persistenten Identifikatoren wie z.B. DOI für Forschungsdaten. Sie ermöglicht die Zitierfähigkeit und damit verbunden einen Reputationsgewinn für die Autor:innen. Zum DOI-Service von ZB MED
Bei der Publikation von wissenschaftlichen Ergebnissen in Zeitschriften gilt zu beachten, dass einige Zeitschriften auf die gleichzeitige Veröffentlichung der dazugehörigen Daten bestehen. Dazu gehören unter anderem die Zeitschriften von PLOS ONE.
German Medical Science (GMS) bietet die Möglichkeit, Forschungsdaten, die einer Publikation zugrunde liegen, über das Forschungsdatenrepositorium Dryad zu veröffentlichen.
Ist eine Patentierung geplant, so ist es unter Umständen ratsam, die dazugehörigen Forschungsdaten nicht zu veröffentlichen, weil dies neuheitsschädlich wirken kann und dann zur Folge hat, dass die Erteilung eines Patents abgelehnt wird.
Auch sollte geprüft werden, inwieweit Daten Geschäftsgeheimnisse enthalten oder ob Förderbescheide, Arbeits- oder Dienstleistungsverträge etc. Regelungen formulieren, die einer Veröffentlichung entgegenstehen bzw. daran bestimmte Bedingungen knüpfen.
Lizenzierung und rechtliche Aspekte
Generell bietet eine Lizenzierung über eine Open-Content-Lizenz die Möglichkeit, Nachnutzenden angepasste Rechte einzuräumen und somit dem Prinzip „reusable“ zu entsprechen. Wie für Textpublikationen können auch für Forschungsdaten Creative Commons-Lizenzen (CC) verwendet werden. Die neueste Version CC 4.0 bietet sich mit einer verbesserten globalen Orientierung für die Lizenzierung von Forschungsdaten an und löst damit zunehmend die älteren Open Data Commons (ODC) - Licenses ab.
Die Rechtslage im Hinblick auf die Nutzung von Forschungsdaten ist kompliziert. Daher können wir Ihnen nur erste Hinweise geben.
Bei Forschungsdaten greift je nach Beschaffenheit der Daten das Urheberrecht nicht, weil die dort geforderte Schaffungshöhe nicht erreicht wird (§ 2, Abs. 2 UrhG). Urheberrechtsschutz besteht aber für eigens entwickelte Software oder Bild- und Tonmaterialien. Zudem greift bei Daten, die in einer Datenbank abgelegt sind, das Leistungsschutzrecht der Datenbankherstellenden (§ 87b UrhG). Datensammlungen sind somit ebenfalls geschützt, sofern diese „systematisch oder methodisch angeordnet und einzeln mit Hilfe elektronischer Mittel oder auf andere Weise zugänglich sind und deren Beschaffung, Überprüfung oder Darstellung eine nach Art oder Umfang wesentliche Investition erfordert“.
Das Leistungsschutzrecht schützt den- oder diejenige, der oder die die Investition getätigt hat, um die Daten aufzubereiten. Die reine Erstellung der Daten ist allerdings dadurch nicht geschützt. Das Urheberrecht greift bei Datenbankwerken lediglich für 15 Jahre. Eine im Zusammenhang mit Forschungsdaten vergebene Open-Content-Lizenz (z.B. eine Creative-Commons-Lizenz) ist möglicherweise wirkungslos, wenn das Urheberrecht nicht greift. Geschützt sind aber in jedem Fall Auswertungen, Abbildungen etc. die auf Grundlage der Daten angefertigt wurden. Mit der aktuellen Creative-Commons-Lizenz 4.0 können nun auch Datenbanken lizenziert werden.
Insbesondere bei lebenswissenschaftlichen Studien, in denen personenbezogene Daten erhoben werden, greift das Bundes- und/oder Landesdatenschutzgesetz. Für die Speicherung und Weiterverwendung der personenbezogenen Daten auch zu wissenschaftlichen Zwecken ist eine Einverständniserklärung der Betroffenen einzuholen (§ 4 Abs. 1 BDSG). Außerdem müssen die Daten so anonymisiert werden, dass keine Rückschlüsse auf einzelne Personen mehr möglich sind (§ 3a BDSG). Die Datenschutzbeauftragten einer Institution geben Auskunft darüber, wie die Daten erhoben und verarbeitet werden müssen, damit das Vorgehen rechtskonform ist. Generell ist zu empfehlen, rechtliche Aspekte von der zuständigen Abteilung der jeweiligen Institution prüfen zu lassen.
Siehe auch
Creative-Commons-Lizenzen: Was ist darunter zu verstehen?
Informationen zu „Rechte an Forschungsdaten und Datenbanken“ von irights.info
Handreichung „Urheberrecht in der Wissenschaft“ vom BMBF
Welche Vorgaben der mittelgebenden Einrichtungen gibt es?
Nachfolgend haben wir die Vorgaben einiger mittelgebender Einrichtungen zusammengestellt. Die Liste ist nicht vollständig. Wenn eine Einrichtung dort nicht erscheint, bedeutet dies nicht, dass sie keine Vorgaben macht.
Deutsche Forschungsgemeinschaft (DFG)
Die DFG spricht sich für die Veröffentlichung von Forschungsdaten aus und fördert auch Projekte zum Aufbau entsprechender Infrastrukturen. Informationen hierzu finden Sie im Merkblatt „Informationsinfrastrukturen für Forschungsdaten“.
In ihren "Leitlinien zur Sicherung guter wissenschaftlicher Praxis" weist die DFG darauf hin, das einer Veröffentlichung zugrundeliegende Daten für einen Zeitraum von 10 Jahren "zugänglich und nachvollziehbar" aufzubewahren sind. Diese Frist beginnt mit der Veröffentlichung. Eine Verkürzung der Frist muss begründet werden (Leitlinie 17). Darüber hinaus hat die DFG „Leitlinien zum Umgang mit Forschungsdaten“ verabschiedet, in denen die Erwartungen an die Antragsstellenden bezüglich des Umgangs mit Forschungsdaten in durch die DFG geförderten Projekten und Unterstützungsmöglichkeiten seitens der DFG zusammengefasst werden. Im Bereich der Lebenswissenschaften wurden zudem spezifische „Richtlinien zum Umgang mit Forschungsdaten in der Biodiversitätsforschung“ veröffentlicht.
National Institute of Health (NIH)
Das NIH macht bei einer Fördersumme von 500.000 USD jährlich die Veröffentlichung der Forschungsdaten bindend. Bei der Beantragung von Forschungsgeldern ist darzulegen, inwieweit die Daten veröffentlicht werden sollen. Falls es zwingende Gründe gegen eine Veröffentlichung gibt, sind diese bei der Antragsstellung anzugeben bzw. sollte die NIH kontaktiert werden. Die Veröffentlichung soll nach Publikationszusage durch den Verlag für den wissenschaftlichen Artikel, in dem die wichtigsten Erkenntnisse dargestellt werden, erfolgen. Weitere Informationen finden Sie im "NIH Grants Policy Statement".
Europäische Kommission
Die Europäische Kommission hat im Rahmen von Horizon 2020 ein Pilotprojekt zur Open-Access-Veröffentlichung von Forschungsdaten gestartet (Open Research Data Pilot) und fordert ausdrücklich dazu auf, einen Datenmanagementplan zu erstellen und Forschungsdaten zu publizieren. Während der Pilot sich nur auf bestimmte Bereiche des Arbeitsprogramms für 2016 erstreckte, sind seit 2017 alle thematischen Bereiche innerhalb von Horizon 2020 den Vorgaben verpflichtet. Sollten Forschungsdaten nicht veröffentlicht werden können oder sollen, muss dies von den Projektnehmer:innen begründet werden, beispielsweise bei Projekten, die keine Daten generieren oder deren Ergebnisse als geistiges Eigentum geschützt werden sollen (z.B. im Rahmen einer Patentanmeldung). Zudem besteht keine Pflicht zur Veröffentlichung sämtlicher im Projekt generierter Daten. In den "Guidelines on FAIR Data Management in Horizon 2020" finden Sie Informationen zum Pilotprojekt sowie zur Erstellung von Datenmanagementplänen, die für alle am Pilot teilnehmenden Projekte innerhalb der ersten sechs Monate der Projektlaufzeit verpflichtend sind. Somit spielen die Datenmanagementpläne bei der Begutachtung der Projekte keine Rolle.
Finden eines geeigneten Forschungsdatenrepositoriums
Einige Einrichtungen in Deutschland haben eine Forschungsdatenpolicy und unterstützen ihre Angehörigen aktiv darin, Forschungsdaten zu publizieren. Dazu gehört auch die Bereitstellung der entsprechenden Infrastruktur, etwa eines Forschungsdatenrepositoriums.
Um ein geeignetes Repositorium für die Ablage der Forschungsdaten zu finden, gibt es entsprechende Suchdienste, unter anderen das Registry for Research Data, kurz re3data. Für die Lebenswissenschaften werden dort derzeit allein in Deutschland über 190 Repositorien angezeigt, international mehr als 1.600.
ZB MED hat im PUBLISSO-Repository Finder Forschungsdatenrepositorien, in denen Daten aus den Lebenswissenschaften veröffentlicht werden können, geprüft und zusammengestellt.
Eine weitere Alternative für Daten aus den Lebenswissenschaften ist Dryad. Das Repositorium fungiert als Speicherort von Daten, die wissenschaftlichen Artikeln zugrunde liegen. Während die Nutzung der dort unter einer Creative-Commons-Lizenz verfügbar gemachten Daten kostenfrei ist, ist das Einstellen von Datensätzen kostenpflichtig. Dryad geht hierzu Kooperationen mit Institutionen, Zeitschriften, Universitäten, Fachgesellschaften etc. ein, die die Kosten für die Verfügbarmachung der Daten teilweise ganz übernehmen. Aber auch Mitglieder von Einrichtungen, die keine Kooperation mit Dryad haben, können gegen Übernahme der Kosten ihre Datensätze bei Dryad kostenfrei zu Verfügung stellen. Die Gebühren werden zur Finanzierung der Infrastruktur und zur Sicherstellung der langfristigen Zugreifbarkeit verwendet. Bei Dryad wird für die Daten ein Digital Object Identifier (DOI) vergeben, der die dauerhafte Verfügbarkeit und Zitierfähigkeit sicherstellt. Beim Einstellen der Daten kann festgelegt werden, ob die Daten erst nach einer Sperr- oder Embargofrist veröffentlicht werden sollen. ZB MED kooperiert mit Dryad im Rahmen von German Medical Science (GMS).
ZENODO ist ein fachübergreifendes Repositorium, welches neben wissenschaftlichen Publikationen auch Forschungsdaten erfasst. Hier können Sie beispielsweise gezielt nach Datensätzen, Video-/Bildmaterial oder Software recherchieren. Das Repositorium wird vom CERN in Genf betreut und weiterentwickelt. Der Aufbau wurde durch EU-Gelder finanziert und ist Teil einer europaweiten Open-Access-Infrastruktur.
Alternativen zum Forschungsdatenrepositorium
Auch viele Verlage haben mittlerweile die Bedeutung von Forschungsdaten erkannt und bieten den Autorinnen und Autoren an, diese als Supplements mit zu veröffentlichen. Einige Zeitschriften fordern dies sogar. Zudem gibt es spezielle „Data Journals“, die sich auf die Veröffentlichung von Forschungsdaten spezialisiert haben. Eine nicht abgeschlossene Liste zur ersten Orientierung findet sich im Wiki „Forschungsdaten“.
Auch im Zuge der Diskussion um „Big Data“ werden aktuell regelmäßig neue Zeitschriften gegründet, die sich mit methodischen Aspekten beschäftigen und geeignete Publikationsorgane darstellen können.
Siehe auch
unsere Informationsseiten zum Thema Forschungsdatenmanagement
Disclaimer
Bitte beachten Sie: Unser Service kann keine verbindliche Rechtsberatung anbieten, sondern stellt Informationen zur ersten Orientierung bereit. ZB MED – Informationszentrum Lebenswissenschaften hat die Angaben auf den folgenden Seiten sorgfältig geprüft, übernimmt aber für mögliche Fehler keine Haftung. Soweit nicht anders angegeben, beziehen sich Ausführungen zu einzelnen Rechtsnormen auf deutsches Recht (Stand FAQ 11/2017).
Kontakt
Dr. Jasmin Schmitz
Leitung Publikationsberatung
Tel: +49 (0)221 478-32795
E-Mail senden
Birte Lindstädt
Leitung Forschungsdatenmanagement
Tel: +49 (0)221 478-97803
E-Mail senden
Weiterführende Links
Checkliste WissGrid
DOI-Service von ZB MED
Open-Data-Commons
PLOS ONE – Publication Criteria
GMS
zu rechtlichen Aspekten
Hoeren, Thomas: Skript Internetrecht
Open Data Commons – Licenses
Informationen zu „Rechte an Forschungsdaten und Datenbanken“ von irights.info
Handreichung „Urheberrecht in der Wissenschaft“ vom BMBF
zu Vorgaben der mittelgebenden Einrichtungen
DFG: Förderprogramm „Informationsinfrastrukturen für Forschungsdaten“
DFG: „Leitlinien zur Sicherung guter wissenschaftlicher Praxis“
DFG: „Leitlinien zum Umgang mit Forschungsdaten“
DFG: „Richtlinien zum Umgang mit Forschungsdaten in der Biodiversitätsforschung“
NIH Grants Policy Statement
Guidelines on FAIR Data Management in Horizon 2020
zu Forschungsdatenrepositorien bzw. Alternativen
re3data
Dryad
GMS
ZENODO
Wiki „Forschungsdaten“
Zusätzliche Informationen
ZB MED Blog-Beitrag: "Electronic Lab Notebooks als Teil des Forschungsdatenmanagements"