Projektabschluss
Veröffentlichung von Forschungsdaten
Forschungsdaten sollten, sofern keine rechtlichen Gründe entgegenstehen, öffentlich zur Verfügung gestellt werden. Dies erwarten inzwischen nicht nur die meisten Fördergeber und Wissenschaftsorganisationen, sondern es liegt auch in Ihrem persönlichen Interesse.
- Veröffentlichte Forschungsdaten sind eine eigenständige, zitierbare und nachnutzbare wissenschaftliche Leistung.
- Die Zitationsrate von Publikationen, deren zugehörige Daten öffentlich verfügbar sind, steigt.
- In geeigneten Repositorien veröffentlichte Forschungsdaten werden langzeitverfügbar gehalten und Ihre eigene Arbeit wird somit gesichert.
- Sie erfüllen die Vorgaben von Forschungsförderern.
- Sie ermöglichen anderen Forschenden die Arbeit mit qualitativ hochwertigen Daten.
- Im Rahmen von Open Science können neue Erkenntnisse und wissenschaftliche Kooperationen gefördert werden.
Dennoch kann es in einigen Fällen ratsam sein, Forschungsdaten nicht zu veröffentlichen bzw. Forschungsdaten dürfen aufgrund bestimmter Voraussetzungen nicht veröffentlicht werden. Dies ist beispielsweise dann der Fall, wenn Daten urheberrechtlich geschützt sind, der Geheimhaltung unterliegen oder einen Personenbezug aufweisen. Es empfiehlt sich, solche Rechtsfragen bereits während der Projektplanung zu durchdenken.
In einem Forschungsdatenrepositorium
Ein Repositorium ist ein Speicherort für digitale Objekte, die für einen öffentlichen oder beschränkten Nutzerinnen- und Nutzerkreis zugänglich sein können. Die Publikation in einem Repositorium bietet den Vorteil, dass Forschungsdaten über entsprechende Suchdienste auch unabhängig von Textpublikationen gefunden werden können Forschungsdatenrepositorien lassen sich in folgende Typen unterscheiden:
- fachspezifische Repositorien mit Spezialisierung auf ein bestimmtes Fach- oder Themengebiet
- institutionelle Repositorien, die Forschungsdaten einer Einrichtung publizieren
- generische Repositorien für unterschiedlichste Daten aus sämtlichen Fachgebieten
Fachspezifische Repositorien
Für viele Fachgebiete wurden in den letzten Jahren Fachrepositorien aufgebaut. Falls es in Ihrer Disziplin ein fachspezifisches Repositorium gibt, empfehlen wir Ihnen, Ihre Forschungsdaten dort zu veröffentlichen. Durch die Bekanntheit in der jeweiligen Fachcommunity, werden Ihre Daten leichter gefunden und deren Sichtbarkeit erhöht. Häufig bieten fachspezifische Repositorien zusätzliche Services wie z. B. eine inhaltliche Qualitätsprüfung an. Darüber hinaus nutzen sie in der Regel fachspezifische Metadatenstandards und bieten technische Unterstützung für gegebenenfalls im Fach verbreitete speziellere Datenformate.
Geistes- und Kulturwissenschaften
DARIAH-DE Repository (Digital Research Infrastructure for the Arts and Humanities):
IANUS Forschungsdatenzentrum Archäologie und Altertumswissenschaften
TextGrid Repository Langzeitarchiv für geisteswissenschaftliche Forschungsdaten
arthistoricum.net@heiDATA des Fachinformationsdiensts Kunst – Fotografie – Design
Propylaeum@heiDATA des Fachinformationsdiensts Altertumswissenschaften
Forschungsdatenzentren (FDZ) des Verbunds Forschungsdaten Bildung für Forschungsdaten aus der Bildungsforschung
Weitere Repositorien und Datenzentren finden Sie z. B. über die NFDI-Konsortien NFDI4Culture und Text+.
Sozial- und Wirtschaftswissenschaften
SowiDataNet|datorium für die Sozial- und Wirtschaftswissenschaften des GESIS Leibniz-Institut für Sozialwissenschaften
Forschungsdatenzentren (FDZ) bei KonsortSWD
Forschungsdatenzentrum (FDZ) für die Psychologie am ZPID
Qualiservice – FDZ für qualitative sozialwissenschaftliche Forschungsdaten
FDZ des Verbund Forschungsdaten Bildung (VerbundFDB)
Humanwissenschaften
Forschungsdatenzentrum (FDZ) für die Psychologie am ZPID, Repositorium PsychArchives
Eine Übersicht über für die Psychologie relevante Forschungsdatenrepositorien bietet psychologie.de
FDZ des Verbund Forschungsdaten Bildung (VerbundFDB)
Informatik
Nationale Dateninfrastruktur for Data Science (NFDI4DataScience)
Institutionelles Repositorium FD-Repo der Universität Bamberg
Sollte für Ihre Fachdisziplin noch kein fachspezifisches Repositorium existieren, können Sie Ihre Daten im FD-Repo der Universität Bamberg veröffentlichen. Sie können zwischen folgenden Möglichkeiten zur Veröffentlichung und Speicherung wählen:
- Open Access: Ihre Forschungsdaten sind ohne Einschränkung für die gesamte Öffentlichkeit zugänglich.
- Restricted Access: Ihre Forschungsdaten sind mit Einschränkungen für bestimmte Nutzer*innen des FD-Repos zugänglich.
Generische Repositorien
Die Veröffentlichung in einem generischen Repositorium bietet sich an, wenn noch kein fachspezifisches Repositorium für Ihr Fach existiert. Generische Repositorien sind auf Datentypen und -formate aus den unterschiedlichsten Fachgebieten ausgerichtet. Sie nutzen in der Regel keine fachspezifischen, sondern allgemeine Metadatenstandards, wodurch sie fachspezifische Eigenschaften von Forschungsdaten nicht in der Tiefe abbilden können. Um die Auffindbarkeit, Nachnutzbarkeit und Interoperabilität von Daten für eine bestimmte Fachcommunity gewährleisten zu können, sollten Forschungsdaten besser in einem fachspezifischen Repositorium veröffentlicht werden.
Generische Repositorien (in Auswahl)
Zenodo: In Zenodo können neben Forschungsdaten auch Publikationen, Software, Präsentationen, Videos und weitere Ressourcentypen abgelegt werden. Das Repositorium wird durch das OpenAIRE-Konsortium und das CERN betreut.
Open Science Framework (OSF): Das Open Science Framework (OSF) ist sowohl ein kostenloses Netzwerk für Forschungsmaterialien als auch ein Open-Source-Projektmanagementtool.
RADAR (Research Data Repository): In RADAR können disziplinübergreifend Forschungsdaten archiviert und veröffentlicht werden. Betreiber ist das FIZ Karlsruhe – Leibniz-Institut für Informationsinfrastruktur.
Ein passendes Repositorium auswählen
Für die Auswahl eines geeigneten Repositoriums empfehlen wir Ihnen die Suche über re3data (Registry of Research Data Repositories), das einen Überblick über existierende Forschungsdatenrepositorien bietet.
Die Konsortien der Nationalen Forschungsdateninfrastruktur (NFDI) bieten ebenfalls Übersichten über entsprechende fachliche Repositorien und Datenarchive.
Die Auswahl eines für Ihre Forschungsdaten passenden Repositoriums sollte sich nach den Gepflogenheiten ihres Faches oder den Vorgaben von Förderinstitutionen richten. Sie hängt auch davon ab, ob Ihre Daten für einen bestimmten Zeitraum gespeichert oder langfristig archiviert werden sollen. Gibt es keine Vorgaben, so sind fachspezifische Repositorien zu empfehlen.
Qualitätsmerkmale zur Auswahl eines passenden Repositoriums
- Vergabe persistenter Identifikatoren: Werden persistente Identifikatoren für Datensätze (z. B. DOI) und Autor*innen (z. B. ORCID) vergeben?
- Metadaten: Besteht die Möglichkeit, fachspezifische Metadatenstandards zu verwenden?
- Download- und Exportmöglichkeiten: Bietet das Repositorium unterschiedliche Exportoptionen an?
- Beschreibung bzw. Dokumentation: Kann der Entstehungskontext der Daten in einem Textfeld festgehalten werden?
- Zugriffsmöglichkeiten: Gibt es die Möglichkeit, unterschiedliche Zugriffsarten oder eine Embargofrist festzulegen?
- Lizenzen: Können Lizenzen zur Nachnutzung ausgewählt werden?
- Überblick/Vorschau des Datensatzes: Sind Viewer zur Anzeige einer Dateivorschau eingebunden?
- Versionierung: Gibt es die Möglichkeit zur Erstellung von Versionen eines Datensatzes?
- Anmeldung und Bearbeitung: Sind Registrierung und Anmeldung einfach gestaltet? Haben Autor*innen die Möglichkeit, ihren Datensatz auch nach der Ablage zu bearbeiten?
- Auffindbarkeit durch Suchmaschinen: Ist das Repositorium durch Indexierung für Suchmaschinen auffindbar?
Ausführlichere Informationen zu den einzelnen Qualitätsmerkmalen finden Sie in der Handreichung „Repositorien für Forschungsdaten“ des Kompetenznetzwerks Forschungsdatenmanagement an Thüringer Hochschulen.
Als Data Paper
Es gibt spezielle Data-Journals, die meist disziplinspezifisch ausgerichtet sind und Artikel (Data Papers) zu Forschungsdaten veröffentlichen. Durch die ausführliche Beschreibung von Datensätzen in einem Data Paper soll deren Wiederverwendbarkeit erleichtert und die Sichtbarkeit vergrößert werden. Ziel eines Data Journals ist der schnelle Zugang zu qualitätsgesicherten Datensätzen.
Als Ergänzung zu einer Publikation
Viele wissenschaftliche Zeitschriften bieten die Möglichkeit, Forschungsdaten als ergänzendes Material mit einem Artikel abzulegen. Text und Daten liegen dann zwar am selben Ort, inwiefern diese Form der Datenpublikation jedoch den FAIR-Prinzipien entspricht, ist abhängig von der Umsetzung in der jeweiligen Zeitschrift bzw. des Verlages.
Forschungsdaten für die Veröffentlichung vorbereiten
Selektieren
Nicht alle Forschungsdaten, die im Laufe eines Projekts entstehen, sind publikations- oder archivierungswürdig. Bei der Auswahl zu veröffentlichender bzw. zu archivierender Forschungsdaten kann die Checkliste „Five steps to decide what data to keep“ des Digital Curation Center (DCC) helfen. Dieses legt die fünf folgenden Schritte zur Datenauswahl zugrunde:
- Identifizieren Sie Zwecke, die die Daten erfüllen könnten.
- Identifizieren Sie Daten, die aufgehoben werden müssen (z. B. aufgrund von Vorgaben von Forschungsförderern, Forschungsdaten-Policy der eigenen Einrichtung oder vertraglicher Regelungen; Einzigartigkeit der Daten, großer Aufwand bei Reproduzierung).
- Identifizieren Sie Daten, die aufgehoben werden sollten (z. B. aufgrund hoher Qualität oder großen Nachnutzungspotenzials).
- Wägen Sie die Kosten ab (Vorbereitungskosten, die während des Forschungsprozesses und bei der Vorbereitung zur Archivierung entstehen sowie Aufbewahrungskosten).
- Vervollständigen Sie die Datenbewertung.
Aufbereiten
Dateibenennungen und Ordnerstruktur sollten konstistent und ohne Sonderzeichen sein.
Mehrere Dateien sollten in hierarchisch strukturierten Ordnern abgelegt werden und, sofern möglich, in offenen Dateiformaten vorliegen.
Auch eine Kontrolle Ihrer Daten im Hinblick auf formale Kriterien, wie Datums- und Zahlenformate, Werteskalen, Benennungskonventionen für Felder und Variablen, verwendete Abkürzungen usw. ist ratsam.
Dokumentieren
Alle Daten, die Sie zur Veröffentlichung auswählen, sollten umfassend dokumentiert sein, sodass Dritte sie eigenständig verstehen und einordnen können. Hierzu eignet sich z. B. eine README-Datei, die Sie gemeinsam mit den Daten veröffentlichen. Für die Veröffentlichung in einem Repositorium werden Metadaten verlangt, die präzise sein sollten, um die Auffindbarkeit Ihrer Daten zu erhöhen. (siehe Projektdurchführung, Dokumentation und Metadaten)
Rechtliche Aspekte klären und Lizenz wählen
Darüber hinaus sollten Sie vorab bestehende Urheber- und Verwertungsrechte an den Daten klären, gegebenenfalls notwendige Einwilligungen einholen und Personenbezüge anonymisieren. Zudem sollten Sie sich überlegen, unter welcher Nutzungslizenz Sie Ihre Daten bereitstellen möchten.
Archivierung
Die gute wissenschaftliche Praxis verlangt eine Aufbewahrung von Forschungsdaten für mindestens zehn Jahre, um dem Anspruch der Überprüfbarkeit und Nachvollziehbarkeit gerecht zu werden. Eine Archivierung über diesen Zeitraum hinaus ist jedoch empfehlenswert.
Eine Archivierung ist in der Regel unabhängig davon, ob die gesamten Daten oder ein Teil davon auch als Publikation zugänglich ist. Es müssen nicht grundsätzlich alle Dateien und Dateiversionen archiviert werden. Ebenso wie bei einer Veröffentlichung ist zu selektieren, welche Daten langfristig aufbewahrt werden sollen.
Archivierung bedeutet, dass die langfristige Nutzbarkeit der Daten über einen nicht definierten Zeitraum hinweg sichergestellt wird. Dabei spielen der Erhalt der Authentizität, der Integrität, der Zugänglichkeit und der Verständlichkeit eine wesentliche Rolle. Davon umfasst sind die Bereitstellung der technischen Infrastruktur, organisatorische Maßnahmen sowie Workflows und Standards. Die bloße Ablage auf dem eigenen Rechner oder einem externen Speichermedium stellt noch keine Archivierung dar!
Erhaltungsstrategien
Im Rahmen einer rein physischen Speicherung, der sogenannten Bitstream Preservation, werden die Daten in dem Zustand erhalten, in dem sie abgeliefert wurden. Da sich jedoch etwa Betriebssysteme, Software und Dateiformate kontinuierlich verändern, können Daten mit dieser Strategie schnell unzugänglich und unbenutzbar werden.
Um Daten langfristig wiedergeben und interpretieren zu können bieten sich die Migration oder die Emulation als Strategie an. Dabei werden die Informationen, nicht die digitalen Objekte an sich erhalten. Durch umfassende Kontextinformationen zu Erhebungsmethoden, verwendeter Hard- und Software und eine ausführliche Beschreibung mit Metadaten können künftige Nutzungsszenarien wesentlich erleichtert werden. Darüber hinaus dürfen die Daten nicht untrennbar mit einem Datenträger oder Auslesegerät verbunden sein, um sie auf andere Systeme und Träger migrieren zu können. Proprietäre Dateiformate erschweren diesen Prozess.
Archivierungsmöglichkeiten
Für die Archivierung bieten sich je nach Umfang, Format oder Sensibilität der Forschungsdaten unterschiedliche Optionen an. Die Daten können z. B. in der eigenen Institution aufbewahrt, in ein Repositorium eingestellt oder an bei einem Forschungsdatenzentrum abgegeben werden.
Repositorien und Datenzentren finden Sie z. B. über re3data oder die Konsortien der Nationalen Forschungsdateninfrastruktur (NFDI).