Was sind Repositorien bzw. Forschungsdatenzentren (FDZ)?

Repositorien sind Speicherorte bzw. Publikationsorgane für digitale Objekte (z. B. Forschungsdaten und Software), die diese teils öffentlich, teils nutzungsbeschränkt zur Verfügung stellen. Sie können für die Archivierung und/oder Veröffentlichung eigener Forschungsdaten genutzt werden sowie für Recherchearbeiten und Sekundärforschung. Forschungsdatenzentren sind eine spezialisierte und qualitätsgesicherte Art von Repositorien. Sie müssen eine Akkreditierung durchlaufen und ein kontinuierliches Monitoring durchlaufen, stellen teils hohe Anforderungen an den Datenschutz und stellen Daten in der Regel nur für wissenschaftliche Zwecke zur Verfügung. Dadurch ist es möglich dort auch Zugang zu sensiblen (personenbezogenen) Daten zu bekommen oder diese dort für die Nachnutzung abzulegen.

Die Nutzung der Archivierungsmöglichkeiten in Repositorien oder Forschungsdatenzentren ist Teil der guten wissenschaftlichen Praxis. Im Kodex zur guten wissenschafltichen Praxis der DFG nehmen gleich drei der Leitlinien Bezug darauf. Leitlinie 13 verlangt, dass bei der Publikation von Forschungsergebnissen (soweit rechtlich und ethisch möglich) auch „die den Ergebnissen zugrunde liegenden Forschungsdaten, Materialien und Informationen, die angewandten Methoden sowie die eingesetzte Software“ verfügbar gemacht werden. Leitlinie 15 weist darauf hin, dass Forschende eine Verantwortung haben, ein qualitativ hochwertiges und sichtbares Publikationsorgan auszuwählen. Leitlinie 17 gebietet schließlich, dass die Forschungsdaten für „einen angemessenen Zeitraum“ (in der Regel zehn Jahre) aufbewahrt werden. 

Welches Repositorium ist das Richtige für Sie?

Welche Repositorien bzw. FDZ gibt es?

Innerhalb der Repositorien und Forschungsdatenzentren wird zwischen generisch, disziplin/fach-spezifisch und institutionell unterschieden. Beispielsweise auf Zenodo findet sich eine Auflistung von generischen Repositorien. An einigen Hochschulen gibt es bereits institutionelle Repositorien, lassen Sie sich dazu von den entsprechenden Fachleuten an Ihrer Institution (Data Steward, FDM-Referent, Bibliotheksmitarbeitende) beraten.

In unserer Auflistung konzentrieren wir uns auf die disziplin- bzw. fachspezifischen Repositorien und Forschungsdatenzentren. Der Vorteil, Ihre Daten dort zu archivieren und zu publizieren, ergibt sich daraus, dass andere Forschende, die aus einem ähnlichen wissenschaftlichen Feld wie Sie kommen, schneller und öfter auf Ihre Daten zugreifen. Grundsätzlich ist es nämlich genauer und effizienter, auf disziplin- und fachspezifischen Repositorien und Forschungsdatenzentren nach Daten zur Nachnutzung zu suchen, da dort eine besondere Expertise liegt. Die Chance, dass die Daten für die Nachnutzung interessant sind, erhöht sich in einem disziplin- oder fachspezifischen Repositorium und FDZ enorm.

Unsere Empfehlung ist es, in einem ersten Schritt zu sehen, ob das Repositorium oder FDZ thematisch zu Ihren Forschungsdaten passt. Weitere wichtige Kriterien für die richtige Auswahl sollten außerdem sein, ob für Sie Kosten entstehen, wo der Serverstandort ist, ob das Repositorium oder FDZ zertifiziert ist und unter welchen Bedingungen Ihre Forschungsdaten aufgenommen werden (z. B. welche Veröffentlichungsgrade gibt es, wie ist der Prozess der Kuratierung, welche Datentypen werden aufgenommen, wie lange ist die Archivierungsdauer etc.). Ein weiterer wichtiger Aspekt ist die Vergabe von sogenannten Persistenten Identifiern (PIDs). Diese schreiben (Forschungs-)Daten langfristigen und eindeutig einer Quelle bzw. Autor*innen zu. Eine PID beinhaltet die Information, unter welcher URL die Daten zu finden sind bzw. wo die beschreibenden Metadaten abgelegt sind. Die Verwendung von PIDs hat einige Vorteile: Werden Ihre (Forschungs-)Daten an einen anderen Speicherort verschoben, kann die Information der PID entsprechend aktualisiert werden, sodass die PID weiter gültig bleibt. So können Datensätze zum Beispiel auch in Publikationen dauerhaft referenziert werden. Dadurch wird Ihre Forschungs-Reputation aber auch Ihre Zitierfähigkeit gesteigert. 

https://www.qualidatanet.com/de/ ist ein Netzwerk zur Vermittlung zwischen FDZ und Repos, die qualitative Daten archivieren und zur Nachnutzung bereit stellen, und Forschenden in der qualitativen Forschung. Hier können Sie Ansprechpartner finden und Antworten zu Fragen rund um das Thema Aufbereitung der Daten zur Archivierung und Nachnutzung, sowie zu Urheber- und Nutzungsrechten. 

Unter folgenden Adressen finden Sie generische Suchmaschinen für Repositorien und FDZ:

https://commons.datacite.org/repositories?query=social+studies

https://www.re3data.org/search?query=&pidSystems%5B%5D=DOI&subjects%5B%5D=1%20Humanities%20and%20Social%20Sciences&subjects%5B%5D=20502%20Public%20Health%2C%20Health%20Services%20Research%2C%20Social%20Medicine

Bei der Wahl eines Repositoriums empfiehlt es sich, auf folgende Attribute zu achten und zu eruieren, welche für die eigenen Forschungsdaten sinnvoll sind:

  • Optionen für den Zugang (offen, geschlossen, mit einem Embargo belegt etc.)
  • Optionen für Nutzung und Lizenzen
  • generisch, disziplin/fach-spezifisch oder institutionell
  • Vergabe von Persistent Identifiers, wie DOI, URN, ARK (Verlinkung zur kurzen Erläuterung, was PIDs sind?)
  • Art und Vorhandensein von Kuratierung der Forschungsdaten
  • Art und Vorhandensein von Zertifikaten
  • Archivierungsdauer/Bitstream Preservation
  • Kosten
  • Host bzw. Serverstandort
  • weitere Policies und Bedingungen

Quelle: TKFDM (2024): MY DATA, MY LOVE: HOW TO WOW THE WORLD WITH YOUR DATA PUBLICATIONS, Vortrag auf der Love Data Week 2024.

An dieser Stelle finden Sie weitere Tipps für die Auswahl des „richtigen“ Repositoriums bzw. FDZ:

https://openeconomics.zbw.eu/knowledgebase/das-richtige-repository-fuer-forschungsdaten-auswaehlen/?cat=49

genereller Hinweis:

bei der Archivierung und Publizierung der eigenen Forschungsdaten (insbesondere (sensible) personenbezogene Daten, wenn auch anonymisiert) in Repositorien oder FDZ sind die Vorgaben der 5 SAFES zu berücksichtigen. 

  1. safe people → Wer nutzt meine Forschungsdaten für welche Zwecke nach?
  2. safe projects → z. B. validiert durch das Einholen eines Ethikvotums
  3. safe data → Wie hoch ist das Risiko einer Re-Identifizierung der Forschungsteilnehmenden?
  4. safe settings → z. B. in Bezug auf Datenschutz und Datenspeicherung
  5. safe outputs → Sind meine geteilten Forschungsdaten so gut anonymisiert, dass das Risiko der Re-Identifizierung möglichst gering ist?