Daten dokumentieren
Gute Datendokumentation ist für die Reproduzierbarkeit der Forschung und die Wiederverwendbarkeit der Daten unerlässlich. Sie liefert Informationen über den Kontext, die Struktur, die Herkunft und den Inhalt eines Datensatzes (oder einer Datei) mit dem Ziel, seinen Nutzen zu erhöhen. Datendokumentation ist somit auch ein wichtiger Bestandteil von FAIRen Daten.
Was ist Datendokumentation?
Datendokumentation wird manchmal auch als Metadaten bezeichnet — Daten über Daten. Metadaten beschreiben grundsätzliche Informationen über die Daten:
- Wer hat die Daten erstellt?
- Was ist in den Daten drin?
- Wann wurden die Daten erstellt?
- Wo wurden die Daten erstellt?
- Warum wurden die Daten erstellt?
- Wie wurden die Daten erstellt?
Metadaten oder Datendokumentation?
Metadaten können also entweder in einem Datenarchiv/-repository eingepflegt sein und Sie müssen beim Daten teilen die entsprechenden Zellen ausfüllen.
Oder aber Sie erstellen eine zusätzliche Datendokumentation (README Datei), welche zusätzliche Informationen für die Wiederverwendung Ihrer Daten enthält.
In der Regel empfiehlt sich beides: Die Angaben im Datenrepository sind maschinen-lesbar und können so für Metaanalysen verwendet werden, während die README Datei die Weiterverwendung der Daten durch Menschen erleichtert.
Beginnen Sie mit der Dokumentation während der Datensammlung.
Wie erstelle ich eine Datendokumentation?
Beginnen Sie mit Ihrer Datendokumentation bereits dann, wenn Sie Ihre Daten sammeln. Dies erleichtert es Ihnen später, den vollständigen Prozess der Datengenerierung nachzuvollziehen und eine gut strukturierte Datendokumentation zu erstellen.
Die Dokumentation das erste Mal strukturieren: Es ist nicht nötig, dass Sie ihre Datendokumentation gleich zu Beginn an vollständig strukturiert haben. Gewisse Strukturen können Ihnen jedoch von Anfang helfen, alle nötigen Metadaten für die Wiederverwendbarkeit Ihrer Daten zu sammeln.
Die Stanford Libraries bieten dazu eine gute Einführung.
Metadaten-Standards verwenden: Gut-strukturierte Metadaten oder Datendokumentation unterstützen die langfristige Auffindbarkeit, die Verständlichkeit und Bewahrung Ihrer Forschungsdaten. Disziplinen-spezifische Repositories verlangen in der Regel stark strukturierte Metadaten, damit eine hochgranulare Suche im Repository möglich ist.
Benutzen Sie Vorlagen für die Datendokumentation.
Vorlagen für die Datendokumentation
Vorlagen für die Erstellen von Datendokumentation finden Sie hier:
README Datei von Cornell University : ein Word-Dokument, welches die wichtigsten Fragen für eine umfassende Datendokumentation stellt. Generieren Sie anschliessend aus Ihrem Word-Dokument ein PDF, und teilen Sie dieses zusammen mit Ihren Daten.
CESSDA Metadata Schema : Diese Vorlage erlaubt es Ihnen, Informationen zu Ihrem Daten auf Projektebene zu erfassen. Beantworten Sie dazu die Fragen unter "Project-level documentation".
DataCite Metadata Generator : Das Online-Tool erstellt Ihnen eine XML-basierte Datendokumentation anhand der Fragen, die Sie im Generator beantworten.
Metadaten-Standards
Metadaten-Standards werden auch als "Schema" bezeichnet. Schemas können entweder generischer Natur sein oder auch fachspezifisch.
Bekannte Metadaten-Standards sind zum Beispiel DublinCore - ein Set von 15 Begriffen (wie Hersteller*in, Titel, etc.). Die Data Documentation Initiative (DDI) bietet ein XML-basiertes Schema für den Inhalt, den Transport, die Darstellung und die Archivierung von Metadaten in den Sozialwissenschaften. Um fachspezifische Metadatenschemas zu finden, eignet sich:
- Metadata Standard Catalogue für wissenschaftliche Daten
- Liste von Metadaten-Standards auf Wikipedia, kuratiert durch die Forschungsgemeinschaft
- Metadatenschemata von Dataverse, welche in viele anderen Schemas exportiert werden können.
- Liste von Metadatenschemata des Digital Curation Centers
Haben Sie fachspezifische Fragen?
Ein Data Steward hilft Ihnen gerne weiter. Nehmen Sie Kontakt auf: Data Stewards Netzwerk