Recommendations on Data Versioning

We often say that “A is a version of B” but do not explain what we mean by “version”. We imply that B was somehow derived from A or that they share a common ancestor. But how is B related to A? How do they differ? Do they differ in content or format? What is the significance of this difference? While this sounds like a question about the provenance of a dataset, it goes beyond that and asks questions about the identity of a digital object and the intellectual and creative work it embodies.

The project “PID Reference Model for the Versioning of Research Data” at the Chair of Information Management at the Berlin School of Library and Information Science (IBI) at Humboldt Universität zu Berlin focused on the versioning of research data publications in the context of ongoing discussions about the reform of research evaluation from an infrastructural perspective. As an output of the project, the team led by visiting fellow Jens Klump developed a set of guidelines on how to version research data.

Klump, J., Pampel, H., Rothfritz, L., & Strecker, D. (2024). Recommendations on Data Versioning. Berlin, Germany: Humboldt-Universität zu Berlin. https://doi.org/10.5281/zenodo.13743876

This recommendation outlines key aspects of research data versioning for scientists and information management professionals at research-performing organisations. It is based on prior work by the Research Data Alliance Data Versioning Working Group.

Here is a presentation by the team lead in German: https://www.ibi.hu-berlin.de/de/von-uns/bbk/abstracts/ss_24/klump_versionen

Bausteine FDM – Call für die Ausgabe 4/2021

Liebe Kolleg:innen, 

das Heft 2/2021 der Bausteine Forschungsdatenmanagement befindet sich derzeit in der Endreaktion und wird bald erscheinen. Heft 3/21 wird voraussichtlich im September erscheinen.

Zugleich laufen bereits die Planungen für die Ausgabe 4/2021, deren Call wir hiermit eröffnen.

Beiträge können alle Personen einreichen, die professionell Forschungsdaten managen und die Forscherinnen und Forscher im Umgang mit diesen Daten beraten und unterstützen.

Deadline für die Einsendung ist der 31. August 2021.

Nähere Informationen zu Themenspektrum und Zielgruppen finden Sie unter: https://bausteine-fdm.de/about

Bitte beachten Sie vor allem Informationen zur Einreichung und zur Begutachtung.

Wir freuen uns auf Ihre Beiträge

Die Redaktion

Treffen zur Entwicklung einer Leitlinie zur Datenplausibilisierung am 26.8.19 in Berlin

Am 26. August 2019 findet von 11 bis 16 Uhr in den Räumen des DIW Berlin ein weiteres Treffen zur Entwicklung einer Leitlinie zur Datenplausibilisierung statt.

Die Enwicklung einer solchen (bislang fehlenden) Leitlinie wurde auf dem Workshop „Datenaufbereitung und Dokumentation“ 2017 initiert. Das Treffen am 26. August schließt an eine 2018 durchgeführte Erhebung der Plausibilisierungspraktiken bei 10 großen Forschungsinstituten (u.a. SOEP und DZHW) sowie ein erstes Austauschtreffen zu den aktuellen Plausibilisierungspraktiken im Herbst 2018 (und einer weiteren Arbeitsgruppe auf dem Workshop „Datenaufbereitung und Dokumentation“ 2018) an und hat das Ziel einen Vorschlag für eine Leitlinie zur Datenplausibilisierung zu entwickeln.

Zu dem Treffen sind explizit auch an der Mitarbeit interessierte Kolleg*innen eingeladen, die sich gerade mit dem Thema beschäftigen und an den bisherigen Treffen nicht teilnehmen konnten.

Wir freuen uns über eine kurze Rückmeldungen bis zum 23.8. und verbleiben mit Grüßen aus Berlin und Hannover

Andreas (Franken) vom FDZ SOEP sowie Andreas (Daniel) und Percy (Scheller) vom FDZ-DZHW

Open Science Training Handbook 1.0

Das Open Science Training Handbook 1.0 ist ab sofort als Gitbook erhältlich unter https://book.fosteropenscience.eu.

Das Handbuch ist unter Creative Commons Public Domain Dedication (CC0 1.0 Universal) verfügbar und orientiert sich an der praktischen Vermittlung von Open-Science-Prinzipien. Es wurde von 14 Experten während eines von FOSTER und der TIB Hannover im Februar 2018 organisierten Booksprints verfasst. Nach der Aufnahme von Anmerkungen und Korrekturvorschlägen aus der Community wurde das Handbuch nach Github verschoben und wir können nun die Veröffentlichung der Version 1.0 bekannt geben. Das OSTH soll ein lebendiges Handbuch sein und wir freuen uns sehr über Ihre Beiträge und Rückmeldungen zu seiner Anwendung in der Praxis, die wir bei der Arbeit an Version 2.0 berücksichtigen werden.

(via [forschungsdaten])

Workshop „Datenaufbereitung und Dokumentation“ am LIfBi

Am LIfBi in Bamberg: der Workshop Datenaufbereitung und Dokumentation

Am 19. und 20. Februar hat der der Workshop “Datenaufbereitung und Dokumentation” in diesem Jahr am Leibniz-Institut für Bildungsverläufe in Bamberg stattgefunden. In insgesamt 15 Sessions wurden Themen diskutiert, die uns als Datenproduzenten aktuell beschäftigen. Wie immer wurde dabei ein breites Spektrum abgedeckt, von prozessbegleitender Dokumentation über Datenedition bis zu Datenschutz, Nutzersupport und Projektmanagement. Es gab vorab keine fixe Agenda, sondern die Themen haben sich nach dem OpenSpace-Ansatz aus dem Kreis der Teilnehmerinnen und Teilnehmer ergeben.

Der Teilnehmerkreis ist wieder gewachsen und neben vielen alten Bekannten konnten wir auch in diesem Jahr wieder neue Kolleginnen und Kollegen begrüßen. Noch einmal herzlichen Dank an die hervorragenden Gastgeberinnen und Gastgeber vom FDZ des NEPS, die trotz kurzfristiger räumlicher und gesundheitlicher Schwierigkeiten einen sehr produktiven und kurzweiligen Workshop ermöglicht haben! Für das nächste Jahr hat sich das FDZ des DZHW dankenswerter Weise bereiterklärt uns zu beherbergen.

Vielen Dank auch an alle Teilnehmerinnen und Teilnehmer und bis zum nächsten Jahr in Hannover!

Abschnitt zu „Open Research Data and Materials“ im Handbuch „Open Science Training“

Am 12. Februar 2018 startete ein Booksprint mit 14 Expertinnen und Experten zum Thema Open Science Training in Hannover. Der Booksprint wurde von FOSTER und der TIB Hannover organisiert. Ziel war die Erstellung eines Handbuchs zum Thema “Open Science Training”, das zukünftigen Open Science Trainern eine Orientierung bei der Erstellung und Gestaltung von Schulungen bieten soll. Die erste Version ist nun online als Google Doc zugänglich und kann kommentiert oder einfach nur gelesen werden.

Im Kapitel „Open Science Basics“ findet sich auch ein Abschnitt „Open Research Data and Materials“. Der enthält bereits einige wichtige Aspekte, will aber insbesondere zu den Stichworten Research Data Management, Open file formats, Metadata/documentation und Funder requirements ergänzt werden.

(via [forschungsdaten])

Literaturtipp: E-Science-Tage 2017 – Forschungsdaten managen

http://books.ub.uni-heidelberg.de/heibooks/en/static/files/presses/1/monographs/285/simple/cover.jpg
Cover: E-Science-Tage 2017. Forschungsdaten managen

In dem Sammelband finden sich u.a. diese Kapitel:

  • RADAR: A Research Data Management Repository for Long Tail Data
  • Open Data in den Sozial- und Wirtschaftswissenschaften: Das Forschungsdatenrepositorium SowiDataNet
  • Integration von Forschungsdaten in Open-Access-Publikations- und Suchsysteme
  • Replikationen in den Wirtschaftswissenschaften – Stand und Perspektiven
  • The GFBio Terminology Service: enabling research data management beyond data heterogeneity
  • Distributed Research Data Management – Plädoyer für eine verteilte Forschungsdaten-Infrastruktur
  • Fraunhofer – Serviceentwicklung und Realisierung einer Forschungsdateninfrastruktur für Open Data
  • Erfassung und Speicherung von Forschungsdaten im Fachbereich Chemie: Bereitstellung moderner Forschungs-infrastrukturen durch ein elektronisches Laborjournal mit Repositorium-Anbindung
  • Chancen und Herausforderungen im Zusammenspiel von Forschungsdatenmanagement und Forschungsinformationssystemen
  • Skalierbare und flexible Arbeitsumgebungen für Data-Driven Sciences
    Open Data? Zum Umgang mit Forschungsdaten in den ethnologischen Fächern
  • Projekt DataWiz: Entwicklung eines Assistenzsystems zum Management psychologischer Forschungsdaten

Hier nochmal die vollständigen bibliographischen Angaben:

Kratzke, Jonas und Heuveline, Vincent (Hrsg.): E-Science-Tage 2017: Forschungsdaten managen, Heidelberg: heiBOOKS, 2017. DOI: 10.11588/heibooks.285.377

[via: RDA-DE]

DARIAH-DE Repository gestartet

Geistes- und Kulturwissenschaftlerinnen und -wissenschaftler können ab sofort ihre Forschungsdaten dauerhaft, nachnutzbar und referenzierbar im DARIAH-DE Repository speichern. Im Rahmen von Forschungsprojekten anfallende Daten können dort von Wissenschaftlerinnen und Wissenschaftlern verwaltet und selbstverantwortlich veröffentlicht werden. Das DARIAH-DE Repository baut dabei auf die langjährig erprobte Technologie und Erfahrungen des TextGrid Repositorys auf, unterstützt allerdings sämtliche Datenformate. Darüber hinaus wird das Einspielen von Forschungsdaten mit einem vereinfachten Publikationsprozess über eine Webanwendung ermöglicht.

Daten im DARIAH-DE Repository werden als Open Access unter freien Lizenzen veröffentlicht. Das Repository ermöglicht auch eine einfache Eintragung der Metadaten in die DARIAH-DE Collection Registry und damit eine Indizierung in der DARIAH-DE Generic Search. Weitere Informationen sind unter https://de.dariah.eu/repository zu finden, erste Erfahrungsberichte im DHd-Blog.

Der Betrieb des DARIAH-DE Repository wird durch das Humanities Data Centre (HDC) sichergestellt. Das HDC ist eine Kooperation der Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG) und der Niedersächsischen Staats- und Universitätsbibliothek Göttingen (SUB). Beide Einrichtungen sichern so gemeinsam die Nachhaltigkeit der Forschungsdaten auch langfristig ab.

Workshop „Datenaufbereitung und Dokumentation“ am 19./20. Februar 2018 in Bamberg

Das LIfBi richtet am 19./20. Februar 2018 den nächsten Workshop „Datenaufbereitung und Dokumentation“ in Bamberg aus. Die Teilnahme ist gebührenfrei.

Eine Website mit Informationen zum Workshop und einer expliziten Registrierungsseite ist ab sofort online verfügbar.

Ziel des Workshops ist der lösungsorientierte, praktische Austausch über Fragestellungen in der Datendokumentation und -produktion in sozialwissenschaftlichen Längsschnittstudien. Das Format wird wieder nach dem Modell der Open Space Technology ohne vorab festgelegtes Programm durchgeführt. Der Workshop wird sich inhaltlich selbst organisieren, d. h. Themen, Vorträge und Diskussionen werden erst vor Ort festgelegt. Daher sollten alle Teilnehmenden bereit sein, ihr Wissen mit den anderen Teilnehmenden aktiv zu teilen. Wünschenswert ist zudem, sich bereits im Vorfeld Gedanken über Themenfelder zu machen, die es wert sind, vor Ort besprochen zu werden.

Die Sprache des Workshops war bisher Deutsch. Probleme damit sollten bei der Anmeldung thematisiert werden.

Der Workshop richtet sich an Mitarbeitende in sozialwissenschaftlichen (Längsschnitts-)Studien, die operativ mit der Datendokumentation und Datenproduktion beschäftigt sind. Der Workshop hat einen mehr oder weniger festen Teilnehmerkreis, der selbstverständlich für sinnvolle Ergänzungen offen ist. Zum Workshop existiert neben diesem Blog auch auch eine Mailingliste.

Im Anschluss an die Veranstaltung findet ebenfalls am LIfBi der 12. Workshop der Panelsurveys im deutschsprachigen Raum statt. Auch die Registrierung und Informationsverteilung zu diesem Workshop läuft über die oben genannte Anmeldeseite.