How to make statistical analysis code reproducible and reusable (Webinar)

Das Helmholtz Open Science Koordinationsbüro setzt seine Reihe mit Webinaren fort.

Hier die Infos zum zweiundfünfzigsten Webinar:

  • Dr. Elmar Spiegel (HMGU):
  • „How to make statistical analysis code reproducible and reusable“
  • Donerstag, 10.10.19, 15 bis 15.30 Uhr oder
    Freitag, 25.10.19, 11 bis 11.30 Uhr (Wiederholung).

Im Anschluss an die Webpräsentation steht der Referent im Livechat zur Verfügung. Eine Anmeldung für das Webinar ist nicht erforderlich, Es gibt weitere Informationen zur Teilnahme.

Via: Mailingliste [RDA-DE]

Professur für Datenmanagement

Die TU Chemnitz schreibt derzeit eine W3-Professur für Datenmanagement aus.

Eine möglichst hohe Übereinstimmung mit den Themen

  • Datenbanktechnologien, Datenverwaltungssysteme
  • Integration, Verwaltung und Verarbeitung sehr großer Datenmengen

und mindestens einer der folgenden Schwerpunkte sind gewünscht:

  •  Wissensrepräsentation und –management
  • Cyber Physical Systems (CPS)
  • Linked Data
  • Open Data
  • Digitale Daten Ökosysteme
  • Data Analytics/Big Data
  • Data Mining
  • Datenbanken/Informationssysteme
  • Data Analytics
  • Data Governance

Datenschutz am LIfBi – Ergebnisse eines Besuchs des BfDI

Briefkopf des Beratungs- und Kontrollberichts

Der Bundesbeauftragte für den Datenschutz und die Informationsfreiheit (BfDI) war Anfang 2018 zu einem Informations-, Beratungs- und Kontrollbesuchs beim Leibniz-Institut für Bildungsverläufe in Bamberg (LIfBi). Die Einschätzungen aus der Sicht des Datenschutzes zur Speicherung von Befragtenadressen, Einverständniserklärungen, Einwilligung von Minderjährigen, Anonymisierung oder Datenweitergabe innerhalb des Konsortiums sind sicherlich auch in vielen anderen Instituten von großem Interesse.

Zum Glück hat sich der BfDI im Rahmen einer Transparenzinitiative entschlossen, alle Antworten auf Anfragen nach Informationsfreiheitsgesetz gleich vollständig zu veröffentlichen (»Access for one – access for all«). Deswegen ist der Bericht vom August 2018 nun als PDF verfügbar.

Treffen zur Entwicklung einer Leitlinie zur Datenplausibilisierung am 26.8.19 in Berlin

Am 26. August 2019 findet von 11 bis 16 Uhr in den Räumen des DIW Berlin ein weiteres Treffen zur Entwicklung einer Leitlinie zur Datenplausibilisierung statt.

Die Enwicklung einer solchen (bislang fehlenden) Leitlinie wurde auf dem Workshop „Datenaufbereitung und Dokumentation“ 2017 initiert. Das Treffen am 26. August schließt an eine 2018 durchgeführte Erhebung der Plausibilisierungspraktiken bei 10 großen Forschungsinstituten (u.a. SOEP und DZHW) sowie ein erstes Austauschtreffen zu den aktuellen Plausibilisierungspraktiken im Herbst 2018 (und einer weiteren Arbeitsgruppe auf dem Workshop „Datenaufbereitung und Dokumentation“ 2018) an und hat das Ziel einen Vorschlag für eine Leitlinie zur Datenplausibilisierung zu entwickeln.

Zu dem Treffen sind explizit auch an der Mitarbeit interessierte Kolleg*innen eingeladen, die sich gerade mit dem Thema beschäftigen und an den bisherigen Treffen nicht teilnehmen konnten.

Wir freuen uns über eine kurze Rückmeldungen bis zum 23.8. und verbleiben mit Grüßen aus Berlin und Hannover

Andreas (Franken) vom FDZ SOEP sowie Andreas (Daniel) und Percy (Scheller) vom FDZ-DZHW

Was machen wir (eigentlich) mit Git?

Das Git-Logo

Wem Metadaten nicht fremd sind, ist vielleicht für einen Metadiskurs empfänglich. Im Beitrag „Version Control: Zur softwarebasierten Koordination von Ko‑laboration“ rekonstruiert Marcus Burkhardt die Entwicklung von zentralisierten zu verteilten Versionskontrollsystemen. Dabei beschreibt er auch, wie bestimmte Arten der Zusammenarbeit direkt von der verwendeten Software abhängen oder erst entwickelt werden müssen, um eine Software auf eine bestimmte Art und Weise zu nutzen.

Wer es etwas alltagsorientierter mag, findet übrigens bei heise.de eine zweiteilige Reihe „Die vielfältigen Fähigkeiten von Git“ (Teil 1, Teil 2), die gleichermaßen interessant ist.

DFG-Kodex „Leitlinien zur Sicherung guter wissenschaftlicher Praxis“

Neuer DFG-Kodex

Die DFG hat den Kodex „Leitlinien zur Sicherung guter wissenschaftlicher Praxis“ veröffentlicht, der am 1. August 2019 in Kraft tritt und von allen Hochschulen und außeruniversitären Forschungseinrichtungen bis zum 31.07.2021 rechtsverbindlich umzusetzen ist, um auch zukünftig Fördermittel der DFG zu erhalten.

Für das Forschungsdatenmanagement relevante Leitlinien sind insbesondere:

  • Leitlinie 7: Phasenübergreifende Qualitätssicherung
  • Leitlinie 10: Rechtliche und ethische Rahmenbedingungen, Nutzungsrechte
  • Leitlinie 11: Methoden und Standards
  • Leitlinie 12: Dokumentation
  • Leitlinie 13: Herstellung von öffentlichem Zugang zu Forschungsergebnissen
  • Leitlinie 17: Archivierung

Anonym vs. pseudonym

Screenshot netzpolitik.org

Das Blog netzpolitik.org berichtet unter dem Titel „Weitere Studie belegt Lüge ‚anonymer‘ Daten“ über eine Studie in der wissenschaftlichen Fachzeitschrift Nature, die Probleme bei der Anonymisierung beschreibt. Durch Streichung der Namen erreiche man keine Anonymität, sondern in lediglich Pseudonymität.

Kurzbericht vom jährlichen Workshop „Datenaufbereitung und Dokumentation“

Der diesjährige Workshop wurde vom DZHW organisert, er fand erneut im Vorfeld des Panelworkshops statt. Im bewährter Art und Weise wurde nach der open-space-Methode vorgegangen.

Die Tagesordnung am ersten Tag.
Das war die Tagesordnung des zweiten Tags.

Dabei wurden etwa die Ergebnisse des Plausibilisierungsworkshops aufgegriffen oder über die Zusammenarbeit mit den Erhebungsinstituten diskutiert. Auch Techniken und Konzepte der Datenaufbereitung, Vorgehensweise bei Berufskodierungen oder Probleme des Datenschutzes fanden am ersten Tag Beachtung.

Stichproben und Gewichtung, strukturierte Metadaten und Kontextdaten waren Themen am zweiten Tag.

Im nächsten Jahr soll der Workshop um einen halben Tag verlängert werden, der für die Ergebnissicherung genutzt werden soll.

Regelmäßige Updates zu einschlägigen Topics gibt es hier im Blog, außerdem steht mit [Datenproduktion] eine Mailingliste zur Verfügung. In beiden Medien wird die Einladung für den nächsten Workshop veröffentlicht, der dann vermutlich vom Panelworkshop entkoppelt sein wird.

RDA Deutschland: Tagung 2019 [Update]

Logo von RDA-DE

Das Jahrestreffen der deutsche RDA-Community wird am 19:/20. Februar 2019 am GFZ in Potsdam stattfinden.

Schwerpunktthema der Tagung wird die Nationale Forschungsdateninfrastruktur sein. Beiträge in Posterform sind willkommen. Im Rahmen der Tagung wird auch die öffentliche Mitgliederversammlung von RDA-DE e.V. stattfinnden.

Update 18.01.2019: Das Programm ist veröffentlicht, die Anmeldung ist jetzt möglich und der Teilnahmebeitrag beträgt 80 EUR.