Knut Wenzig – Seite 5 – Survey Data Blog

Datenschutz am LIfBi – Ergebnisse eines Besuchs des BfDI

Briefkopf des Beratungs- und Kontrollberichts

Der Bundesbeauftragte für den Datenschutz und die Informationsfreiheit (BfDI) war Anfang 2018 zu einem Informations-, Beratungs- und Kontrollbesuchs beim Leibniz-Institut für Bildungsverläufe in Bamberg (LIfBi). Die Einschätzungen aus der Sicht des Datenschutzes zur Speicherung von Befragtenadressen, Einverständniserklärungen, Einwilligung von Minderjährigen, Anonymisierung oder Datenweitergabe innerhalb des Konsortiums sind sicherlich auch in vielen anderen Instituten von großem Interesse.

Zum Glück hat sich der BfDI im Rahmen einer Transparenzinitiative entschlossen, alle Antworten auf Anfragen nach Informationsfreiheitsgesetz gleich vollständig zu veröffentlichen (»Access for one – access for all«). Deswegen ist der Bericht vom August 2018 nun als PDF verfügbar.

Was machen wir (eigentlich) mit Git?

Das Git-Logo

Wem Metadaten nicht fremd sind, ist vielleicht für einen Metadiskurs empfänglich. Im Beitrag „Version Control: Zur softwarebasierten Koordination von Ko‑laboration“ rekonstruiert Marcus Burkhardt die Entwicklung von zentralisierten zu verteilten Versionskontrollsystemen. Dabei beschreibt er auch, wie bestimmte Arten der Zusammenarbeit direkt von der verwendeten Software abhängen oder erst entwickelt werden müssen, um eine Software auf eine bestimmte Art und Weise zu nutzen.

Wer es etwas alltagsorientierter mag, findet übrigens bei heise.de eine zweiteilige Reihe „Die vielfältigen Fähigkeiten von Git“ (Teil 1, Teil 2), die gleichermaßen interessant ist.

DFG-Kodex „Leitlinien zur Sicherung guter wissenschaftlicher Praxis“

Die DFG hat den Kodex „Leitlinien zur Sicherung guter wissenschaftlicher Praxis“ veröffentlicht, der am 1. August 2019 in Kraft tritt und von allen Hochschulen und außeruniversitären Forschungseinrichtungen bis zum 31.07.2021 rechtsverbindlich umzusetzen ist, um auch zukünftig Fördermittel der DFG zu erhalten.

Für das Forschungsdatenmanagement relevante Leitlinien sind insbesondere:

Leitlinie 7: Phasenübergreifende Qualitätssicherung
Leitlinie 10: Rechtliche und ethische Rahmenbedingungen, Nutzungsrechte
Leitlinie 11: Methoden und Standards
Leitlinie 12: Dokumentation
Leitlinie 13: Herstellung von öffentlichem Zugang zu Forschungsergebnissen
Leitlinie 17: Archivierung

Anonym vs. pseudonym

Das Blog netzpolitik.org berichtet unter dem Titel „Weitere Studie belegt Lüge ‚anonymer‘ Daten“ über eine Studie in der wissenschaftlichen Fachzeitschrift Nature, die Probleme bei der Anonymisierung beschreibt. Durch Streichung der Namen erreiche man keine Anonymität, sondern in lediglich Pseudonymität.

CfP für EDDI2019 im finnischen Tampere

EDDI-Logo

Die EDDI2019 findet am 3. und 4. Dezember 2019 im finnischen Tampere statt. Der Call for Papers läuft noch bis 1. September.

Kurzbericht vom jährlichen Workshop „Datenaufbereitung und Dokumentation“

Der diesjährige Workshop wurde vom DZHW organisert, er fand erneut im Vorfeld des Panelworkshops statt. Im bewährter Art und Weise wurde nach der open-space-Methode vorgegangen.

Das war die Tagesordnung des zweiten Tags.

Dabei wurden etwa die Ergebnisse des Plausibilisierungsworkshops aufgegriffen oder über die Zusammenarbeit mit den Erhebungsinstituten diskutiert. Auch Techniken und Konzepte der Datenaufbereitung, Vorgehensweise bei Berufskodierungen oder Probleme des Datenschutzes fanden am ersten Tag Beachtung.

Stichproben und Gewichtung, strukturierte Metadaten und Kontextdaten waren Themen am zweiten Tag.

Im nächsten Jahr soll der Workshop um einen halben Tag verlängert werden, der für die Ergebnissicherung genutzt werden soll.

Regelmäßige Updates zu einschlägigen Topics gibt es hier im Blog, außerdem steht mit [Datenproduktion] eine Mailingliste zur Verfügung. In beiden Medien wird die Einladung für den nächsten Workshop veröffentlicht, der dann vermutlich vom Panelworkshop entkoppelt sein wird.

RDA Deutschland: Tagung 2019 [Update]

Das Jahrestreffen der deutsche RDA-Community wird am 19:/20. Februar 2019 am GFZ in Potsdam stattfinden.

Schwerpunktthema der Tagung wird die Nationale Forschungsdateninfrastruktur sein. Beiträge in Posterform sind willkommen. Im Rahmen der Tagung wird auch die öffentliche Mitgliederversammlung von RDA-DE e.V. stattfinnden.

Update 18.01.2019: Das Programm ist veröffentlicht, die Anmeldung ist jetzt möglich und der Teilnahmebeitrag beträgt 80 EUR.

Jetzt zur EDDI 2018 in Berlin anmelden

Die EDDI2018 findet am 4. und 5. Dezember 2018 in Berlin statt. Neben vielen Vorträgen und Diskussionen zum Metadatenstandard DDI stehen auch wieder Tutorials auf dem Programm. Die Keynote wird Simon Hodson, Executive Director of CODATA mit dem Titel „Making Fair Data a Reality… and the Challenges of Interoperability and Reusability” halten. Die Anmeldung zum regulären Preis (240 EUR) läuft noch bis zum 18. November.

ESRA 2019 in Zagreb: Abstracts bis 18. November 2018 einreichen

Banner der ESRA 2019. Quelle: https://www.europeansurveyresearch.org/conferences/overview

Die Konferenzen der European Survey Research Association (ESRA) bieten auch immer die Möglichkeit, Themen aus Forschungsdatenzentren zu diskutieren. Die 8. ESRA-Konferenz findet im Juli 2019 in Zagreb statt. Der Call for Abstracts läuft noch bis 18. November 2018, es wurden 120 Sessions angenommen.

Im Bereich Data management and post-survey processing, der für Forschungsdatenzentren interessant sein dürfte, vier Sessions:

Aber auch in den Bereichen

Survey methods and data quality
Questionnaire design and testing
Modes of data collection
Survey fieldwork processes
Combining survey data with other sources

dürften sich Sessions mit attraktiven Themen finden lassen.

Google will Datensätze finden

Update: Im Blogbeitrag Building Google Dataset Search and Fostering an Open Data Ecosystem gibt es weitere Informationen.

Google hat eine Beta-Version der Google-Datensatz-Suche veröffentlicht. Damit werden heute schon insbesondere alle Datensätze gefunden, für die bei der da|ra DOIs registriert wurden. Details zu dem neuen Suchdienst finden sich im Beitrag „Making it easier to discover datasets“ im Google-Unternehmensblog.

Wahrscheinlich das interessanteste Feature, das die Datensatz-Suche von Google von anderen Angeboten (RatSWD, B2FIND, gesisDataSearch) unterschiedet, ist die Möglichkeit auch Variablen zu finden. Es lohnt sich also, Metadaten auf Variablenebene vorzuhalten. Hierfür wurde mit variableMeasured eine Erweiterung des zugrundeliegenden Datensatz-Schemas im schema.org-Vokabular vorgeschlagen.