Online-Seminar: Structured Data Transformation Language (SDTL), 2. November, 16 Uhr

Die Arbeitsgruppe »Structured Data Transformation Language (SDTL)« der »DDI Alliance« wird am 2. November um 16 Uhr MEZ ein Online-Seminar (Original-Einladung) veranstalten, um den Wert von SDTL für die DDI-Community zu erläutern. SDTL ist ein neues Werkzeug zur Erstellung maschinell verwertbarer Datenprovenienz. Im Webinar wird in SDTL eingeführt und erklärt, wie die Sprache mit DDI verwendet werden kann.

SDTL ist eine unabhängige Sprache zur Darstellung von Datentransformationsbefehlen in statistischen Analysepaketen, wie SPSS, Stata, SAS, R und Python. Befehle wie RECODE, MERGE FILES und VARIABLE LABELS werden in einem strukturierten Format (JSON, XML, RDF) gerendert, das für Computer leicht zu lesen und zu verarbeiten ist. In SDTL übersetzte Befehlsskripte erzeugen Datentransformationshistorien auf Variablen-Ebene, die in natürliche Sprache übersetzt werden können. SDTL kann dem DDI- und anderen Metadatenstandards zur Verwendung in Datenkatalogen, Codebüchern und anderer Dokumentation hinzugefügt werden.

Am Online-Seminar via Zoom teilnehmen: https://us02web.zoom.us/j/82041378650 (Sitzungs-ID: 820 4137 8650).

Virtuelles Symposium „Sozialstrukturelle Merkmale in Umfragen: Erhebung, Kodierung, Harmonisierung“ vom 28.9. bis 1.10.

Sozialstrukturelle Merkmale wie Geschlecht, Familienstand, Bildung oder Erwerbstätigkeit werden in praktisch jeder Umfrage erfasst. Gesellschaftliche Entwicklungen, aktuell z.B. die Einführung eines „Dritten Geschlechts” oder die „Ehe für Alle“, erfordern immer wieder Anpassungen in der Messung einzelner Merkmale. Gleichzeitig wird durch die anhaltende Diskussion über die Wichtigkeit der Nachnutzung und Verlinkung von Daten verschiedener Umfragen das Thema der Vergleichbarkeit, sowohl hinsichtlich der Messung dieser Merkmale als auch der Harmonisierung der resultierenden Daten, bedeutsamer. Eine vergleichbare Messung oder Kodierung dieser Merkmale über die Zeit und auch zwischen Umfragen in Deutschland wäre sehr hilfreich, um Ergebnisse verschiedener Umfragen besser vergleichen zu können, die Repräsentativität einer Stichprobe ermitteln zu können und – zumindest für einzelne Merkmale – auch bei der Berechnung von Gewichten. Die Survey-Praxis zeigt jedoch, dass diese Merkmale häufig unterschiedlich gemessen werden. Dies stellt ein Hindernis für die Vergleichbarkeit dar und führt z.B. zur ständigen Neuentwicklung von Kodierroutinen auf Seiten der Datennutzer*innen, insbesondere wenn Daten verschiedener Umfragen miteinander verglichen werden sollen, und schränkt die Nachnutzbarkeit von Umfragedaten ein.

Das Symposium richtet sich an Vertreter*innen sozialwissenschaftlicher Umfrageprogramme in Deutschland oder deutscher Teilstudien von internationalen Umfragen, Sozialstrukturforscherinnen und Datennutzerinnen, die sich mit sozialstrukturellen Merkmalen beschäftigen. Die Teilnehmerinnen haben die Möglichkeit, sich beispielsweise über folgende Fragen auszutauschen: Wie werden sozialstrukturelle Merkmale in verschiedenen Studien erhoben? Was sind aktuelle Herausforderungen in diesem Bereich? Und was sind die Vor- und Nachteile von standardisierter Messung im Vergleich zur ex-post Harmonisierung der Daten?

Call for papers

Um einen möglichst umfassenden Überblick über den aktuellen Stand und die Herausforderungen in der Messung und/oder Harmonisierung sozialstruktureller Merkmale zu erhalten, laden wir Sie ein, einen eigenen Vortrag (ca. 15 Minuten) einzureichen. Mögliche Themen und Fragestellungen sind:

  • Neue Entwicklungen von Erhebungsinstrumenten zur Erfassung sozialstruktureller Merkmale, die aktuell gesellschaftlichen Veränderungen unterworfen sind (z.B. Familienstand und -formen)
  • Herausforderungen in der Messung, Standardisierung und/oder Harmonisierung eines konkreten sozialstruktureIlen Merkmals, z.B. bezüglich der Einführung eines „Dritten Geschlechts“
  • Berichte zu Angeboten oder konkreten Projekten, die sozialstrukturelle Merkmale ex-post harmonisieren
  • Herausforderungen in der ex-post und/oder ex-ante Harmonisierung sozialstruktureller Merkmale
  • Vorstellung von Strategien, um sozialstrukturelle Merkmale über die Zeit, Erhebungsmodi oder Umfragen hinweg vergleichbar zu machen

Schicken Sie bitte den Titel und ein kurzes Abstract (nicht mehr als 300 Wörter) bis zum 27.7.2020 an verena.ortmanns@gesis.org. Rückmeldung zu Ihrer Einreichung erhalten Sie bis zum 5.8.2020. Wir streben an, die Beiträge und die aus dem Symposium gewonnenen Erkenntnisse anschließend zu publizieren und
diese einem größeren Publikum zugänglich zu machen. Eine Teilnahme ist auch ohne eigenen Vortrag möglich.

Anmeldung

Wenn Sie an dem Symposium teilnehmen möchten – mit oder ohne eigenen Beitrag – melden Sie sich bitte zwischen dem 15.07 und dem 21.09.2020 über nachfolgenden Link an: https://www.gesis.org/angebot/veranstaltungen/tagungen-und-konferenzen/gesis-tagungen/symposium_sozialstrukturelle-merkmale (die Seite wird zum 15.7. freigeschaltet)

Organisatorische Hinweise

Aufgrund der aktuellen Situation wird das Symposium als virtuelle Veranstaltung stattfinden. Wir planen 1-2 Sessions pro Tag. Die Veranstaltung startet am 28.09.2020 um 10 Uhr und endet am 1.10.2020 gegen etwa 15 Uhr, der genaue Ablauf folgt. Es besteht die Möglichkeit, nur an einzelnen Sessions teilzunehmen.
Für informellen Austausch und spezifische Diskussionen im kleinen Kreis werden virtuelle Gruppenräume eingerichtet.
Vor Beginn des Symposiums wird allen registrierten Teilnehmer*innen der Link zur Veranstaltung mit weiteren Instruktionen zugeschickt.
Bei Fragen wenden Sie sich bitte an: verena.ortmanns@gesis.org oder silke.schneider@gesis.org.

Women in Data Science am 25. Juni und auf Twitter

Die Konferenz Women in Data Science 2020 findet am 25. Juni in Mannheim statt. Hinweise zu Programm und Anmeldung gibt es auf der zugehörigen Konferenzwebseite. Die als Zoom-Event geplante Veranstaltung wird gemeinsam organisert vom International Program in Survey and Data Science (IPSDS), einem berufsbegleitenden Masterstudiengang und @SAPNextGen.

Dann gibt es da auch noch einen Twitteraccount @WiDS_Conference, der zu dieser jährlichen Konferenz gehört, zu der es auch regionale Ableger zu geben scheint.

Update 2020-06-04, 12:16: Hinweise zur Veranstaltung um Link zur Konferenzwebseite mit Anmeldeinfos verbessert. (Danke an die Kollegin vom IPSDS-Büro für den freundlichen Hinweis.)

EDDI 2020 – Call for Papers

Wenn es der Virus SARS-CoV-2 zulässt, wird die diesjährige European DDI Users Conference am 1. und 2. Dezember in Paris stattfinden. Der call for papers ist erschienen und Interessierte haben bis 12. Juli Zeit, einen Beitrag einzureichen.

An Inhalt und Format der Konferenz hat sich derzeit noch nichts geändert. Alle Beiträge, die in einer Beziehung zu DDI stehen, sind willkommen.

EDDI-Logo
Logo der EDDI

blog.surveydata.org jetzt bei forschungsdaten.info

Screenshot forschungsdaten.info
Screenshot forschungsdaten.info

Die Redaktion von forschungsdaten.info listet diesen Blog nun im Wissenschaftsbereich Sozial- und Verhaltenswissenschaften. Forschungsdaten.info ist das deutschsprachige Informationsportal zum Thema Forschungsdatenmanagement (FDM). Die Seite führt mit praxisnahen Artikeln ins Forschungsdatenmanagement ein. Die Beiträge umfassen dabei die Schritte von der Antrags­planung eines Forschungs­projekts, die Arbeit mit Forschungsdaten im Forschungsalltag, die Umsetzung des Antrags bis hin zur Publikation der Daten. Die Themen Bewahrung und Nachnutzung der entstandenen Forschungs­daten sowie Rechte und Pflichten im Umgang mit Forschungsdaten werden ebenfalls behandelt. Zusätzlich liefern Best-Practice-Beispiele und Informationsmaterial aus den einzelnen Wissenschaftsbereichen Anregungen, um Daten besser (nach-)nutzbar zu machen. Auch stellen sich auf forschungsdaten.info FDM-Initiativen und -Projekte aus dem deutschsprachigen Raum vor. Redaktionell wird die Plattform von einem überregionalen Team von FDM-Spezialistinnen und -Spezialisten betreut.

Kollaboration in Zeiten von Corona mit GWDG Rocket.Chat und GWDG Pad

Screenshot von GWDG Rocket.Chat

In vielen Bereichen von Wissenschaft und Forschung wird mobiles Arbeiten gerade massiv ausgedehnt. Messenger-Dienste werden das Gespräch auf dem Flur ersetzen und für den informellen Austausch sorgen.

Wahrscheinlich spielen Dienste wie WhatsApp, die man vor allem privat einsetzt, eine wichtige Rolle. Aber auch Kollaborationsplattformen wie Slack oder Microsoft Teams werden in den Fokus rücken. Andernorts kommt vielleicht das selbst gehostete Mattermost zum Einsatz.

Gerade für Wissenschaftsorganisationen, in denen derzeit noch keine solchen Lösungen in der Breite genutzt werden, und die jetzt auf die Schnelle eine Lösung brauchen, ohne in IT zu investieren oder die Daten in die Hände von kommerziellen Anbietern übergeben zu müssen, gibt es eine gute Alternative.

Die Gesellschaft für wissenschaftliche Datenverarbeitung Göttingen (GWDG), quasi das Rechenzentrum der Universität Göttingen und der Max-Planck-Gesellschaft, stellt den Dienst Rocket.Chat (basierend auf der gleichnamigen Software) kostenfrei zu Verfügung. Nach Anmeldung können Mitglieder in private Räume eingeladen werden, in denen nochmal spezielle Unterhaltungen gestartet – und damit etwas ausgelagert – werden können. Außerdem sind auch 1:1-Unterhaltungen möglich.

Gleichzeitig steht für alle Accounts der Dienst GWDG Pad, einen kollaborativer Echtzeit-Editor, zur Verfügung. Die Softwarebasis ist hier CodiMD.

An NADDI2020 aus dem Homeoffice teilnehmen

Logo der North American DDI Users Conference
Logo der North American DDI Users Conference

Wegen der Corona-Pandemie wird die North American DDI Users Conference (NADDI), die im Juni diesen Jahres in Minneapolis stattfinden sollte, virtuell stattfinden. Damit eröffnen sich auch neue Möglichkeiten der Teilnahme.

In der Woche vom 17. Juni werden virtuelle Präsentationen stattfinden. Sie werden zeigen, wie Metadatenstandards, einschließlich und insbesondere DDI, Daten auffindbar, zugänglich, interoperabel und wiederverwendbar machen (FAIR). Weitere Informationen werden in den kommenden Monaten auf der Konferenz-Webseite und der Mailingliste der DDI-Alliance.

Rechtsgrundlagen der Anonymisierung

Logo des BfDI

In einem ersten öffentlichen Konsultationsverfahren bittet der Bundesbeauftragte für den Datenschutz und die Informationsfreiheit um Stellungnahmen zu seiner Analyse (PDF) der Rechtsgrundlagen für eine Anonymisierung von Daten.

Auch wenn die Konsultation einen besonderen Fokus auf die Telekommunikationsbranche richtet, dürfte die Analyse trotzdem interessant sein. Die Zusammenfassung lautet:

„Eine Anonymisierung …

  • liegt vor, wenn der Personenbezug von Daten derart aufgehoben ist, dass er nicht oder nur unter unverhältnismäßigem Aufwand an Zeit, Kosten und Arbeitskräften wiederhergestellt werden kann.
  • stellt eine Verarbeitung personenbezogener Daten dar und bedarf als solche einer Rechtsgrundlage.

Je nach Kontext und Zweck der Anonymisierung kommen mehrere Rechtsgrundlagen in Betracht, insbesondere der Tatbestand der kompatiblen Weiterverarbeitung (Art. 6 Abs. 4 DSG-VO i.V.m. der ursprünglichen Rechtsgrundlage) und die Erfüllung einer rechtlichen Verpflichtung (Art. 6 Abs. 1 Buchst. c) DSGVO).
Eine Verpflichtung zur unverzüglichen Löschung ist durch eine Anonymisierung erfüllbar.“

Kommentare und Stellungnahmen können bis einschließlich 9. März 2020 an konsultation@bfdi.bund.de geschickt werden.

Terminhinweis: EDDI2020 wird am 1./2. Dezember stattfinden

EDDI-Logo
EDDI-Logo

Die EDDI2020 wird am 1./2. Dezember in Paris stattfinden. Die Ausrichterin ist SciencesPo, eine sozialwissenschaftliche Hochschule mit 150jähriger Tradition.

Wie in den letzten Jahren ist damit zu rechnen, dass es an den beiden Tagen vor und nach der Konferenz Tutorials und Side-Meetings geben wird.

Ein großer Teil der Präsentationen, Poster und Tutorials von der vergangenen EDDI19 in Tampere ist bereits bei Zenodo verfügbar.