Treffen zum Austausch über Plausibilisierungspraktiken am 15.10.18 in Hannover

Am 15.10.2018 soll ein Treffen zur Diskussion von Plausibilisierungspraktiken in großen Befragungsprojekten beziehungsweise bei der Erstellung von Scientific Use Files stattfinden. Das Treffen ist als Startpunkt zu sehen und wird dieses Mal zu Gast beim DZHW in Hannover sein beziehungsweise vom dortigen FDZ organisiert. Das Treffen soll  um 11 Uhr beginnen, grob zwei Blöcke umfassen und mit Pausen nicht länger als bis 16-17 Uhr dauern. Interessierte sollten eine kurze E-Mail an scheller@dzhw.eu oder die anderen unten genannten Organisator*innen des Treffens schicken. Details zur Vorbereitung des Treffens sollen im direkten Vorfeld des Treffens bereitgestellt werden.

Die Initiator*innen des Treffen erhoffen sich größere Klarheit, welche unplausiblen Angaben von den Datenproduzent*innen bereinigt/editiert und welche Entscheidungen den Datennutzer*innen überlassen werden sollten. Daran anknüpfend stellt sich die Frage nach einer möglichst nachvollziehbaren und übersichtlichen Dokumentation von vorgenommenen Korrekturen bzw. eventuell noch im Datensatz vorhandenen Problemen. Ziel ist es Gemeinsamkeiten zu identifizieren und referenzierbare Standards mit verschiedenen Plausibilisierungsstufen oder -formen für die Erstellung von Scientific Use Files zu entwickeln, bei dem pro Stufe/Form die Konsequenzen für die Datennutzer*innen festgehalten werden. Ein solcher Standard würde wiederum die Dokumentation insofern erleichtern, dass auf diesen verwiesen werden könnte (z. B. „Die Studie wurde gemäß Standard B plausibilisiert. –> D.h. für Nutzer*in, er/sie muss bei der Arbeit mit den Daten a), b), c) beachten.“)

Es sind explizit auch Wissenschaftler*innen eingeladen, die nicht zu den Initiator*innen beim Workshop „Datenproduktion“ am 19.02.2018 in Bamberg gehört haben (vgl. auch den Aufruf in diesem Blog vom März). Bitte macht/machen Sie gerne auch Kolleg*innen auf das Treffen aufmerksam und leitet/leiten Sie diese Information weiter.

Wir freuen uns über eine kurze Rückmeldungen und verbleiben mit Grüßen aus Hannover

Florene (Baillet), Anne (Weber), Andreas (Daniel) und Percy (Scheller) vom FDZ-DZHW

Google will Datensätze finden

Screenshot der Google-Datensatz-Suche

Update: Im Blogbeitrag Building Google Dataset Search and Fostering an Open Data Ecosystem gibt es weitere Informationen.

Google hat eine Beta-Version der Google-Datensatz-Suche veröffentlicht. Damit werden heute schon insbesondere alle Datensätze gefunden, für die bei der da|ra DOIs registriert wurden. Details zu dem neuen Suchdienst finden sich im Beitrag „Making it easier to discover datasets“ im Google-Unternehmensblog.

Wahrscheinlich das interessanteste Feature, das die Datensatz-Suche von Google von anderen Angeboten (RatSWD, B2FIND, gesisDataSearch) unterschiedet, ist die Möglichkeit auch Variablen zu finden. Es lohnt sich also, Metadaten auf Variablenebene vorzuhalten. Hierfür wurde mit variableMeasured eine Erweiterung des zugrundeliegenden Datensatz-Schemas im schema.org-Vokabular vorgeschlagen.