Nach dem Erfolg der ersten Auflage des DataFest Germany an der Uni Mannheim im letzten Jahr ist der Datenzirkus weitergezogen und macht in diesem Jahr an der LMU in München Station. Vom 1.-3. April werden wieder Teams von Studierenden aus ganz Deutschland um die Wette rechnen und ihre Fähigkeiten im Umgang mit komplexen Datenstrukturen an einem zur Verfügung gestellten massiven Datensatz testen und weiterentwickeln. Dabei können sie Preise in den Kategorien “Beste Erkenntnis”, “Beste Visualisierung” und “Beste Vewendung externer Datenquellen” gewinnen. Details gibt es unter: http://datafest.de/
Neuer Studiengang zu Survey und Data Science

Vor wenigen Tagen ist der neue Studiengang “International Program in Survey and Data Science” (IPSDS) angelaufen. Es handelt sich dabei um ein Kooperationsprojekt der Universität Mannheim und der University of Maryland, das vom Bundesministerium für Bildung und Forschung gefördert wird. Ziel ist es einen berufsbegleitenden Studiengang für Survey-Praktiker zu etablieren. Das Programm ist international ausgerichtet und findet in weiten Teilen online statt. Genauere Informationen findet Mensch hier: http://survey-data-science.net/
Webinar: Key data: Longitudinal data

Schon wieder ein Webinar aus UK. Am 22. März geht es um die Längsschnittdaten des UK Data Service. Gibt es E-Learning-Angebote im deutschsprachigen Raum, die in die Angebote der Forschungsdatenzentren einführen?
Publikationsorte für Beiträge zu FDZ-Themen

Wo können Beiträge zu Themen der operativen Arbeit in Forschungsdatenzentren publiziert werden? Eine Liste, die derzeit noch einen Schwerpunkt im Bereich Metadaten/DDI hat, findet sich auf BibSonomy.org. Daraus könnte mittelfristig auch eine Bibliographie entstehen. Weitere Hinweise können gerne in den Kommentaren gegeben werden.
[Der Beitrag wurde motiviert duch Diskussionen auf dieser Veranstaltung.]
CfP: 2016 German Stata Users Group Meeting

The 14th German Stata Users Group meeting is announced to be held Friday, June 10, 2016 at GESIS in Cologne. Deadline for submissions is March 1, 2016.
Save the date: EDDI16 am 6./7. Dezember in Köln

Die 8. Konferenz der europäischen DDI-Nutzer_innen findet am 6. und 7. Dezember in Köln statt und bietet den deutschsprachigen Interessierten die Möglichkeit, auf kurzem Weg Zugang zur community zu bekommen. Die Konferenzwebseite enthält schon jetzt einige Hinweise.
Wissen über Zeichensätze und -kodierung

In Forschungsdatenzentren wird oft programmiert. Wer programmiert, entwickelt Software. Joel Spolsky definiert in einem älteren und trotzdem lesenswerten Beitrag ein Mindestmaß an Wissen über Zeichensätze und -kodierung: The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)
Webinar: Einführung in CLOSER Discovery am 25. Februar
Acht UK-Längsschnittstudien werden über das neue Portal CLOSER Discovery erschlossen. In einem einstündigen Webinar am 25. Februar wird die Plattform vorgestellt. Die Anmeldung ist kostenlos.
[via DDI-users]
Workshop „Datenaufbereitung und Dokumentation“ am 22./23. Februar 2016 in Berlin

Das SOEP richtet am 22./23. Februar 2016 den nächsten Workshop „Datenaufbereitung und Dokumentation“ in Berlin am DIW aus.
Wie im letzten Jahr findet der Workshop im Vorfeld des dann mittlerweile 10. Workshops der deutschsprachigen Panelsurveys statt, der direkt im Anschluss am 23. und 24. Februar 2016 geplant ist.
Die Anmeldung zu beiden Veranstaltungen ist ab sofort möglich.
dta-Dateien von Stata 13 in R öffnen

Lange Zeit hat das Paket foreign gute Dienste geleistet beim Öffnen und Schreiben von Stata-Datendateien (mit der Dateiendung dta). Die Entwicklung dieser Funktion des Pakets wird leider mit Stata Version 12 eingefroren. Dateien von Stata 13 werden nicht mehr unterstützt.
Die Hilfe zu foreign (s. S. 6 in der Dokumentation) nennt die Pakete memisc und readstata13 als Alternativen. Etwas Recherche fördert dann noch haven zu Tage.
Es folgen die Ergebnisse eines kleinen Tests, bei dem ein etwas erweiterter (construct_test_data.do) auto-Datensatz, wie er von Stata 13 gespeichert wird, Verwendung fand. Hier wurden zweisprachige Label, Umlaute und weitere Missings eingebaut.
Testsieger ist readstata13 von Jan Marvin Garbuszus, Sebastian Jeworutzki u.a. Im von read.dta13 importierten Objekt sind die Label-Informationen aus dem Datensatz als Attribute auch zweisprachig vorhanden.
An zweiter Stelle kommt haven von Hadley Wickham, der die ReadStat C library von Evan Miller verwendet, was prinzipiell nach einer guten Idee klingt. Die Version 0.2.0.9000 importiert zwar etwas, RStudio verweigert aber die Ansicht mit view. Im importierten Objekt ist die Mehrsprachigkeit in den Labels leider dahin.
Das Paket memisc von Martin Elff scheitert vollständig. In Version 0.97 bricht Stata.file den Import ab.
(Danke an Guido Schulz für den Hinweis zu readstata13.)