Big Data: 2. DataFest Germany an der LMU München

Nach dem Erfolg der ersten Auflage des DataFest Germany an der Uni Mannheim im letzten Jahr ist der Datenzirkus weitergezogen und macht in diesem Jahr Datafest_smallan der LMU in München Station. Vom 1.-3. April werden wieder Teams von Studierenden aus ganz Deutschland um die Wette rechnen und ihre Fähigkeiten im Umgang mit komplexen Datenstrukturen an einem zur Verfügung gestellten massiven Datensatz testen und weiterentwickeln. Dabei können sie Preise in den Kategorien “Beste Erkenntnis”, “Beste Visualisierung” und “Beste Vewendung externer Datenquellen” gewinnen. Details gibt es unter: http://datafest.de/

Neuer Studiengang zu Survey und Data Science

ipsds
Screenshot: http://survey-data-science.net/

Vor wenigen Tagen ist der neue Studiengang “International Program in Survey and Data Science” (IPSDS) angelaufen. Es handelt sich dabei um ein Kooperationsprojekt der Universität Mannheim und der University of Maryland, das vom Bundesministerium für Bildung und Forschung gefördert wird. Ziel ist es einen berufsbegleitenden Studiengang für Survey-Praktiker zu etablieren. Das Programm ist international ausgerichtet und findet in weiten Teilen online statt. Genauere Informationen findet Mensch hier: http://survey-data-science.net/

Working with the PASS data: User Guide Examples in SPSS

MR_08-15_ENWhile the PASS Scientific Use File has been available in SPSS format since wave 1, PASS support documents for SPSS users have not been available so far. With the recent release of a new Quick Start File the PASS team now provides all the worked examples from the PASS User Guide originally done in Stata as SPSS/PASW code. This includes examples for merging household, individual, spell and weight datsets, as well as using the cross-sectional and longitudinal weights for projections to different populations.

PASS Quick Start File – Analysing the PASS data using SPSS/PASW

Big Data: Erstes DataFest Germany in Mannheim

Datafest_smallVom 20. bis 22. März 2015 fand an der Uni Mannheim das erste DataFest in Deutschland statt. Ca. 90 Studenten von verschiedenen Unis aus dem ganzen Bundesgebiet haben drei Tage lang mehrere Gigabytes an Handy-App-Daten mit Stata und R zerlegt. Ziel war es kurze Präsentationen zu erstellen mit denen sie Preise für die beste Erkenntnis, die beste Visualisierung und die beste Verwendung von zusätzlichen Daten gewinnen konnten.

Teilnehmer bei ersten DataFest Germany
Dieser Marathon ging nicht nur für die Studis sondern auch für das durchschnittliche Notebook an die Belastungs- bzw. Arbeitsspeichergrenze.

Datenaufbereitung: Querschnitts- und Episodendaten zusammenführen

MR_04-15Im Rahmen von Befragungen werden oft Informationen retrospektiv über Zeiträume erhoben: z. B. in Kalendarien oder verschleiften Historien. Die Daten werden dann möglicherweise als Spell- oder Episodendatensatz getrennt von den Querschnittsdaten abgelegt. Für das Panel “Arbeitsmarkt und soziale Sicherungen” (PASS) gibt es jetzt ein Papier das beispielhaft erklärt, wie man in solchen Fällen die Querschnitts- und Episodendaten zusammenführen kann:

PASS Quick Start File – Spellinformationen im Querschnitt

Auch wenn im Beispiel mit PASS-Daten gearbeitet wird ist das Stata-do-File hoffentlich hinreichend allgemein dokumentiert um auch für andere Studien nützlich zu sein. Feedback willkommmen!