Workshop „Datenaufbereitung und Dokumentation“ am LIfBi

Am LIfBi in Bamberg: der Workshop Datenaufbereitung und Dokumentation

Am 19. und 20. Februar hat der der Workshop „Datenaufbereitung und Dokumentation“ in diesem Jahr am Leibniz-Institut für Bildungsverläufe in Bamberg stattgefunden. In insgesamt 15 Sessions wurden Themen diskutiert, die uns als Datenproduzenten aktuell beschäftigen. Wie immer wurde dabei ein breites Spektrum abgedeckt, von prozessbegleitender Dokumentation über Datenedition bis zu Datenschutz, Nutzersupport und Projektmanagement. Es gab vorab keine fixe Agenda, sondern die Themen haben sich nach dem OpenSpace-Ansatz aus dem Kreis der Teilnehmerinnen und Teilnehmer ergeben.

Der Teilnehmerkreis ist wieder gewachsen und neben vielen alten Bekannten konnten wir auch in diesem Jahr wieder neue Kolleginnen und Kollegen begrüßen. Noch einmal herzlichen Dank an die hervorragenden Gastgeberinnen und Gastgeber vom FDZ des NEPS, die trotz kurzfristiger räumlicher und gesundheitlicher Schwierigkeiten einen sehr produktiven und kurzweiligen Workshop ermöglicht haben! Für das nächste Jahr hat sich das FDZ des DZHW dankenswerter Weise bereiterklärt uns zu beherbergen.

Vielen Dank auch an alle Teilnehmerinnen und Teilnehmer und bis zum nächsten Jahr in Hannover!

Bewerbung für das „International Program in Survey and Data Science“ jetzt möglich

Die Uni Mannheim und das „Joint Program in Survey Methodology“ (Uni Maryland, Uni Michigan und Westat) gehen mit ihrem International Program in Survey and Data Science (kurz: IPSDS) jetzt in die dritte Runde. Wie  Ihr Euch für das Weiterbildungsprogramm bewerben könnt lest Ihr im offiziellen Ankündigungstext. Ach ja: bis Februar 2019 ist die Teilnahme gebührenfrei 🙂

Dear all,
We are pleased to announce that the application process to join the 3rd cohort of the International Program in Survey and Data Science (IPSDS) is now open
The International Program in Survey and Data Science is a joint program offered through the University of Mannheim and the Joint Program in Survey Methodology – a consortium of the University of Maryland, the University of Michigan, and Westat.
The IPSDS offers:

  • A multidisciplinary curriculum with a focus on survey methodology and data science that prepares you for the challenges of working with designed data from surveys and organic data (aka „found data“ or „big data“).
  • A flexible online learning environment that allows you to take courses from anywhere in the world.
  • Live interaction with world-class faculty from leading universities and organizations who will share their academic and practical experience with you.
  • The program is currently funded by a grant from the German Federal Ministry of Education and Research as part of the initiative “Aufstieg durch Bildung: offene Hochschulen.”

Due to the funding, participation in the program until February 2019 is tuition-free.
All relevant information about the admission process can be found at:
http://survey-data-science.net/program/admission.
Please note that we will hold a live online Q&A-session on:

  • November 2, 2017 (18:30-19:30 CET)
  • November 23, 2017 (19:00-20:00 CET
  • January 11, 2018 (19:00-20:00 CET)

You can sign up for the Q&A by sending an email to ipsds@uni-mannheim.de.
Sincerely,
IPSDS Team
Professorship for Statistics and Methodology
University of Mannheim
A5, 6
68131 Mannheim
Tel. ++49 (0) 621 / 181-3771
ipsds@uni-mannheim.de
http://survey-data-science.net

Total Survey Error Call: Einreichung noch bis zum 26. Februar 2017

 

aus Groves und Lyberg (2010)

Der Call for Abstracts für den International Total Survey Error Workshop 2017 läuft noch bis zum 26. Februar. Oberthema dieses Jahr ist Total Survey Error: Combined data products from a TSE perspective, oder etwas spezifischer:

In addition to traditional TSE topics, we are encouraging contributions on:

  • Total error frameworks for Big Data, integrated data sets and products
  • “Total statistical uncertainty” frameworks for estimates derived from nonprobability samples
  • Statistical disclosure limitation error
  • Uses of administrative data to reduce TSE
  • Methods for addressing specification errors in integrated data sets
  • Illuminating the Big Data ETL process black box

Wer also (schon wieder) ins schöne Nürnberg zum IAB fahren möchte kann das vom 12. bis 14. Juni tun. Genaue Infos gibt es hier:

https://www.xing-events.com/itsew2017.html

Ich würde mich freuen die eine oder den anderen aus unserem Kreis da zu treffen. Schließlich müssen wir ja die Fahne für den Processing Error hochhalten. Ich habe manchmal den Eindruck der ist ein wenig das Stiefkind des TSE-Konzepts 😉

Big Data: DataFest Germany zum dritten

Nach den Erfolgen der ersten beiden DataFeste (2015 und 2016) ziehen die Big Data-affinen Studenten zum 3. DataFest Germany vom 7. bis 9. April 2017 wieder nach Mannheim.

Hier die Beschreibung der Veranstalter:

Das DataFest ist Wettbewerb und interdisziplinäreres Team Event zugleich, bei dem ihr die einzigartige Möglichkeit habt, große Datenmengen zu bearbeiten und nach euren Ideen auszuwerten. Außerdem könnt ihr ganz ungezwungen mit führenden Köpfen der Statistik sowie Unternehmen in Kontakt treten.

DataFest 2017 ist bereits das dritte DataFest in Deutschland und wird von einem Konsortium bestehend aus dem Lehrstuhl für Statistik und sozialwissenschaftliche Methodenlehre an der Universität Mannheim, dem Institut für Statistik der LMU München und der P3 Group organisiert.

Unter dem Dach der American Statistical Association finden viele weitere DataFeste in den USA statt. In den vergangenen Jahren haben wir und unsere amerikanischen Partneruniversitäten bereits sehr gute Erfahrungen gemacht.

WAS WIRD DIE AUFGABE SEIN?

Die bereitgestellten Daten sollen eine Überraschung sein und werden erst beim DataFest bekannt gegeben. Soviel sei aber verraten: Geplant ist ein riesiger Datensatz von einem unserer Partner aus der Wirtschaft. In der Vergangenheit wurden beispielsweise Daten vom Los Angeles Police Department daraufhin ausgewertet, wie sich Kriminalität reduzieren lässt. Oder die Daten einer Dating-Website wurden daraufhin untersucht, nach welchen Merkmalen Leute sich ihre künftigen Dates aussuchen. Während der Arbeit kannst du kommen und gehen wie du möchtest. Allerdings ist es nicht erlaubt außerhalb des Veranstaltungsraums am Projekt zu arbeiten. Mindestens zwei Teammitglieder müssen zu Veranstaltungsbeginn anwesend sein.

Präsentiert die Ergebnisse in einer sehr kurzen Präsentation einer bunt gemischten Jury, die sich aus Experten aus verschiedenen Berufsfeldern zusammensetzt. Gewinnen kann man in den Kategorien:

  • Best Insight
  • Best Visualization
  • Best Use of Outside Data

Weitere Details zu Anreise, Anmeldung, Unterkunft und ähnlichem gibt es unter:

http://datafest.de/

Big Data: 2. DataFest Germany an der LMU München

Nach dem Erfolg der ersten Auflage des DataFest Germany an der Uni Mannheim im letzten Jahr ist der Datenzirkus weitergezogen und macht in diesem Jahr Datafest_smallan der LMU in München Station. Vom 1.-3. April werden wieder Teams von Studierenden aus ganz Deutschland um die Wette rechnen und ihre Fähigkeiten im Umgang mit komplexen Datenstrukturen an einem zur Verfügung gestellten massiven Datensatz testen und weiterentwickeln. Dabei können sie Preise in den Kategorien „Beste Erkenntnis“, „Beste Visualisierung“ und „Beste Vewendung externer Datenquellen“ gewinnen. Details gibt es unter: http://datafest.de/

Neuer Studiengang zu Survey und Data Science

ipsds
Screenshot: http://survey-data-science.net/

Vor wenigen Tagen ist der neue Studiengang „International Program in Survey and Data Science“ (IPSDS) angelaufen. Es handelt sich dabei um ein Kooperationsprojekt der Universität Mannheim und der University of Maryland, das vom Bundesministerium für Bildung und Forschung gefördert wird. Ziel ist es einen berufsbegleitenden Studiengang für Survey-Praktiker zu etablieren. Das Programm ist international ausgerichtet und findet in weiten Teilen online statt. Genauere Informationen findet Mensch hier: http://survey-data-science.net/

Working with the PASS data: User Guide Examples in SPSS

MR_08-15_ENWhile the PASS Scientific Use File has been available in SPSS format since wave 1, PASS support documents for SPSS users have not been available so far. With the recent release of a new Quick Start File the PASS team now provides all the worked examples from the PASS User Guide originally done in Stata as SPSS/PASW code. This includes examples for merging household, individual, spell and weight datsets, as well as using the cross-sectional and longitudinal weights for projections to different populations.

PASS Quick Start File – Analysing the PASS data using SPSS/PASW

Big Data: Erstes DataFest Germany in Mannheim

Datafest_smallVom 20. bis 22. März 2015 fand an der Uni Mannheim das erste DataFest in Deutschland statt. Ca. 90 Studenten von verschiedenen Unis aus dem ganzen Bundesgebiet haben drei Tage lang mehrere Gigabytes an Handy-App-Daten mit Stata und R zerlegt. Ziel war es kurze Präsentationen zu erstellen mit denen sie Preise für die beste Erkenntnis, die beste Visualisierung und die beste Verwendung von zusätzlichen Daten gewinnen konnten.

Teilnehmer bei ersten DataFest Germany
Dieser Marathon ging nicht nur für die Studis sondern auch für das durchschnittliche Notebook an die Belastungs- bzw. Arbeitsspeichergrenze.

Datenaufbereitung: Querschnitts- und Episodendaten zusammenführen

MR_04-15Im Rahmen von Befragungen werden oft Informationen retrospektiv über Zeiträume erhoben: z. B. in Kalendarien oder verschleiften Historien. Die Daten werden dann möglicherweise als Spell- oder Episodendatensatz getrennt von den Querschnittsdaten abgelegt. Für das Panel „Arbeitsmarkt und soziale Sicherungen“ (PASS) gibt es jetzt ein Papier das beispielhaft erklärt, wie man in solchen Fällen die Querschnitts- und Episodendaten zusammenführen kann:

PASS Quick Start File – Spellinformationen im Querschnitt

Auch wenn im Beispiel mit PASS-Daten gearbeitet wird ist das Stata-do-File hoffentlich hinreichend allgemein dokumentiert um auch für andere Studien nützlich zu sein. Feedback willkommmen!