Datenaufbereitung: Querschnitts- und Episodendaten zusammenführen

MR_04-15Im Rahmen von Befragungen werden oft Informationen retrospektiv über Zeiträume erhoben: z. B. in Kalendarien oder verschleiften Historien. Die Daten werden dann möglicherweise als Spell- oder Episodendatensatz getrennt von den Querschnittsdaten abgelegt. Für das Panel „Arbeitsmarkt und soziale Sicherungen“ (PASS) gibt es jetzt ein Papier das beispielhaft erklärt, wie man in solchen Fällen die Querschnitts- und Episodendaten zusammenführen kann:

PASS Quick Start File – Spellinformationen im Querschnitt

Auch wenn im Beispiel mit PASS-Daten gearbeitet wird ist das Stata-do-File hoffentlich hinreichend allgemein dokumentiert um auch für andere Studien nützlich zu sein. Feedback willkommmen!

do-Dateien und R-Skripte: Style-Guides helfen, den Code zu verstehen

Wer zusammen Daten aufbereitet, wird wohl oder übel auch einmal in die Lage kommen, Skripte verstehen zu müssen, die andere geschrieben haben. Das ist nicht immer ganz einfach.

Die Situation verbessert sich, wenn der Aufbau des Codes vereinbarten Kriterien folgt und deshalb empfiehlt z.B. Google für die Softwareentwicklung, sich an bestimmte Regeln zu halten: Es gibt Style-Guides für die verschiedensten Programmiersprachen.

styleguides
Verschiedene Style-Guides

Aber auch für Stata und R lassen sich entsprechende Empfehlungen finden:

Code, der Style-Guides entspricht, ist leichter (wieder) zu verstehen und zu warten. Es ist sicher eine gute Idee, sich an solchen Style Guides zu orientieren oder sie für die eigenen Arbeiten anzupassen.