Lange Zeit hat das Paket foreign gute Dienste geleistet beim Öffnen und Schreiben von Stata-Datendateien (mit der Dateiendung dta). Die Entwicklung dieser Funktion des Pakets wird leider mit Stata Version 12 eingefroren. Dateien von Stata 13 werden nicht mehr unterstützt.
Die Hilfe zu foreign (s. S. 6 in der Dokumentation) nennt die Pakete memisc und readstata13 als Alternativen. Etwas Recherche fördert dann noch haven zu Tage.
Es folgen die Ergebnisse eines kleinen Tests, bei dem ein etwas erweiterter (construct_test_data.do) auto-Datensatz, wie er von Stata 13 gespeichert wird, Verwendung fand. Hier wurden zweisprachige Label, Umlaute und weitere Missings eingebaut.
Testsieger ist readstata13 von Jan Marvin Garbuszus, Sebastian Jeworutzki u.a. Im von read.dta13 importierten Objekt sind die Label-Informationen aus dem Datensatz als Attribute auch zweisprachig vorhanden.
An zweiter Stelle kommt haven von Hadley Wickham, der die ReadStat C library von Evan Miller verwendet, was prinzipiell nach einer guten Idee klingt. Die Version 0.2.0.9000 importiert zwar etwas, RStudio verweigert aber die Ansicht mit view. Im importierten Objekt ist die Mehrsprachigkeit in den Labels leider dahin.
Das Paket memisc von Martin Elff scheitert vollständig. In Version 0.97 bricht Stata.file den Import ab.
(Danke an Guido Schulz für den Hinweis zu readstata13.)
Schöner Post, Knut. Danke.
Gibt’s schon ’was für Stata 14-Dateien? Das Dateiformat an sich hat sich im Vergleich zu Stata 13-Dateien zwar „nur“ dahingehend geändert, dass es vollständig und zwingend Unicode ist, aber das ist ja dann doch ziemlich substantiell. Und immerhin ist Stata 14 jetzt seit einem halben Jahr auf dem Markt.
Sieht man in der R-Welt dahingehend Bewegung?
Zumindest readstata13 behauptet (https://cran.r-project.org/web/packages/readstata13/README.html) auch mit dem Stata-14-Format (intern: 118) zurechtzukommen. Ich kann das aber derzeit noch nicht überprüfen.