Masse statt Klasse? – Entstehungsprozesse, Qualitätsprobleme und Verwendungsmöglichkeiten von prozessgenerierten Daten im digitalen Zeitalter

Auch wenn prozessproduzierte Massendaten (sogenannte „Big Data“) etwa in Form von staatlichen Verwaltungsdaten eine mehr als zweihundertjährige Tradition haben, hat sich deren Verfügbarkeit in den letzten Jahrzehnten dramatisch gesteigert:

  1. Zum einen werden administrative Daten, die als Nebenprodukt von organisationalen und behördlichen Prozessen entstehen (z.B. Registerdaten, Kundendaten), nicht nur seit den 1970er Jahren digital gespeichert und verarbeitet, sondern werden seit Ende der 1990er Jahre etwa über Forschungsdatenzentren und den RatSWD zunehmend für wissenschaftliche Analysen zugänglich gemacht.
  2. Zum anderen entstehen als Nebenprodukt der digitalen Kommunikation im Web 2.0 neue Arten von Massendaten (z.B. Websites, Blogs, Social Media), die – anders als frühere prozessproduzierte Daten – von den Nutzern dieser Dienste unbewusst und/oder freiwillig generiert werden, bei denen sich die Geschwindigkeit der Datenproduktion stark erhöht hat und die Rechte an den Daten nicht mehr bei staatlichen Akteuren, sondern bei Firmen liegen oder uneindeutig sind.

Nicht nur die Forschungsdatenzentren, sondern auch historische Datenarchive und eine Vielzahl universitärer Projekte arbeiten daran beide Datensorten, also bisher unerschlossene alte Datensammlungen ebenso wie neue digitale Daten, zunehmend für die Forschung zugänglich zu machen. Damit erweitern sich Möglichkeiten für die Sozialwissenschaften, soziale Phänomene sowohl aus aktueller, als auch historischer Blickrichtung zu analysieren. Das gilt umso mehr, je stärker Datensätze miteinander verknüpft und digitale Massendaten in Kombination miteinander und mit forschungsinduzierten Daten einer Analyse zugänglich gemacht werden können.

Im methodologischen Umgang mit diesen Massendaten zeichnet sich ein erstaunlicher Gegensatz ab:

  1. Die empirische Sozialforschung fokussiert sich in ihren Analysen vorwiegend auf die klassischen administrativen Daten, und die Erkenntnis, dass diese Daten sozial konstruiert sind und damit eigene methodologischen Probleme mit sich bringen, die bei der Analyse reflektiert werden müssen. Diese Methodendebatte war bereits ein wesentliches Moment der Gründung der deutschsprachigen Soziologie und der quantitativen empirischen Sozialforschung, die in den 1970ern wiederbelebt wurde. Als Ergebnis dieser Debatte wurde das Konzept der „Datenkunde“ (als alternative zur „Fehlerkunde“ im Survey-Prozess) eingeführt, verbunden mit der Forderung, dass vor der Auswertung eines
    Datenbestands analysiert werden muss, wie die Datenproduktion durch organisationale Regeln, Alltagspraktiken der Datenproduzenten sowie Verhalten der Klienten überformt wird, um daraus die spezifischen Verzerrungen der Population bzw. Stichprobe sowie der Fehler in den Daten zu identifizieren. In den letzten zwei Jahrzehnten existiert vor allem im Kontext der Forschungsdatenzentren eine intensive Methodenforschung, die diese spezifische Verzerrungsprozesse und die sich daraus ergebenden methodologischen Probleme erkundet.
  2. Die internationale „Computational Social Science“ fokussiert in ihren Analysen vorwiegend auf die im Zuge der digitalen Kommunikation entstandenen neuen Sorten von Massendaten. In der Methodenforschung wendet sich die „Computational Social Science“ zunehmend auf neue Analysetechniken und Algorithmen zur Auswertung von Big Data zu. Auch hier zeichnet sich eine Methodendebatte an, die vornehmlich pragmatische Machbarkeitsprobleme ebenso wie die Strukturierung durch Technik thematisiert.

Diese beiden Forschungsstränge sind bislang kaum verbunden und weisen wechselseitige blinde Flecken auf. Durch einen produktiven Austausch könnten beide Forschungsstränge wechselseitig profitieren: Beispielsweise erscheint eine Debatte über die Potentiale neuer Auswertungstechniken aus den Computational Social Science im Bereich der historischen Massendaten vielversprechend. Anderseits erscheint eine kritische Auseinandersetzung mit der Fehlerhaftigkeit und internen Verzerrung von jenen Daten, die in digitalen Prozessen generiert wurden, notwendig.

Dieser Workshop will einen Beitrag zu einem solchen Austausch leisten und hat das Ziel, die Entstehungsbedingungen analoger und digitaler prozess-generierter Daten zu reflektieren und ihre damit verbundenen Verwendungsschwierigkeiten zu diskutieren. Hierzu gehört auch die Frage, ob und wie das Konzept der „Datenkunde“ erweitert oder aktualisiert werden muss. Damit rücken neben messbezogenen Eigenschaften gesellschaftliche, politische und wirtschaftliche Bedingungen in die Betrachtung, die eine Interpretation von Analyseergebnissen erst sinnvoll machen. Der Workshop will diese methodologischen wie theoriebezogenen Fragen auch mit der Absicht stellen, Möglichkeiten aufzuzeigen, mit denen die Aussagekraft prozessgenerierter Daten in sozialwissenschaftlichen Untersuchungen gesteigert werden kann.

Wenn Sie an dem Workshop mit einen Vortrag/einer Präsentation teilnehmen wollen, senden Sie uns bitte das Thema bis zum 30.10.2017 per -Mail an nina.baur@tu-berlin.de zu.

EDDI2017 in Lausanne: Beiträge bis 10. September einreichen

EDDI-Logo

Die Deadline wurde auf den 10. September 2017 verlängert. Jetzt noch Beiträge einreichen für die die EDDI17 die 9th Annual European DDI User Conference, die am 5. und 6. Dezember 2017 in Lausanne (Schweiz) stattfindet statt. Der Call for Papers  gibt eine große Freiheit bei der Themenwahl.

Einladung zur Vorstellung des Beteiligungsmodells für forschungsdaten.info

Logo forschungsdaten.info

Die Organisatoren der Informationsplattform forschungsdaten.info möchten Sie herzlich zu einem öffentlichen Webmeeting am Dienstag, 26. September 2017, um 10 Uhr einladen. In diesem Meeting wird das in den letzten Monaten mit einem kleinen Kreis von Interessenten ausgearbeitete Organisations- und Beteiligungsmodell für die Fortführung von forschungsdaten.info vorgestellt.

Treffpunkt: https://webconf.vc.dfn.de/fdinfo
Passwort: FDM

Um weitere Partner für die Verstetigung und Fortführung der FDM-Informationsplattform forschungsdaten.info zu gewinnen, gibt es regelmäßig (jeden 3. oder 4. Dienstag im Monat um 10 Uhr) die Möglichkeit per Webkonferenz ins Gespräch zu kommen. Alle FDM-interessierten Personen sind herzlich willkommen. Die weiteren Termine werden rechtzeitig über den Verteiler [forschungsdaten] versandt und auch über eventuelle Abweichungen informiert.

Neue Interessierten bitte die folgenden Punkte:

  • Auf der Redmine-Projektplattform der Universität Konstanz liegen unter dem Projektnamen fd-info alle relevanten Informationen und Dokumente, wie bspw. das Organisations- und Beteiligungsmodell zur Verstetigung von forschungsdaten.info. Zugang erhalten interessierte Personen durch eine formlose E-Mail an fdm.kim@uni-konstanz.de.
  • Einige werden aktiv mitarbeiten, andere werden lediglich hineinhören wollen. Beide Gruppen sind eingeladen.
  • Auch wer dieses Mal nicht teilnehmen kann, kann Feedback geben oder bei späteren Treffen einsteigen.
  • Vorher bitte ausprobieren, ob Browser und Audiogerät den Raum unterstützt (bzw. andersrum). Bei Fragen kann man sich gern auch an Jessica Rex oder Frank Tristram wenden (Linuxnutzer bitte an Frank Tristram).

EDDI2017 in Lausanne: Beiträge bis 4. September einreichen

EDDI-Logo

Am 5. und 6. Dezember 2017 findet in Lausanne mit der EDDI17 die 9th Annual European DDI User Conference statt. Der Call for Papers wurde gerade veröffentlicht. Er gibt eine große Freiheit bei der Themenwahl und hat sich im Vergleich zum Vorjahr kaum geändert.

Workshop „Survey‐Forschung als sozialer Prozess“

TU Berlin, 1./2. Juni 2017

(Anmeldung bis zum 25.05.2017)

Die quantitative Survey‐Forschung zielt auf eine möglichst beobachterunabhängige Beschreibung sozialer Phänomene ab. Gegenüber der qualitativen Sozialforschung beansprucht sie den Vorzug einer durch große Zufallsstichproben und Standardisierung gegebenen Verallgemeinerbarkeit sowie Vergleichbarkeit von Ergebnissen aus verschiedenen Kontexten. Im Unterschied zu prozessproduzierten Massendaten bzw. ‐akten (etwa staatlichen Verwaltungsdaten und Big Data), wird der Vorzug der theoriegeleiteten Datenerhebung und ‐auswahl betont. Seit den Anfängen der sozialwissenschaftlichen Surveyforschung war die Standardisierung des Forschungsprozesses mit dem Streben nach wissenschaftlicher Objektivität verbunden. Noch heute arbeiten die großen internationalen Forschungsinstitute primär auf der Grundlage von standardisierten Befragungen.

In Vergessenheit geriet im Zuge der erfolgreichen Institutionalisierung der Survey‐Forschung jedoch, dass diese selbst als sozialer Prozess verstanden werden kann. Aus organisations‐ und marktsoziologischer Perspektive erscheint Survey‐Forschung – erstens – als ein Markt, in dem Projekte in komplexen, arbeitsteiligen, transorganisationalen Produktionsketten umgesetzt werden. Die soziale Logik der Herstellung von Wissen beschränkt sich dabei nicht auf die kommerzielle Markt‐ und Meinungsforschung, sondern liegt auch nationalen wie kulturvergleichenden Studien wie ISSP, EVS, ESS, dem World Value Survey usw. zugrunde. In die Wissensproduktion durch die empirische Sozialforschung sind – zweitens – verschiedene soziale Felder (Bourdieu), Konventionen (Ökonomie der Konventionen) und Wissensordnungen (Wissenssoziologie) involviert, die ihren je spezifischen Bewertungsmaßstäben Geltung verschaffen und dadurch konstitutiv für die Prozesse und Produkte der empirischen Sozialforschung sind. Obschon die Legitimation fragebogenbasierter empirischer Sozialforschung sich auf Objektivitäts‐ und Neutralitätspostulaten gründet, wirken ihre Befunde – drittens – auf mannigfaltige Weise in die Gesellschaft zurück. Dieser Zusammenhang von Statistik und Herrschaft ist in die Gründungsgeschichte der Sozialforschung eingeschrieben, wie es Desrosières in seinen historischen Arbeiten oder Boltanski und Thévenot am Beispiel von Berufsklassifikationen aufzuzeigen vermochten.

Dieser Workshop setzt sich zum Ziel, die komplexen Produktionsgefüge fragebogenbasierter Sozialforschung, ihren performativen Charakter und ihre gesellschaftlichen Implikationen kritisch zu reflektieren. Es gilt dabei, Instrumente, Prozesse und Resultate genauer zu betrachten und die für gewöhnlich vernachlässigten Anwendungsbedingungen und Produktionsprinzipien der Survey‐Forschung als dem vermeintlich wissenschaftlich‐neutralen Königsweg soziologischer Methodik offenzulegen. Der Workshop richtet so insgesamt den Fokus auf die Survey‐Forschung als sozialen Prozess. Aus wirtschafts‐ und organisationssoziologischer Perspektive soll etwa thematisiert werden, welche Konventionen die synchrone und diachrone Koordination der Survey‐Produktionskette strukturieren. Aus wissen(schaft)ssoziologischer Perspektive soll die Frage adressiert werden, wie sich der soziale Prozess der Survey‐Forschung in Verfahren, Datenqualität, Messergebnisse und Interpretationen niederschlägt und so hintergründig an der Wissensproduktion konstitutiv beteiligt ist. In herrschaftssoziologischer Absicht soll dann die Frage aufgeworfen werden, wie die empirische Sozialforschung an der Herstellung und Aufrechterhaltung der sozialen Wirklichkeit und der Gesellschaft mitwirkt. Aus methodologischer Perspektive stellt sich schließlich die Frage, inwiefern dieser soziale Prozess der Survey‐Forschung im Alltagshandeln der Forschenden selbst reflektiert werden kann, um den Forschungsprozess zu verbessern und dessen Grenzen aufzuzeigen.

Organisation

Caroline Näther, Andreas Schmitz, Raphael Vogel, Alice Barth und Nina Baur

Kontakt

survey@mes.tu‐berlin.de oder sekretariat@mes.tu‐berlin.de

Anmeldung

Zwecks Planung wird um Voranmeldung bis zum 25.05.2017 gebeten.

Programm

Donnerstag, 1. Juni 2017, 13–18.30 Uhr

13.10–14 Uhr

Willkommen, Registrierung und Snacks

14–14.45 Uhr

Begrüßung und Einleitung: Interpretativität und Survey‐Forschung (Nina Baur)

I. Wissen, Praktiken und Konventionen der Survey‐Forschung

15–15.45 Uhr

Beurteilung der Qualität von Survey‐Daten (Jörg Blasius, Universität Bonn)

16–16.45 Uhr

Konstruktäquivalenz und Inhaltsvalidität als besondere Herausforderung in der kulturvergleichenden Forschung (Wolfgang Aschauer, Universität Salzburg)

17–17.45 Uhr

Funktionale Äquivalenz in der interkulturellen Survey‐Forschung –
am Beispiel der Methodenäquivalenz (Martin Weichbold, Universität Salzburg)

18–18.30 Uhr

Abschlussdiskussion des Tag 1 (Moderation: Caroline Näther)

ca. 19 oder 19.30 Uhr

Abendessen im Mar y Sol (Tapas und Spanisches Essen, Savignyplatz 5, 10623 Berlin)

Freitag, 2. Juni 2017, 9–18 Uhr

II. Organisation von Survey‐Forschung

9.30–10 Uhr

Kaffee

10–10.45 Uhr

Die Entscheidung zur Befragungsteilnahme aus der Perspektive soziologischer
Handlungstheorie(n) (Michael Weinhardt, Universität Bielefeld)

11–11.45 Uhr

Surveys als Bestandteil einer Nationalen Forschungsdaten‐Infrastruktur (Stefan Liebig, Universität Bielefeld)

12–12.45 Uhr

Das Hinterland der schweizerischen Survey‐Landschaft. Auf Qualitätskonventionen gestützte Übersetzungs‐ und Koordinationsprozesse entlang der Quality Convention Chain von Surveys (Caroline Näther, Universität Luzern)

12.45–14.30 Uhr

Mittagspause im Manjurani (Indisches Restaurant, Knesebeckstraße 4, 10623 Berlin)

14.30–15.15 Uhr

Die Einbettung von Surveys in Survey‐Welten (Raphael Vogel, Universität Luzern)

III. Macht und Kultur in der Survey‐Forschung

15.30–16.15 Uhr

Prozesse und Mechanismen von Vertrauens‐ und Korruptionskulturen (Peter Graeff, Universität Kiel)

16.30–17.15 Uhr

Meinungsumfrage als ideologische Konsumption – eine feldtheoretische Perspektive (Alice Barth und Andreas Schmitz, Universität Bonn)

17.30 – 18.30 Uhr

Abschlussdiskussion (Moderation: Nina Baur)

19 Uhr

Gemeinsames Abendessen im Restaurantschiff Capt’n Schillow
(Straße des 17. Juni 113)

Ort

Berlin – Institut für Soziologie – Fraunhoferstraße 33‐36 ‐ Raum: FH 919 – 10587 Berlin

Anfahrtsbeschreibung

http://www.soz.tu‐berlin.de/menue/kontakt/ sowie http://fahrinfo.bvg.de

Empfohlene Hotels in der Nähe des Veranstaltungsorts

  • Hotel Otto in der Knesebeckstraße (Entfernung: 750 m, 10 min zu Fuß)
  • Hotel Indigo Berlin Ku’damm in der Hardenbergstraße (Entfernung: 1 km, 12 Min zu Fuß/Buslinie 245 oder M45: Einstieg: Jebensstr., Ausstieg: Marchstraße, ca. 15 Min)
  • Novum Style Hotel Berlin‐Centrum in der Franklinstraße (Entfernung: 850 m, 11 Min zu Fuß/Buslinie 245: Einstieg: Franklinstr., Ausstieg: Marchstraße, ca. 15 Min)
  • Hotel Tiergarten Berlin in Alt‐Moabit (Entfernung: 2,2 km/Buslinie 245: Einsttieg: Turmstraße, Ausstieg: Marchstraße, ca. 20 Min)
  • Motel One Tiergarten (Entfernung: ca. 3 km, U2: Einstieg: Wittenbergplatz, Ausstieg: Ernst‐Reuter‐Platz, ca. 10 Min)
  • Motel One Ku’Damm (Entfernung: 1,5 km, Buslinie 245 oder M45: Einstieg: Jebensstr., Ausstieg: Marchstr., ca. 15 Min)
  • Motel One Hauptbahnhof (Entfernung: ca. 4 km, Buslinie 245: Einstieg: Lesser‐Ury‐Weg, Ausstieg: Marchstraße)

Jetzt anmelden zum nächsten Workshop „Datenproduktion und Datendokumentation“

Das IAB veranstaltet im Rahmen des 11. Workshops der Panelsurveys den nächsten Workshop zur Datenproduktion und Datendokumentation am 20./21. Februar in Nürnberg.

Ziel des Workshops ist der lösungsorientierte, praktische Austausch über Fragestellungen in der Detendokumentation und -produktion in sozialwissenschaftlichen Studien. Das Format wird wieder nach dem Modell der Open Space Conference ohne vorher festgelegtes Programm durchgeführt.

Alle Teilnehmenden sollten sich im Vorfeld Themen überlegen, die sie gerne vorstellen möchten oder die sie gerne besprechen wollen. Alle Teilnehmenden bringen sich aktiv in den Workshop ein. Die Agenda wird dann vor Ort festgelegt.

Sprache: Die Sprache des Workshops war bisher deutsch. Sollte das Probleme bereiten melden Sie sich bitte.

Zielgruppe: Der Workshop richtet sich an Mitarbeiterinnen und Mitarbeiter sozialwissenschaftlicher Studien, die mit der Datendokumentation und Datenproduktion beschäftigt sind. Der Workshop hat einen mehr oder weniger festen Kreis von Teilnehmenden. Für sinnvolle Ergänzungen sind wir aber durchaus offen.

Anmeldung

Hier kann man sich für den Workshop Datenproduktion und Datendokumentation und/oder den Workshop der Panelsurveys in Deutschland anmelden.

Verpflegung

Die Verpflegung während der Veranstaltung wird vom IAB bereitgestellt. Geplant sind außerdem gemeinsame Abendessen (Selbstzahler) am 20. und 21.Februar. Wir würden uns freuen, wenn Sie daran teilnehmen würden (nähere Informationen dazu erhalten Sie während des Workshops).

Hotels

Für den Workshop wurden Zimmerkontingente reserviert:

Bis zum 15. Januar 2017 steht ein Einzelzimmer-Kontingent im B&B Hotel zur Verfügung. Die Kosten betragen 59,00€ pro Zimmer/Nacht (auf Wunsch kann zusätzlich ein Frühstücksbuffet zum Preis von 8,50€ gebucht werden). Bei der Reservierung bitte das Stichwort „IAB PASS“ und/oder die Reservierungsnummer 66359099 angeben.

Auch das Ramada Hotel hält ein Kontingent bereit. Bis 6. Februar 2017 können Sie unter dem Stichwort „IAB PASS“ Einzelzimmer zum Preis von 88,00€ pro Zimmer/Nacht buchen.

CfP: 2017 German Stata Users Group Meeting

Stata-Banner

We would like to announce the 15th German Stata Users Group meeting to be held Friday, June 23, 2017 at Humboldt University Berlin, Grimm-Zentrum, Geschwister-Scholl-Straße 1, 10117 Berlin.

All Stata users, from Germany and elsewhere, or those interested in learning about Stata, are invited to attend.

Presentations are sought on topics that include the following:

  • User-written Stata programs
  • Case studies of research or teaching using Stata
  • Discussions of data management problems
  • Reviews of analytic issues
  • Surveys or critiques of Stata facilities in specific fields, etc.

The conference language will be English, due to the international nature of the meeting and the participation of non-German guest speakers.

Submission guidelines

If you are interested in presenting a paper, please submit an abstract by email to one of the scientific organizers (max 200 words). The deadline for submissions is March 1, 2017. Presentations should be 20 minutes or shorter.

Registration

Participants are asked to travel at their own expense. There will be a small conference fee to cover costs for refreshments and lunch. There will also be an optional informal meal at a restaurant in Berlin on Friday evening at additional cost.

You can enroll by contacting Christiane Senczek by email or by writing or phoning.

Christiane Senczek
Dittrich & Partner Consulting GmbH
Prinzenstr. 2
42697 Solingen
Tel: +49 (0) 212 2 60 66-0
Email: christiane.senczek@dpc.de

The final program, cost, and venue will be circulated in April 2017.

Cost

  • Meeting only: 45 € (students 35 €)
  • Workshop only: 65 €
  • Workshop and Meeting: 85 €

Organizers

  • Scientific Organizers
  • Logistics Organizer
    • Dittrich & Partner Consulting GmbH (dpc.de), the distributor of Stata in several countries, including Germany, the Netherlands, Austria, the Czech Republic, and Hungary.

Data in the Middle: The common language of research (#iassist17)

IASSTS 2017 Logo
IASSTS 2017 Logo

The 43rd annual conference of the International Association for Social Science Information Services and Technology (IASSIST) will be held in Lawrence, Kansas from May 23-26, 2017.

Many issues around data (sources, strategies, and tools) are similar across disciplines. While IASSIST has its roots in social science data, it has also welcomed discussions over the years of other disciplines‘ issues as they relate to data, data management, and support of users. So again this year, in line with this tradition, we are arranging a conference that will benefit those who support researchers across all disciplines: social sciences, health and natural sciences, and humanities. Please join the international data community in Lawrence, KS, “in the middle” of the U.S., for insights and discussion on how data in all disciplines are found, shared, used, and managed. Join us and draw inspiration from this diverse gathering! 

We welcome submissions for papers, presentations, panels, posters, and pecha kuchas.

The full Call for Proposals, along with the link to the submission form, can be accessed on the conference website here: http://www.iassist17.dept.ku.edu/proposals/

Questions can be directed to the Program Chairs, Samantha Guss and Michele Hayslett, at iassist2017@gmail.com.

We are also accepting submissions for Pre-conference Workshops under a separate Call for Workshops, which can be accessed here: http://www.iassist17.dept.ku.edu/proposals/workshops/

Questions about workshops may be sent to the Workshop Coordinators, Jenny Muilenburg (jmuil@uw.edu) and Andy Rutkowski (arutkowski@library.ucla.edu).

Deadline for all submissions: 21 November 2016.

Notification of acceptance: February 2017.

ESRA 2017 in Lissabon: Abstracts bis 4. Dezember 2016 einreichen

ESRA2017-Logo
Banner der ESRA in Lissabon 2017

Die Konferenzen der European Survey Research Association (ESRA) bieten auch immer die Möglichkeit, Themen aus Forschungsdatenzentren zu diskutieren. Die 7. ESRA-Konferenz findet im Juli 2017 in Lissabon statt. Der Call for Papers läuft noch bis 4. Dezember 2016, es wurden 111 Sessions angenommen.

Sessions im Bereich “Data Management and Archiving” (Auswahl):

Sessions im Bereich “Survey Methodological Research” (Auswahl):

Das ist eine subjektive Auswahl von Sessions mit inhaltlichem Bezug zu diesem Blog. Sie wird gerne ergänzt.

Workshop „Datenaufbereitung und Dokumentation“ am 20./21. Februar 2017 in Nürnberg (korrigiert)

Das IAB/PASS richtet am 20./21. Februar 2017 den nächsten Workshop „Datenaufbereitung und Dokumentation“ in Nürnberg aus.

Fast schon traditionell findet der Workshop im Vorfeld des dann mittlerweile 11. Workshops der deutschsprachigen Panelsurveys statt, der direkt im Anschluss am 21. und 22. Februar 2017 geplant ist.

Informationen zu Programm, Anmeldung und Unterkunft für beide Veranstaltungen folgen.

(Update 17.10.2016: Das Datum wurde eben durch den Veranstalter korrigiert.)