Analyse der Panelausfälle im SozioOekonomischen Panel SOEP

Lade...
Vorschaubild
Dateien
Gramlich_dipl.pdf
Gramlich_dipl.pdfGröße: 1.96 MBDownloads: 777
Datum
2007
Autor:innen
Herausgeber:innen
Kontakt
ISSN der Zeitschrift
Electronic ISSN
ISBN
Bibliografische Daten
Verlag
Schriftenreihe
Auflagebezeichnung
DOI (zitierfähiger Link)
ArXiv-ID
Internationale Patentnummer
Angaben zur Forschungsförderung
Projekt
Open Access-Veröffentlichung
Open Access Green
Core Facility der Universität Konstanz
Gesperrt bis
Titel in einer weiteren Sprache
Analysis of Panel Attrition in the German Socio Economic Panel Study GSOEP
Forschungsvorhaben
Organisationseinheiten
Zeitschriftenheft
Publikationstyp
Masterarbeit/Diplomarbeit
Publikationsstatus
Published
Erschienen in
Zusammenfassung

Nonresponse stellt ein ernstzunehmendes Problem für die Möglichkeit dar, von einer Stichprobe auf die Grundgesamtheit zu schließen. Durch Nonresponse verringert sich zunächst die Fallzahl der Stichprobe, sodass sich die Effzienz der Schätzer der Grundgesamtheitsparameter im Vergleich zu einer Stichprobe ohne Nonresponse verringert. Zudem besteht die Gefahr der Verzerrung der Schätzer, wenn sich Teilnehmer von Nichtteilnehmern systematisch unterscheiden (Kapitel 1.2) und der Mechanismus, der zu Nonresponse führt nicht zufällig ist (Kapitel 1.3). Diese Ausfallmechanismen können sich für verschiedene Arten von Nonresponse unterscheiden (Kapitel 1.4). Dabei besteht grundsätzlich kein Unterschied zwischen Nonresponse in einmaligen Querschnittserhebungen und Ausfällen bei Wiederholungsbefragungen; die Besonderheiten für Panelausfälle werden in Kapitel 1.5 beschrieben.
In Kapitel 2 werden theoretische Erklärungsansätze für Nonresponse diskutiert und anschließend Verfahren zur Korrektur von Nonresponse vorgestellt (Kapitel 3), um trotz Nonresponse unverzerrte Schätzer der Grundgesamtheitsparameter zu erhalten. Alle diese Korrekturverfahren treffen (zumindest implizit) eine Annahme über den Ausfallmechanismus. Da sich Ausfallmechanismen für unterschiedliche Ausfallarten unterscheiden können ist für eine Korrektur von Nonresponse eine Unterscheidung der Ausfallarten von zentraler Bedeutung.

Der empirische Teil der Arbeit analysiert Ausfälle aus dem SozioOekonomischen Panel (SOEP), dessen Grundgesamtheit und einzelne Substichproben in Kapitel 4 vorgestellt und beschrieben werden. Das SOEP ist eine jährliche Wiederholungsbefragung privater Haushalte und aller erwachsenen Personen in diesen Haushalten. In den Kontaktprotokollen der Interviewer werden bis zu 29 unterschiedliche Kontaktergebnisse festgehalten. Da diese über die Jahre nicht konsistent erfasst wurden, ist eine Aufbereitung der Kontaktergebnisse für jede Welle notwendig, die durch die komplexe Struktur des SOEP erschwert wird (Kapitel 5).
Der deskriptive Teil der Analyse der Panelausfälle im SOEP (Kapitel 6 ab Seite 92) zeigt die Entwicklung der verschiedenen Ausfallursachen seit Start des SOEP im Jahr 1984. Da das SOEP eine Wiederholungsbefragung derselben Personen ist, können die Abfolgen der jährlichen Kontaktergebnisse untersucht werden. Die Teilnahmemuster von Teilnahme und Nichtteilnahme der Befragungspersonen des SOEP werden in Kapitel 7.1 beschrieben.

Betrachtet man für Nonrespondenten zusätzlich die Abfolge der detaillierten Ausfallursachen, ergeben sich Teilnahmesequenzen. Bei der deskriptiven Analyse dieser Teilnahmesequenzen in Kapitel 7.2 zeigen sich typische häufige Ausfallsequenzen aus dem SOEP für die letzten zwei bzw. letzten drei Jahre, bevor eine Beobachtung aus dem SOEP ausscheidet. Diese Ausfallsequenzen zeigen klare Implikationen für die Feldarbeit und Erhebungspraxis des SOEP auf.

Eng verbunden mit der Beschreibung der Sequenzen schließt sich im folgenden Kapitel eine Modellierung der Ausfälle aus dem SOEP als diskrete und stationäre Markov-Kette an (Kapitel 8 ab Seite 111). Ziel der Analyse ist die Schätzung der übergangswahrscheinlichkeiten zwischen den Kontaktergebnissen zwischen den Wellen. Da die Ausfallursachen als ungeordnete Kategorien vorliegen, können diese übergangswahrscheinlichkeiten mit einem multinomialen Logitmodell geschätzt werden. Die Ergebnisse des Markov-Modells bestätigen die Ergebnisse der deskriptiven Analyse.

Ziel der Arbeit liegt aber weniger in den übergangswahrscheinlichkeiten im Sinne einer Propensity-Gewichtung, sondern es soll vielmehr gezeigt werden, dass die unterschiedlichen Ausfallarten verschiedeneWahrscheinlichkeiten für eine erneute Teilnahme bzw. einen erneuten Ausfall besitzen. Dadurch soll gezeigt werden, dass eine Korrektur von Nonresponse aufgrund einer einfachen Unterscheidung Respondenten - Nonrespondenten zu kurz greift (vor allem, wenn bestimmte Gruppen eine höhere Ausfallwahrscheinlichkeit durch eine bestimmte Ausfallursache haben) und einen möglichen Nonresponsebias nicht oder nur unzulänglich korrigieren kann.

Zusammenfassung in einer weiteren Sprache

Nonresponse is a severe problem in sample surveys, especially in panel surveys, where nonresponse results not only in reduced effciency of estimates compared to the full initial sample but the sample also becomes more and more selective with each wave of the panel since nonresponse is cumulative over all waves. Nonresponse threatens the possibility to make inference on the population the sample was drawn from if the mechanism that leads to nonresponse is nonrandom and (observed or unobserved) characteristics of nonrespondents differ from the characteristics of respondents. If nonrespondents differ systematically from respondents nonresponse can cause biased estimates. The analysis of nonresponse and the mechanisms that lead to nonresponse is therefore essential in order to examine possible differences between nonrespondents and respondents and to account for nonresponse in estimation to avoid nonresponse bias in estimates. However, the threat of possible nonresponse bias is complicated by the fact that nonrespondents can differ not only systematically from respondents, but also different types of nonrespondents can differ systematically, splitting the original sample not only in respondents and nonrespondents but in different types of nonresponse categories. Each of the different types of nonresponse can be a source of a possible nonresponse bias and has distinct effects. For instance, refusals may bias the mean downwards, whereas noncontacts bias the mean away from zero: If nonresponse is not analysed separately, possible effects of the different types can be mixed, making it difficult or impossible to account for possible nonresponse bias accurately. This thesis analyses nonresponse in the German Socio-Economic Panel Study (SOEP) from 1984 untill 2005. In the yearly gross data of individuals, the SOEP documents up to 29 different reasons for nonresponse; some of them lead to final drop out (deceased, moved abroad, explicit refusal), whereas other nonrespondents are contacted again the following year according to the tracking rules. Unfortunately, due to changes in fieldwork coding schemes or different coding bevavior of the interviewers, the coding scheme for the 29 reasons for nonresponse is not consistent over time, yielding 10 distinctive and consistent categories of nonresponse over time after summarising the original 29 categories.

The thesis shows the development of the different categories of nonresponse in the SOEP. By looking at the whole history of contact information for every single observation, drop-out sequences are constructed showing participation patterns and typical sequences one, two, and three years prior to leaving the panel. Typical drop-out sequences are, for example, definite refusals after successful previous interviews or two consecutive waves of refusing. The next most frequent drop-out sequences are leaving the panel due to death or moving abroad after being interviewed successfully. Refusals after missing the previous wave because of being incapable for an interview is another rather typical drop-out sequence. Closely related to the language of sequences, the thesis estimates in the following transition probabilites between the different states using a first-order stationary Markov-Model. Since drop-out categories are unordered states, this can be done using multinomial logistic regression.

Both, the results from looking at typical sequences, as well as the estimated transition probabilities show, that there is a high probability being repeatedly interviewed successfully, but the overall probability decreases markedly if a person is missing the previous wave for any reason. Especially for refusals there is a high probability for refusing again the following wave and therefore leaving the panel definitely. The same holds for noncontacts (either not found at the old address or not reached during the fieldwork period) in the previous wave: there is a relatively high probability for dropping out again due to refusal if found and reached at the new address, or they get lost since they are not found repeatedly.

Whereas the (inverse of the) predicted probabilites can be used as rough propensity weights, the results point to clear implications for the fieldwork procedures of the interviewers: by all means, temporary drop-outs have to be avoided.

Fachgebiet (DDC)
310 Statistik
Schlagwörter
Panelausfälle, Nonresponse, Teilnahmemuster, Teilnahmesequenzen, Ausfallursachen, Panel Attrition, Panel Nonresponse, Attrition Patterns, Participation Sequences
Konferenz
Rezension
undefined / . - undefined, undefined
Zitieren
ISO 690GRAMLICH, Tobias, 2007. Analyse der Panelausfälle im SozioOekonomischen Panel SOEP [Master thesis]
BibTex
@mastersthesis{Gramlich2007Analy-3912,
  year={2007},
  title={Analyse der Panelausfälle im SozioOekonomischen Panel SOEP},
  author={Gramlich, Tobias}
}
RDF
<rdf:RDF
    xmlns:dcterms="http://purl.org/dc/terms/"
    xmlns:dc="http://purl.org/dc/elements/1.1/"
    xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
    xmlns:bibo="http://purl.org/ontology/bibo/"
    xmlns:dspace="http://digital-repositories.org/ontologies/dspace/0.1.0#"
    xmlns:foaf="http://xmlns.com/foaf/0.1/"
    xmlns:void="http://rdfs.org/ns/void#"
    xmlns:xsd="http://www.w3.org/2001/XMLSchema#" > 
  <rdf:Description rdf:about="https://kops.uni-konstanz.de/server/rdf/resource/123456789/3912">
    <dcterms:rights rdf:resource="https://rightsstatements.org/page/InC/1.0/"/>
    <dcterms:title>Analyse der Panelausfälle im SozioOekonomischen Panel SOEP</dcterms:title>
    <dc:creator>Gramlich, Tobias</dc:creator>
    <dspace:hasBitstream rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/3912/1/Gramlich_dipl.pdf"/>
    <dc:date rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-03-24T10:09:36Z</dc:date>
    <dc:language>deu</dc:language>
    <foaf:homepage rdf:resource="http://localhost:8080/"/>
    <dcterms:isPartOf rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/42"/>
    <void:sparqlEndpoint rdf:resource="http://localhost/fuseki/dspace/sparql"/>
    <dspace:isPartOfCollection rdf:resource="https://kops.uni-konstanz.de/server/rdf/resource/123456789/42"/>
    <bibo:uri rdf:resource="http://kops.uni-konstanz.de/handle/123456789/3912"/>
    <dc:contributor>Gramlich, Tobias</dc:contributor>
    <dc:format>application/pdf</dc:format>
    <dcterms:hasPart rdf:resource="https://kops.uni-konstanz.de/bitstream/123456789/3912/1/Gramlich_dipl.pdf"/>
    <dcterms:alternative>Analysis of Panel Attrition in the German Socio Economic Panel Study GSOEP</dcterms:alternative>
    <dcterms:issued>2007</dcterms:issued>
    <dcterms:available rdf:datatype="http://www.w3.org/2001/XMLSchema#dateTime">2011-03-24T10:09:36Z</dcterms:available>
    <dc:rights>terms-of-use</dc:rights>
    <dcterms:abstract xml:lang="deu">Nonresponse stellt ein ernstzunehmendes Problem für die Möglichkeit dar, von einer Stichprobe auf die Grundgesamtheit zu schließen. Durch Nonresponse verringert sich zunächst die Fallzahl der Stichprobe, sodass sich die Effzienz der Schätzer der Grundgesamtheitsparameter im Vergleich zu einer Stichprobe ohne Nonresponse verringert. Zudem besteht die Gefahr der Verzerrung der Schätzer, wenn sich Teilnehmer von Nichtteilnehmern systematisch unterscheiden (Kapitel 1.2) und der Mechanismus, der zu Nonresponse führt nicht zufällig ist (Kapitel 1.3). Diese Ausfallmechanismen können sich für verschiedene Arten von Nonresponse unterscheiden (Kapitel 1.4). Dabei besteht grundsätzlich kein Unterschied zwischen Nonresponse in einmaligen Querschnittserhebungen und Ausfällen bei Wiederholungsbefragungen; die Besonderheiten für Panelausfälle werden in Kapitel 1.5 beschrieben.&lt;br /&gt;In Kapitel 2 werden theoretische Erklärungsansätze für Nonresponse diskutiert und anschließend Verfahren zur Korrektur von Nonresponse vorgestellt (Kapitel 3), um trotz Nonresponse unverzerrte Schätzer der Grundgesamtheitsparameter zu erhalten. Alle diese Korrekturverfahren treffen (zumindest implizit) eine Annahme über den Ausfallmechanismus. Da sich Ausfallmechanismen für unterschiedliche Ausfallarten unterscheiden können ist für eine Korrektur von Nonresponse eine Unterscheidung der Ausfallarten von zentraler Bedeutung.&lt;br /&gt;&lt;br /&gt;Der empirische Teil der Arbeit analysiert Ausfälle aus dem SozioOekonomischen Panel (SOEP), dessen Grundgesamtheit und einzelne Substichproben in Kapitel 4 vorgestellt und beschrieben werden. Das SOEP ist eine jährliche Wiederholungsbefragung privater Haushalte und aller erwachsenen Personen in diesen Haushalten. In den Kontaktprotokollen der Interviewer werden bis zu 29 unterschiedliche Kontaktergebnisse festgehalten. Da diese über die Jahre nicht konsistent erfasst wurden, ist eine Aufbereitung der Kontaktergebnisse für jede Welle notwendig, die durch die komplexe Struktur des SOEP erschwert wird (Kapitel 5).&lt;br /&gt;Der deskriptive Teil der Analyse der Panelausfälle im SOEP (Kapitel 6 ab Seite 92) zeigt die Entwicklung der verschiedenen Ausfallursachen seit Start des SOEP im Jahr 1984. Da das SOEP eine Wiederholungsbefragung derselben Personen ist, können die Abfolgen der jährlichen Kontaktergebnisse untersucht werden. Die Teilnahmemuster von Teilnahme und Nichtteilnahme der Befragungspersonen des SOEP werden in Kapitel 7.1 beschrieben.&lt;br /&gt;&lt;br /&gt;Betrachtet man für Nonrespondenten zusätzlich die Abfolge der detaillierten Ausfallursachen, ergeben sich Teilnahmesequenzen. Bei der deskriptiven Analyse dieser Teilnahmesequenzen in Kapitel 7.2 zeigen sich typische häufige Ausfallsequenzen aus dem SOEP für die letzten zwei bzw. letzten drei Jahre, bevor eine Beobachtung aus dem SOEP ausscheidet. Diese Ausfallsequenzen zeigen klare Implikationen für die Feldarbeit und Erhebungspraxis des SOEP auf.&lt;br /&gt;&lt;br /&gt;Eng verbunden mit der Beschreibung der Sequenzen schließt sich im folgenden Kapitel eine Modellierung der Ausfälle aus dem SOEP als diskrete und stationäre Markov-Kette an (Kapitel 8 ab Seite 111). Ziel der Analyse ist die Schätzung der übergangswahrscheinlichkeiten zwischen den Kontaktergebnissen zwischen den Wellen. Da die Ausfallursachen als ungeordnete Kategorien vorliegen, können diese übergangswahrscheinlichkeiten mit einem multinomialen Logitmodell geschätzt werden. Die Ergebnisse des Markov-Modells bestätigen die Ergebnisse der deskriptiven Analyse.&lt;br /&gt;&lt;br /&gt;Ziel der Arbeit liegt aber weniger in den übergangswahrscheinlichkeiten im Sinne einer Propensity-Gewichtung, sondern es soll vielmehr gezeigt werden, dass die unterschiedlichen Ausfallarten verschiedeneWahrscheinlichkeiten für eine erneute Teilnahme bzw. einen erneuten Ausfall besitzen. Dadurch soll gezeigt werden, dass eine Korrektur von Nonresponse aufgrund einer einfachen Unterscheidung Respondenten - Nonrespondenten zu kurz greift (vor allem, wenn bestimmte Gruppen eine höhere Ausfallwahrscheinlichkeit durch eine bestimmte Ausfallursache haben) und einen möglichen Nonresponsebias nicht oder nur unzulänglich korrigieren kann.</dcterms:abstract>
  </rdf:Description>
</rdf:RDF>
Interner Vermerk
xmlui.Submission.submit.DescribeStep.inputForms.label.kops_note_fromSubmitter
Kontakt
URL der Originalveröffentl.
Prüfdatum der URL
Prüfungsdatum der Dissertation
Finanzierungsart
Kommentar zur Publikation
Allianzlizenz
Corresponding Authors der Uni Konstanz vorhanden
Internationale Co-Autor:innen
Universitätsbibliographie
Begutachtet
Diese Publikation teilen