Geschichtete Zufallsstichprobe

Das Ziehen einer geschichteten Zufallsstichprobe (auch: stratifizierte Zufallsstichprobe) kann in der Statistik Vorteile bringen, wenn die Grundgesamtheit in sinnvolle Gruppen, die sogenannten Schichten, unterteilt werden kann. Sinnvoll bedeutet hier, dass die Schichten hinsichtlich eines oder mehrerer Merkmale, die auch die Ausprägung des letztlich interessierenden Merkmals beeinflussen, in sich relativ homogen sind und sich voneinander möglichst deutlich unterscheiden. Typische Schichten, die für Stichproben zur Beantwortung sozialwissenschaftlicher, medizinischer oder Marktforschungs-relevanter Fragestellungen eine Rolle spielen, wären etwa Altersgruppen oder Bevölkerungsschichten nach Einkommen, Bildungsabschluss, Wohnort etc.[1]

Man schränkt nun die rein zufällige Auswahl der Stichprobenelemente insofern ein, als man die Stichprobenumfänge pro Schicht vorgibt und danach in jeder Schicht eine reine Zufallsstichprobe zieht. (Die einzelnen Zufallsstichproben werden getrennt ausgewertet und die Ergebnisse im Anschluss zusammengefasst.) Man „verbietet“ damit extreme Stichproben, die beispielsweise zufällig fast nur Elemente aus einer Schicht enthalten, und bekommt in der Konsequenz bessere Punktschätzer, d. h. Schätzer mit kleinerer Varianz. Durch geeignete Schichtung lässt sich also bei gleicher Ergebnisgenauigkeit der Gesamtstichprobenumfang gegenüber einer einfachen Zufallsstichprobenziehung verringern, was die Kosten der Datenerhebung senkt.[2]

In Monte-Carlo-Simulationen kann man geschichtete Zufallsziehungen als Mittel der Varianzreduktion einsetzen. Die Schichtungsmerkmale (Paradaten) müssen vorab bekannt sein.

Grundgesamtheitsgrößen

Umfang der Grundgesamtheit, Anzahl der Schichten, interessierendes Merkmal. Im Folgenden ist . Umfang der Schicht . Ausprägung des Merkmals in Schicht . relative Schichtstärke. Erwartungswert in Schicht . Varianz in Schicht Es gilt:

.

Die Gesamtvarianz ist die Summe der Varianz in den Schichten und der Varianz zwischen den Schichten.

Schätzer für die Grundgesamtheitsparameter

Wir konzentrieren uns auf die Schätzung von . Seien die Stichprobenumfänge pro Schicht und der Gesamtstichprobenumfang. Seien weiter die Stichprobenwerte aus den Schichten. Dann ist ein erwartungstreuer Schätzer für und eine erwartungstreue Schätzung für . Zum Vergleich mit dem hier interessierenden Schätzer wird das auf reiner Zufallsauswahl beruhende Stichprobenmittel herangezogen.

Schichtungsarten

  • Proportionale Schichtung:

Von einer proportional geschichteten Zufallsstichprobe spricht man, wenn die Umfänge der den verschiedenen Schichten entnommenen Stichproben proportional zum Anteil der Schicht an der Grundgesamtheit sind: So ist jede Schicht in der Stichprobenauswahl in gleicher Relation wie in der Grundgesamtheit vertreten.[1]

Wenn man wählt, dann sind die proportional zum Schichtumfang . ist deutlich kleiner als , wenn sich die Erwartungswerte in den Schichten stark unterscheiden, d. h. wenn die Varianz zwischen den Schichten groß ist.

Bei proportionaler Zweifachschichtung werden die Stichprobenumfänge in den Schichtzellen häufig keine ganzen Zahlen sein, siehe dazu Kontrolliertes Runden.

  • Disproportionale Schichtung:

Sind die Größen der den Schichten entnommenen Zufallsstichproben unabhängig vom Anteil der Schicht an der Grundgesamtheit, handelt es sich um eine disproportional geschichtete Zufallsstichprobe.[1] Im einfachsten Fall werden aus allen Schichten etwa gleich große Zufallsstichproben gezogen. Ein Motiv für ein solches Vorgehen kann z. B. sein, dass die zu entnehmende Zufallsstichprobe für eine sehr kleine Schicht bei proportionaler Schichtung und vertretbarem Aufwand für die Gesamterhebung zu klein für eine sinnvolle statistische Auswertung wäre. So werden etwa bei den Erhebungen für die PISA-Studien disproportional geschichtete Stichproben verwendet, um auch die Eigenschaften kleinerer Schichten wie etwa die der Schüler der kleinen Bundesländer Hamburg und Bremen mit hinreichender Genauigkeit zu ermitteln. (Um die Studienergebnisse insgesamt nicht zu verzerren, werden die aus den einzelnen Schichten gewonnenen Ergebnisse wiederum proportional gewichtet.)[3]

Sonderformen der disproportionalen Schichtung sind die varianzoptimale und die kostenoptimale Schichtung.

  • Varianzoptimale Schichtung:

Wenn

,

dann ist bei stark unterschiedlichen die Varianz von wesentlich kleiner als bei proportionaler Schichtung, weil Schichten mit großer Streuung stärker beprobt werden. Proportionale Schichtung ist varianzoptimal, wenn alle gleich sind.

  • Kostenoptimale Schichtung:

Seien die zur Verfügung stehenden Gesamtkosten und die Kosten für die Auswahl eines Elementes aus Schicht . Wenn man nun die Varianz von minimiert unter der Nebenbedingung, die Kosten nicht zu überschreiten, dann ergibt sich

.

In der Regel ist obiger Wert keine natürliche Zahl und daher zu runden.

Stratifikationsproblematik

Stratifikation ist die Einteilung der Grundgesamtheit in Schichten. Dabei entstehen zwei Teilprobleme:

  1. Die Festlegung der Anzahl der Schichten.
  2. Die Festlegung der Schichtabgrenzung.

Ziel ist es, die beiden Teilprobleme so zu lösen, dass die Schätzungen genauer werden. Dazu bedarf es allerdings meist Vorinformationen über die Grundgesamtheit (etwa durch die Amtliche Statistik oder vorhergehende Untersuchungen).

Eine Lösung o. g. Problematik stellt etwa das Stratifikationsmodell nach Dalenius inklusive entsprechender Näherungslösungen wie die cum-Regel oder die equal aggregate -Regel dar.

Vergleich mit Klumpen-Stichprobe

Bei geschichteten Stichproben und Klumpenstichproben wird die Grundgesamtheit jeweils in Gruppen unterteilt – im Fall der geschichteten Stichprobe sind das die Schichten, bei der Klumpenstichprobe die sogenannten „Klumpen“ oder Cluster. Der wesentliche Unterschied zwischen beiden Stichprobenauswahlverfahren liegt in den statistischen Eigenschaften der Gruppen im Vergleich miteinander und mit der Grundgesamtheit.

Die Anwendung der Klumpenstichprobe beruht auf der Annahme, dass jeder Klumpen ein möglichst ideales verkleinertes Abbild der Grundgesamtheit ist, also dieser bezüglich Erwartungswert und Varianz bzw. Verteilung des interessierenden Merkmals und anderer, eventuell damit korrelierender Merkmale möglichst nahekommt: Die Klumpen sind in sich möglichst so heterogen wie die Grundgesamtheit und einander diesbezüglich idealerweise sehr ähnlich.

Dagegen werden die Schichten der geschichteten Stichprobe zweckmäßig so gewählt, dass sie im Hinblick auf die für die Schichtauswahl relevanten Merkmale in sich wesentlich homogener sind als die Grundgesamtheit (also für diese Merkmale jeweils eine kleinere Varianz als die Grundgesamtheit aufweisen) und sich voneinander bezüglich der Erwartungswerte dieser Merkmale möglichst stark unterscheiden.

Vergleich mit Quotenstichprobe

Die Quotenstichprobe ist der proportional geschichteten Zufallsstichprobe in zwei Aspekten sehr ähnlich: Bei beiden Verfahren geht es darum, erstens die zu untersuchende Grundgesamtheit in Gruppen einzuteilen, die durch bestimmte relevante Merkmale charakterisiert sind; und zweitens aus diesen Gruppen Stichproben zu entnehmen, deren relative Größe durch den Anteil der Gruppe an der Grundgesamtheit bestimmt wird.

Der Unterschied zwischen beiden Verfahren liegt in der Anwendung eines zufälligen oder willkürlichen Auswahlverfahrens für die letztlich in die Stichprobe einbezogenen Individuen/Elemente: Die geschichtete Zufallsstichprobe hat eine angebbare Ziehungswahrscheinlichkeit für jedes Element der Grundgesamtheit, während bei der Quotenstichprobe keine solche Ziehungswahrscheinlichkeit angegeben werden kann. Eine willkürliche Auswahl kann zum Beispiel auf Selbstselektion beruhen: Der Untersucher sucht etwa per Annonce nach geeigneten Studienteilnehmern, kontaktiert passende Mitglieder eines Online-Panels, die sich zur Teilnahme an Meinungsumfragen bereiterklärt haben, oder spricht willkürlich geeignete Passanten an, von denen sich nur einige dafür entscheiden, ihm zu antworten. Das tut er so lange, bis er die Quoten für seine Stichproben erfüllt hat. Sofern nun die Eigenschaften der Teilnehmer, die sie zur Selbstselektion bewogen haben, auch das interessierende Merkmal beeinflussen, werden die Ergebnisse der Quotenstichprobe gegenüber der Ergebnissen einer geschichteten Zufallsstichprobe verzerrt sein (ähnliches passiert bei einer Zufallsstichprobe allerdings durch Antwortausfall[4]). Auch von Seiten des Interviewers kann es bei der Quotenstichprobe zur Stichprobenverzerrung kommen, indem z. B. sympathiebasiert Passanten angesprochen werden oder eine Liste von Telefonnummern in einer bestimmten Reihenfolge „abgearbeitet“ wird.

Quotenstichproben sind billiger, schneller und in ihren Voraussetzungen weniger anspruchsvoll als geschichtete Zufallsstichproben; in vielen Fällen können sie ein praktikabler Ersatz für diese sein. Quotenstichproben sind die Methode der Wahl in der kommerziellen Markt- und Meinungsforschung und werden durchaus auch in der akademischen Forschung eingesetzt.[5][6]

Literatur

  • L. Kish: Survey Sampling. Wiley, 1965, speziell S. 75–112 (Chapter 3: Stratified sampling)
  • H. Stenger: Stichprobentheorie. Physica-Verlag, 1971, speziell S. 115–150 (Kapitel 6: Schichtung)
  • W. G. Cochran: Sampling Techniques. 3. Auflage. Wiley, New York 1977, speziell S. 89–149 (Chapter 5: Stratified random sampling sowie Chapter 5A: Further aspects of stratified sampling)
  • J. Hartung: Statistik. 15. Auflage. Oldenbourg, München 2009, speziell die Seiten 278–287 (Kapitel V, Abschnitt 1.5: Geschichtete Zufallsauswahl)

Einzelnachweise

  1. a b c Marcus M. Gillhofer: Teilnehmer-Rekrutierung in der Online-Sozialforschung. Joseph Eul Verlag, Lohmar 2010, ISBN 978-3-89936-905-2, 5.2.2 Die geschichtete Zufallsstichprobe, S. 68 f. (books.google.de).
  2. Rüdiger Jacob: Vorlesung „Methoden und Techniken der empirischen Sozialforschung – 7. Auswahlverfahren“. (PDF) Universität Trier, abgerufen am 6. November 2019.
  3. Zur Stichprobenziehung innerhalb der PISA-Erweiterung. (PDF) Max-Planck-Institut für Bildungsforschung, abgerufen am 6. November 2019.
  4. R.G.Cumming: Is probability sampling always better? A comparison of results from a quota and a probability sample survey. In: Community Health Studies. 14. Jahrgang, Nr. 2, 1990, S. 37-7, doi:10.1111/j.1753-6405.1990.tb00033.x, PMID 2208977.
  5. Michael Meyer, Thomas Reutterer: Qualitative Marktforschung: Konzepte, Methoden, Analysen. Hrsg.: Renate Buber, Hartmut H. Holzmüller. Gabler, Wiesbaden 2007, ISBN 978-3-8349-0229-0, Sampling-Methoden in der Marktforschung, S. 239 (books.google.de).
  6. Duane R. Monette, Thomas J. Sullivan, Cornell R. DeJong: Applied Social Research: A Tool for the Human Services. Brooks/Cole, Belmont 2011, ISBN 978-0-8400-3205-8, Quota Sampling, S. 152 (englisch, books.google.de).

Read other articles:

Linux MintLinux Mint 21 Vanessa (Cinnamon Edition)Perusahaan / pengembangClement Lefebvre, Jamie Boo Birse, Kendall Weaver, dan komunitas[1]KeluargaLinux (berbasis pada Ubuntu)Status terkiniTidak AktifModel sumberSumber terbukaRilis perdana27 Agustus 2006; 17 tahun lalu (2006-08-27)Rilis stabil terkiniLinux Mint 21.3 “Virginia” / 12 Januari 2024; 2 bulan lalu (2024-01-12)Ketersediaan bahasaMulti bahasa[2]Metode pemutakhiranAPT (+ mintUpdate, Synaptic)Manajer...

 

Medication administered into a vein The Drip redirects here. For the Schitt's Creek episode, see The Drip (Schitt's Creek). For other uses, see Drip. Intravenous therapyA person receiving a medication through an intravenous line (cannula)Other namesIV therapy, iv therapyICD-9-CM38.93[edit on Wikidata] Intravenous therapy (abbreviated as IV therapy) is a medical technique that administers fluids, medications and nutrients directly into a person's vein. The intravenous route of administrati...

 

Об экономическом термине см. Первородный грех (экономика). ХристианствоБиблия Ветхий Завет Новый Завет Евангелие Десять заповедей Нагорная проповедь Апокрифы Бог, Троица Бог Отец Иисус Христос Святой Дух История христианства Апостолы Хронология христианства Ран�...

American college basketball season 2020–21 Boston University Terriers men's basketballConferencePatriot LeagueDivisionNorth DivisionRecord7–11 (6–10 Patriot)Head coachJoe Jones (10th season)Assistant coaches Curtis Wilson Walt Corbean Mike Quinn Home arenaCase GymSeasons← 2019–202021–22 → 2020–21 Patriot League men's basketball standings vte Conf Overall Team W   L   PCT W   L   PCT North Colgate † 11 – 1   .917 14 &...

 

Administrative division of Nazi Germany Gau Upper SilesiaGau of Nazi Germany1941–1945 FlagUpper Silesia in gray, bordering the General GovernmentCapitalKattowitzGovernmentGauleiter • 1941–1945 Fritz Bracht History • Establishment 27 January 1941• Disestablishment 1 August 1945 Preceded by Succeeded by Gau Silesia Poland Czechoslovakia Today part ofPolandCzech Republic The Gau Upper Silesia (German: Gau Oberschlesien) was an administrative division of Naz...

 

Wielkopolska Chronicle in XV-century compilation Kodeks Sędziwoja, page 274. Beginning in Chronica magna - copy from XV century. The Wielkopolska Chronicle (or Chronicle of Greater Poland, Polish: Kronika wielkopolska) is an anonymous medieval chronicle describing supposed history of Poland from legendary times up to the year 1273. It was written in Latin at the end of the 13th or the beginning of the 14th century. Origins and possible authorship The chronicle was written from the point of v...

Kevin Großkreutz Großkreutz in 2014Informasi pribadiTanggal lahir 19 Juli 1988 (umur 35)Tempat lahir Dortmund, Jerman BaratTinggi 1,86 m (6 ft 1 in)Posisi bermain SayapInformasi klubKlub saat ini VfB StuttgartNomor 19Karier junior DJK Rot-Weiß Obereving VfL Kemminghausen0000–2002 FC Merkur 07 Dortmund2002–2003 Borussia Dortmund2003–2006 Rot Weiss AhlenKarier senior*Tahun Tim Tampil (Gol)2006–2007 Rot Weiss Ahlen II 2 (2)2006–2009 Rot Weiss Ahlen 95 (23)2009�...

 

Kléberson Nazionalità  Brasile Altezza 176 cm Peso 64 kg Calcio Ruolo Allenatore (ex centrocampista) Termine carriera 1º gennaio 2017 - giocatore Carriera Giovanili 1997 PSTC1998 Atlético Paranaense Squadre di club1 1998-2003 Atlético Paranaense100 (12)2003-2005 Manchester Utd20 (2)2005-2007 Beşiktaş45 (3)2008-2010 Flamengo60 (9)2011-2012→  Atlético Paranaense18 (2)2012-2013 Bahia23 (3)2014-2015 Indy Eleven21 (8)2016 Ft. Lauder...

 

Drs. H.Mahmud Abdullah Bupati Sumbawa ke-11PetahanaMulai menjabat 26 April 2021PresidenJoko WidodoGubernurZulkieflimansyahWakilDewi NovianyPendahuluM. Husni Djibril Hasan Basri (Plh.)PenggantiPetahana Wakil Bupati Sumbawa ke-3Masa jabatan17 Februari 2016 – 17 Februari 2021PresidenJoko WidodoGubernurMuhammad Zainul Majdi ZulkieflimansyahBupatiM. Husni DjibrilPendahuluArasy MuhkanPenggantiDewi Noviany Informasi pribadiLahir10 April 1956 (umur 68)Sumbawa, Nusa Tenggar...

American politician from Pennsylvania For other people of a similar name, see William Anderson. William AndersonMember of the U.S. House of Representativesfrom Pennsylvania's 1st districtIn office1817–1819In office1809–1815 Personal detailsBorn1762 (1762)Accomack County, Virginia Colony, British AmericaDiedDecember 16, 1829(1829-12-16) (aged 66–67)Chester, Pennsylvania, U.S.Resting placeOld St. Paul's Church Cemetery, Chester, Pennsylvania, U.S.Political partyDemoc...

 

ХристианствоБиблия Ветхий Завет Новый Завет Евангелие Десять заповедей Нагорная проповедь Апокрифы Бог, Троица Бог Отец Иисус Христос Святой Дух История христианства Апостолы Хронология христианства Раннее христианство Гностическое христианство Вселенские соборы Н...

 

МифологияРитуально-мифологическийкомплекс Система ценностей Сакральное Миф Мономиф Теория основного мифа Ритуал Обряд Праздник Жречество Мифологическое сознание Магическое мышление Низшая мифология Модель мира Цикличность Сотворение мира Мировое яйцо Мифическое �...

مستر أولمبيا 1990 معلومات عامة فترة الانعقاد 13 - 15 سبتمبر 1990 مكان الانعقاد شيكاغو، إلينويز،  الولايات المتحدة المنظم الاتحاد الدولي لكمال الأجسام واللياقة البدنية (IFBB) المنطقة  العالم ترتيب النسخة 26 الموقع الرسمي الموقع الرسمي لمحترفي اتحاد IFBB قائمة الفائزين صاحب اللق...

 

American chemical company Dow Inc. redirects here. Not to be confused with Dow Jones & Company. Dow Inc.Company typePublicTraded asNYSE: DOWDJIA componentS&P 100 componentS&P 500 componentIndustryChemicalsFounded1897; 127 years ago (1897)(original company)April 1, 2019; 5 years ago (2019-04-01) (current iteration)FounderHerbert Henry DowHeadquartersMidland, Michigan, U.S.Area servedWorldwideKey peopleJim Fitterling (chairman and CEO)Jeff Ta...

 

NASCAR Seri TrukKategoriMobil stok, balap truk pikapNegara atau daerahAmerika Serikat · KanadaMusim pertama1995PabrikanChevrolet · Ford · ToyotaPemasok mesinChevrolet · Ford · Toyota · Ilmor Engineering Ltd.Pemasok banGoodyearJuara pembalapZane SmithJuara timFront Row MotorsportsJuara pabrikanFordSitus webNASCAR Camping World Truck Series Musim saat ini NASCAR Seri Truk, secara resmi dikenal sebagai NASCAR Seri Truk Craftsman untuk a...

International observance; April 8 International Romani DayFlag of the Romani peopleObserved byWorldwideTypeInternationalSignificanceCivil awareness dayRomani cultureDateApril 8Next time8 April 2025 (2025-04-08)FrequencyannualRelated toHolocaust Memorial Days, International Mother Language Day, Human Rights Day The International Romani Day (April 8) is a day to celebrate Romani culture and raise awareness of the issues facing Romani people.[1] Origin The day was off...

 

اضغط هنا للاطلاع على كيفية قراءة التصنيف البوناتية   المرتبة التصنيفية فصيلة[1][2]  التصنيف العلمي النطاق: حقيقيات النوى المملكة: نباتات العويلم: النباتات الجنينية غير مصنف: حقيقيات الأوراق غير مصنف: البذريات غير مصنف: كاسيات البذور غير مصنف: ثنائيات الفلقة غير...

 

Order of sharks HeterodontiformesTemporal range: Toarcian–Recent PreꞒ Ꞓ O S D C P T J K Pg N Heterodontus japonicus Paracestracion danieli Scientific classification Domain: Eukaryota Kingdom: Animalia Phylum: Chordata Class: Chondrichthyes Subclass: Elasmobranchii Subdivision: Selachimorpha Superorder: Galeomorphii Order: HeterodontiformesL. S. Berg, 1940 Genera †Proheterodontus †Palaeoheterodontus †Procestracion †Protoheterodontus †Paracestracionidae †Paracestracion Heterod...

Neoclassical architectural style Beaux-Arts architectureTop: The Grand staircase of the Palais Garnier (Paris), 1860–1875, by Charles Garnier; Second: The CEC Palace on Victory Avenue (Bucharest, Romania), 1897–1900, by Paul Gottereau;[1] Third: Entrance of the Grand Palais (Paris), 1900, by Charles Girault; Bottom: Grand Central Terminal and the New York Central Building (New York City), pictured in 1944. Beaux-Arts architecture (/boʊz ˈɑːr/ bohz AR, French: [boz‿aʁ ...

 

This article includes a list of references, related reading, or external links, but its sources remain unclear because it lacks inline citations. Please help improve this article by introducing more precise citations. (March 2018) (Learn how and when to remove this message) Monument to Scottish poet Robert Burns The Robert Burns Memorial is a granite monument located in downtown Barre, Vermont. It was erected by Barre's Scottish immigrants in 1899 to commemorate the centenary of the death of ...