Визначення розмірів вибірки

Визначення розмірів вибірки — це процес вибору числа спостережень або повторюваностей з метою включення його у статистичну вибірку. Розмір вибірки є важливою характеристикою будь-якого емпіричного дослідження, мета якого полягає в тому, щоб зробити логічний висновок щодо популяції виходячи з результатів вибірки. На практиці розмір вибірки, що використовується у дослідженні, визначається на основі витрат на збір даних та необхідності мати достатню статистичну потужність. У складних дослідженнях може бути кілька різних розмірів вибірки, що використовуються у дослідженні: наприклад, у стратифікованому опитуванні були б різні розміри вибірки для кожного шару. При проведенні перепису дані збираються по всьому населенню, отже, розмір вибірки дорівнює розміру населення. В експериментальному проекті, де дослідження може бути розділене на різні експериментальні групи, для кожної окремої групи може існувати свій розмір вибірки.

Розміри вибірки можна обрати декількома різними способами:

  • Досвід — наприклад, включати легко доступні або зручні у збиранні елементи. Добір вибірок невеликого розміру, хоча іноді це необхідно, може призвести до широких довірчих інтервалів або ризиків помилитися у перевірці статистичних гіпотез.
  • Використовувати цільову дисперсію для оцінки, яка походить із отриманої зрештою вибірки.
  • Використовувати ціль для потужності статистичного дослідження, яка повинна застосовуватися після того, як вибірка зібрана.
  • Використовувати рівень достовірності, що визначає, наскільки точний результат вийде з більш низькими шансами похибки.

Введення

Великі розміри вибірки, як правило, призводять до збільшення точності при оцінці невідомих параметрів. Наприклад, якби ми хотіли з'ясувати частку деяких видів риб, які інфіковані патогенним мікроорганізмом, ми, як правило, мали б більш точну оцінку цієї частки, якщо б підібрали і дослідили 200, а не 100 риб. Кілька фундаментальних фактів математичної статистики можуть описати це явище, в тому числі закон великих чисел і центральної граничної теореми.

У деяких ситуаціях, підвищення точності для великих розмірів вибірки мінімальне або навіть не існує. Це може бути результатом наявності систематичних помилок або сильної залежності від даних, або якщо дані слідують розподілу з повільно спадаючим «хвостом».

Розміри вибірки оцінюються на підставі якості одержуваних оцінок. Наприклад, якщо частка в даний час оцінюється, людина, можливо, забажає, аби 95 % довірчий інтервал (довірчий інтервал для довірчої ймовірності 0,95) був менше, ніж 0,06 одиниць в ширину. Як альтернатива, розмір вибірки може бути визначений на основі потужності критерію для перевірки гіпотези. Наприклад, якщо ми порівняємо підтримку певного політичного кандидата серед жінок з підтримкою цього ж кандидата серед чоловіків, ми, можливо, хотіли б мати 80 % потужності, аби виявити в рівнях підтримки різницю у 0,04 одиниць.

Оцінка

Досить простою ситуацією є оцінка частки. Наприклад, ми хочемо оцінити частку жителів у громаді, яким хоча б 65 років.

Формула оцінки частки: , де X являє собою число «позитивних» спостережень (тобто, кількість людей із n вибраних людей, яким хоча б 65 років). Коли спостереження незалежні, то ця формула має (масштабний) біноміальний розподіл (і є також вибірковим середнім даних із розподілу Бернуллі). Максимальне відхилення цього розподілу становить 0,25/n, яке виникає, коли істинний параметр p = 0,5. На практиці, коли p невідоме, максимальне відхилення часто використовується для оцінки розміру вибірки.

При досить великому n розподіл буде дуже близьким за значенням до нормального розподілу. Використовуючи це наближення, можна показати, що близько 95 % ймовірностей цього розподілу лежить в межах 2-х стандартних відхилень від середнього значення. Використовуючи метод Wald для біноміального розподілу, інтервал виду:

формуватиме 95 % довірчий інтервал для істинної частки. Якщо цей інтервал повинен бути не більше, ніж W одиниці в ширину, рівняння:

може бути вирішене при n, що дає n = 4/W2 = 1/B2 , де B — похибка межі оцінки, тобто оцінка зазвичай дається в межах ± B. Таким чином, при B = 10 % вимагається n = 100, при B = 5 % потрібно n = 400, при B = 3 % вимога наближається до n= 1000, в той час як при B = 1 % потрібен розмір вибірки у n = 10000. Ці цифри часто цитуються у випусках новин щодо опитувань громадської думки та інших вибіркових вимірах.

Засоби

Частка є окремим питанням середнього значення. При оцінці середньої чисельності населення з використанням незалежного і однаково розподіленого (НОР) розміру n, де кожне значення даних має дисперсію σ2, стандартна похибка середнього значення вибірки є:

Цей вираз кількісно описує, що оцінка стає точнішою пропорційно з тим, як збільшується розмір вибірки. Використовуючи центральну граничну теорему, щоб виправдати приблизне вибіркове середнє з нормальним розподілом дає приблизний 95 % довірчий інтервал виду:

Якщо ми хочемо мати довірчий інтервал, який W одиниць в ширину, ми вирішимо

для n, яке видає розмір вибірки n = 16σ2/W2.

Наприклад, якщо ми зацікавлені в оцінці кількості, за якою препарат знижує кров'яний тиск суб'єкта з довірчим інтервалом у шість одиниць шириною, і ми знаємо, що стандартне відхилення артеріального тиску в населення становить 15, то шуканий розмір вибірки є 100.

Необхідні розміри вибірки для перевірки гіпотез

Загальною проблемою, що стоїть перед статистиками, є обчислювання розміру вибірки, необхідної для отримання певної потужності у випробуванні, враховуючи задану похибку першого роду α. Отже, це можна оцінити за допомогою заздалегідь визначених таблиць для певних значень за рівнянням ресурсу Міда або, в більш загальному плані, за допомогою кумулятивної функції розподілу:

Таблиці


 
Потужність
d Коена
0.2 0.5 0.8
0.25 84 14 6
0.50 193 32 13
0.60 246 40 16
0.70 310 50 20
0.80 393 64 26
0.90 526 85 34
0.95 651 105 42
0.99 920 148 58

Таблиця показана праворуч може бути використана у двовибіркових критеріях Ст'юдента для оцінки розмірів вибірки з експериментальної групи і контрольної групи, які мають однаковий розмір, тобто, загальне число особин у випробуванні вдвічі більше, числа даних, і бажаний рівень значущості дорівнює 0,05. Параметри, що використовуються, є:

  • Потрібна статистична потужність випробування показана в колонці зліва.
  • d Коена (= розмір ефекту), що є очікуваною різницею між середніми значеннями цільових значень між експериментальною групою та контрольною групою, розділена на очікуване стандартне відхилення.

Рівняння ресурсу Міда

Рівняння ресурсу Міда часто використовується для оцінки розмірів вибірки з лабораторних тварин, а також у багатьох інших лабораторних експериментах. Результат може бути не настільки точним, як при використанні інших методів в оцінці розміру вибірки, але він дає підказку, який розмір вибірки є доречним, якщо такі параметри як очікувані стандартні відхилення або очікувані відмінності в значеннях між групами є невідомими або їх дуже важко оцінити.

Всі параметри у рівнянні є, фактично, ступенями свободи числа їх понять, і, отже, від їх числа віднімається 1 перед введенням у рівняння.

Рівняння має вигляд:

де:

  • N — загальне число осіб або підрозділів в дослідженні (мінус 1)
  • B — компонент блокування, відображає вплив на навколишнє середовище, дозволений при проектуванні (мінус 1)
  • T — компонент експерименту, що відповідає числу експериментальних груп (в тому числі контрольна група), які використовуються, або кількості питань, що задаються (мінус 1)
  • E — ступінь свободи компонента похибки, і повинен бути приблизно між 10 і 20.

Наприклад, якщо дослідження з використанням лабораторних тварин планується з чотирма експериментальними групами (T = 3), з вісьмома тваринами на групу, тобто 32 тварин (N = 31), без будь-якої подальшої стратифікації (B = 0), то E буде дорівнювати 28, що є більше за відсічення 20, що вказує, що розмір вибірки може бути занадто великим, і шість тварин на кожну групу може бути достатньо та більш доречно.[1]

Інтегральна функція розподілу

Нехай Xi, i = 1, 2, …, n незалежні спостереження взяті з нормального розподілу з невідомим середнім μ і відомою дисперсією σ2. Розглянемо дві гіпотези, нульову гіпотезу:

й альтернативну гіпотезу:

для деякої «найменшої значущої різниці» μ* >0. Це найменше значення, яким мі цікавимось при спостереженні різниці. Тепер, якщо ми хочемо (1) відхилити H0 з ймовірністю принаймні 1-β , коли Ha істинно (тобто потужність 1-р), і (2) відхилити Ha з ймовірністю α, коли Ha вірна, тоді нам необхідно наступне: Якщо zα є верхньою відсотковою точкою α стандартного нормального розподілу, то

і таким чином

'Відхилити H0, якщо середнє нашої вибірки () більше, ніж '

це вирішальне правило, яке задовольняє умові (2). (Зверніть увагу, що це односторонній експеримент).

Тепер ми хочемо, щоб це сталося з ймовірністю принаймні 1- β, коли Ha істинно. У цьому випадку, середнє нашої вибірки буде походити з нормального розподілу із середнім значенням μ*.. Тому ми вимагаємо

Завдяки точним маніпуляціям, можна побачити, що станеться, коли

де нормальна інтегральна функція розподілу.

Стратифікований розмір вибірки

З більш складною організацією вибірки, такою як стратифікована (розшарована) вибірка, вибірку часто можна розділити на підвибірки. Як правило, якщо існують такі H підвибірки (від H різних шарів), то кожен з них буде мати розмір вибірки nh, h = 1, 2, …, H. Ці nh повинні відповідати правилу n1 + n2 + … + nH = n (тобто, загальний розмір вибірки визначається сумою розмірів підвибірок). Вибір цих nh оптимально може бути зробленим різними шляхами, використовуючи (наприклад) оптимальний розподіл Неймана.

Є багато причин використовувати стратифіковану вибірку: щоб зменшити дисперсії вибіркових оцінок, щоб використовувати частково невипадкові методи, або для вивчення шарів окремо. Частково невипадковий метод мав би бути корисним для вибірки осіб, яких легко дістати, але, якщо ні, то краще використовувати гніздову вибірку, щоб заощадити на витратах на поїздки.

Загалом, для H шарів, зваженим вибірковим середнім є

з

[2]

Вагові функції, , часто, але не завжди, відображають пропорції елементів населення в шарах, і . Для фіксованого розміру вибірки, тобто, size, that is ,

[3]

який може бути виконаний, якщо частота дискретизації в межах кожного шару проводиться пропорційно стандартному відхиленню в кожному шарі : , де і є константами, як .

«Оптимальний розподіл» досягається, коли частоти дискретизації в межах шарів виробляються прямо пропорційно стандартним відхиленням в межах шарів і обернено пропорційно квадратному кореню з вартості вибірки для кожного елемента в межах шарів, :

[4]

де це константа, як , або в більш загальному плані, коли

[5]

Якісне дослідження

Визначення розмірів вибірки в якісних дослідженнях використовує інший підхід. Як правило, це суб'єктивне судження, взяте як діагностичні засоби. Один з підходів полягає у подальшому включенні в себе додаткових учасників або матеріалів доки не досягнуто насичення. Кількість, необхідна для досягнення насичення, була досліджена емпірично.

Існує мала кількість надійних вказівок по оцінці розмірів вибірки перед початком дослідження з цілою низкою наведених пропозицій. Метод близький до розрахунку кількісної потужності на основі негативного біноміального розподілу був запропонований для тематичного аналізу.

Див. також

Примітки

  1. Isogenic.info > Resource equation [Архівовано 23 вересня 2016 у Wayback Machine.] by Michael FW Festing. Updated Sept. 2006
  2. Kish (1965), p.78.
  3. Kish (1965), p.81.
  4. Kish (1965), p.93.
  5. Kish (1965), p.94.

Посилання

  • Bartlett, J. E., II; Kotrlik, J. W.; Higgins, C. (2001). Organizational research: Determining appropriate sample size for survey research (PDF). Information Technology, Learning, and Performance Journal. 19 (1): 43—50. Архів оригіналу (PDF) за 6 березня 2009. Процитовано 30 листопада 2016.
  • Kish, L. (1965). Survey Sampling. Wiley. ISBN 0-471-48900-X.
  • Smith, Scott (8 квітня 2013). Determining Sample Size: How to Ensure You Get the Correct Sample Size | Qualtrics. Qualtrics. Архів оригіналу за 18 листопада 2016. Процитовано 15 листопада 2016.

Література

Read other articles:

Untuk seri animasi yang berdasarkan pada film tersebut, lihat Beethoven (seri TV). BeethovenSutradaraBrian LevantProduserJoe Medjuck Michael C. Gross Ivan ReitmanDitulis olehJohn Hughes Amy Holden JonesPemeran Charles Grodin Bonnie Hunt Dean Jones Oliver Platt Stanley Tucci Penata musikRandy EdelmanSinematograferVictor J. KemperPenyuntingWilliam D. Gordean Sheldon KahnPerusahaanproduksiNorthern Lights EntertainmentDistributorUniversal PicturesTanggal rilis 3 April 1992 (1992-04-03)...

 

 

This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these template messages) The topic of this article may not meet Wikipedia's general notability guideline. Please help to demonstrate the notability of the topic by citing reliable secondary sources that are independent of the topic and provide significant coverage of it beyond a mere trivial mention. If notability cannot be shown, the article is likely to be merged,...

 

 

David CronenbergCC OOnt FRSCCronenberg di Genie Award 2012LahirDavid Paul Cronenberg15 Maret 1943 (umur 81)Toronto, Ontario, KanadaKebangsaanKanadaAlmamaterUniversity of TorontoPekerjaanSutradara, produser, pembuat film, penulis naskah, pemeran, pengarangTahun aktif1966–sekarangSuami/istriMargaret Hindson (1970–1977; 1 anak; bercerai)Carolyn Zeifman (1979–2017 sampai kematiannya; 2 anak)Anak3, termasuk Brandon David Paul Cronenberg, CC OOnt FRSC (lahir 15 Mare...

27 Steps of MayPoster filmSutradaraRavi BharwaniProduserRavi BharwaniRayya MakarimWilza LubisDitulis olehRayya MakarimPemeran Raihaanun Lukman Sardi Ario Bayu Verdi Solaiman Henky Solaiman Otig Pakis Norman Akyuwen Sapto Soetarjo Richard Oh Joko Anwar Penata musikThoersi ArgeswaraSinematograferIpung Rachmat SyaifulPenyuntingWawan I. WibowoLilik SubagyoTanggal rilis 28 November 2018 (2018-11-28) (Jogja-NETPAC Asian Film Festival) 27 April 2019 (2019-04-27) Durasi112 menitNe...

 

 

Bulgarian association football player Krum Bibishkov Bibishkov in 2011Personal informationFull name Krum Georgiev BibishkovDate of birth (1982-09-02) 2 September 1982 (age 41)Place of birth Marikostinovo, BulgariaHeight 1.90 m (6 ft 3 in)[1]Position(s) ForwardYouth career Pirin BlagoevgradSenior career*Years Team Apps (Gls)1998–1999 Pirin Blagoevgrad 6 (1)1999 Bayern Munich II 0 (0)2000–2001 Levski Sofia 2 (1)2001–2002 Beroe Stara Zagora 27 (7)2002–2004 Mar...

 

 

1966 oratorio by Krzysztof Penderecki St Luke Passionby Krzysztof PendereckiPerformance at the Novaya Opera Theatre, Moscow, in 2016EnglishPassion and Death of Our Lord Jesus Christ According to St LukeFull titlePassio et mors Domini nostri Jesu Christi secundum LucamTextfrom Gospel of LukeStabat MaterhymnspsalmsLamentationsLanguageLatinPerformed30 March 1966 (1966-03-30)Scoringnarratorsopranobaritonebassthree choirschildren's choirorchestra The St Luke Passion (full title: Pas...

This article's lead section may be too short to adequately summarize the key points. Please consider expanding the lead to provide an accessible overview of all important aspects of the article. (May 2024) World War I battle in Iran between Russia and Iran Battle of Robat KarimPart of Part of the Persian campaign in the Middle Eastern theatre of World War I and the Russo-Persian WarsDate27 December 1915LocationRobat Karim, Tehran Province, Iran35°28′55″N 51°04′51″E / ...

 

 

Irish League 1985-1986 Competizione Irish League Sport Calcio Edizione 85ª Organizzatore IFA Luogo  Irlanda del Nord Partecipanti 14 Cronologia della competizione 1984-85 1986-87 Manuale Il campionato era formato da quattordici squadre e il Linfield vinse il titolo. Non vi furono retrocessioni. Classifica finale Pos. Squadra G V N P GF GS Punti 1 Linfield 26 20 3 3 59 16 43 2 Coleraine 26 16 3 7 51 31 35 3 Ards 26 12 7 7 37 19 31 4 Glentoran 26 14 3 9 42 26 31 5 Crusaders 26 13 5 8 42 ...

 

 

Об Аврааме в исламской традиции см. Ибрахим. У этого термина существуют и другие значения, см. Авраам (значения). Авраамдр.-евр. ‏אַבְרָהָם‏‎ Праведный Авраам. Современная икона Пол мужской Период жизни по иудейской традиции:1812—1637 до н. э.[1]по православно�...

French Benedictine monk (1040–1124) For the given names Ernulf and Earnulf, see Arnulf. ErnulfBishop of RochesterAppointed28 September 1114Term ended15 March 1124PredecessorRalph d'EscuresSuccessorJohnOther post(s)Prior of Christ Church, CanterburyAbbot of PeterboroughOrdersConsecration26 December 1115Personal detailsBorn1040BeauvaisDied15 March 1124 (aged 83–84)DenominationCatholic Ernulf (1040 – 15 March 1124) was a French Benedictine monk who became prior of Christ Church in Canterbu...

 

 

Гвардия Людовапол. Gwardia Ludowa «пястовский орёл» — эмблема Гвардии Людовой Годы существования 6 января 1942 — 1 января 1944 Страна Польша Подчинение Польская рабочая партия Марш Марш Гвардии Людовой — песня «My ze spalonych wsi» («Мы из спалённых сёл») Участие в Вторая мировая война �...

 

 

← липень → Пн Вт Ср Чт Пт Сб Нд 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31         2024 рік 18 липня — 199-й день року (200-й у високосні роки) в григоріанському календарі. До кінця року залишається 166 днів. Цей день в історії: 17 липня — 18 липня — 19 липня Зміс�...

Questa voce o sezione sull'argomento telecomunicazioni non cita le fonti necessarie o quelle presenti sono insufficienti. Commento: Numerose mancanze di fonti Puoi migliorare questa voce aggiungendo citazioni da fonti attendibili secondo le linee guida sull'uso delle fonti. Voce principale: Televisione. La presente voce si occupa della televisione in Italia dalle origini ad oggi. Indice 1 Storia 1.1 La prima fase 1.2 Il monopolio RAI 1.3 La televisione a colori 1.4 Le televisioni estere...

 

 

This article is about the 1935 Major League Baseball season only. For information on all of baseball, see 1935 in baseball. Sports season1935 MLB seasonLeagueAmerican League (AL)National League (NL)SportBaseballDurationRegular season:April 16 – September 29, 1935World Series:October 2 – October 7, 1935Number of games154Number of teams16 (8 per league)Regular seasonSeason MVPAL: Hank Greenberg (DET)NL: Gabby Hartnett (CHC)AL championsDetroit Tigers  AL runners-upNew York Yankees...

 

 

This article includes a list of general references, but it lacks sufficient corresponding inline citations. Please help to improve this article by introducing more precise citations. (December 2016) (Learn how and when to remove this message) LNER Thompson/Peppercorn Class K1Preserved loco No. 62005 (as 2005) at CarnforthType and originPower typeSteamDesignerE. Thompson; A. H. PeppercornBuilderNorth British Locomotive CompanySerial number26605–26674Build date1949–1950Total produced70Spec...

First epoch of the Jurassic Period This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Early Jurassic – news · newspapers · books · scholar · JSTOR (February 2024) (Learn how and when to remove this message) Early/Lower Jurassic201.3 ± 0.2 – 174.7 ± 0.8 Ma PreꞒ Ꞓ O S D C P T J K Pg N Chronology−200...

 

 

تحتاج هذه المقالة إلى الاستشهاد بمصادر إضافية لتحسين وثوقيتها. فضلاً ساهم في تطوير هذه المقالة بإضافة استشهادات من مصادر موثوق بها. من الممكن التشكيك بالمعلومات غير المنسوبة إلى مصدر وإزالتها. (أبريل 2019) مؤسسة النقل الحضري وشبه الحضري لمدينة الجزائرإيتوزاETUSAالشعارمعلوما�...

 

 

Pour les articles homonymes, voir Crunch. Crunch de Syracuse Données-clés Fondation 1994 Siège Syracuse (New York, États-Unis) Patinoire (aréna) Upstate Medical University Arena Couleurs Blanc et bleu Ligue LAH Association Est Division Nord Capitaine Gabriel Dumont Capitaines adjoints Darren RaddyshDaniel Walcott Entraîneur-chef Joël Bouchard Directeur général Stacy Roest Propriétaire Howard Dolgon Équipe(s) affiliée(s) Lightning de Tampa Bay (LNH)Solar Bears d'Orlando (ECHL) Sit...

This is an archive of past discussions. Do not edit the contents of this page. If you wish to start a new discussion or revive an old one, please do so on the current talk page. Archives 2023;Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2022;Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2021;Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2020;Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2019;Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2018;Jan Feb Mar Apr May Jun Jul Aug Sep Oct ...

 

 

Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus. Cet article ne cite pas suffisamment ses sources (août 2019). Si vous disposez d'ouvrages ou d'articles de référence ou si vous connaissez des sites web de qualité traitant du thème abordé ici, merci de compléter l'article en donnant les références utiles à sa vérifiabilité et en les liant à la section « Notes et références ». En pratique : Quelles sources sont attendues ? Com...