Проблема множинних порівнянь

У статистиці проблема множинних порівнянь або багаторазового тестування виникає, коли дослідник одночасно порівнює декілька груп за допомогою статистичного тесту.

Чим більше груп порівнюються між собою, тим вірогіднішими стають помилкові висновки статистичного тесту, а саме помилка першого типу[1].

Для розв'язання цієї проблеми було розроблено кілька статистичних методів, які базуються на зниженні порогу значущості (α). Таким чином, знижуючи кількість хибно відхилених нульових гіпотез.

Історія

У 1930-х роках Карло Еміліо Бонферроні розробив один з перших методів корекції для множинних порівнянь, відомий як метод Бонферроні.[2]

Проблема множинних порівнянь привернула підвищену увагу в 1950-х роках роботами таких статистиків, як Тьюкі та Шеффе. Протягом наступних десятиліть було розроблено багато методів для розв'язання цієї проблеми. У 1996 році в Тель-Авіві відбулася перша міжнародна конференція з методів множинного порівняння.[3]

Визначення

Під час проведення будь-якого статистичного тесту існує імовірність помилкового відкидання нульової гіпотези яка насправді є правдивою. Величина цієї імовірності () обирається дослідником заздалегідь, до проведення самого тесту, і визначається як рівень помилки першого роду. Найчастіше рівень альфа дорівнює 5 %. Тобто якщо дослідник проведе 100 тестів ми можемо очікувати що у 5 із них буде помилково відхилена нульова гіпотеза, за умови що вона є насправді вірною. Такі результати називаються хибно позитивними.

Тому у випадках, коли ми маємо багато груп або параметрів які ми хочемо попарно порівняти, 5 % результатів виявляться хибно позитивними. І чим більше попарних порівнянь, тим більша кількість результатів проведених тестів будуть помилковими. Тобто тест виявить значиму відмінність між двома групами коли її насправді не існує.

Неспроможність компенсувати множинні порівняння може мати серйозні наслідки в реальному світі, як показано на наведених нижче прикладах.

  1. Припустимо, що ми хочемо протестувати ефективність нової методики навчання учнів письма. Перша група буде навчатися за новою методикою, а друга — контрольна група — за старою методикою. Писемність учнів обох груп можна порівняти з точки зору граматики, орфографії, змісту тощо. У міру статистичного порівняння більшої кількості параметрів, збільшується імовірність того, що дві групи значимо відрізнятимуться за якимось з атрибутів, коли насправді значимої різниці не мало б бути.
  2. Припустімо, що ми розглядаємо ефективність нового медичного препарату з точки зору зменшення одного із симптомів захворювання. Перша група пацієнтів пройшла курс лікування новим препаратом, а друга, контрольна група, — старим. Як і у попередньому прикладі, ефективність обох препаратів можна порівняти багатьма параметрами. І чим більше симптомів ми порівнюватимемо, тим більш імовірно, що результати порівнянь якогось із них виявляться значимими. Тобто новий препарат виявиться кращим у порівнянні з вже існуючими препаратами з точки зору принаймні одного симптому.

В обох прикладах зі збільшенням кількості порівнянь росте імовірність того, що порівнювані групи відрізнятимуться принаймні за одним атрибутом. Росте імовірність того, що лише через велику кількість попарних порівнянь, якась пара буде статистично значимо відрізнятись. У цьому полягає суть помилки першого типу. Тому якщо інші дослідники будуть тестувати таку саму гіпотезу вони можуть і не отримати значимі результати на своїх даних. Тому такі дослідження є нереплікативними, якщо лише не була введена корекція для множинних порівнянь.

Проблема множинних порівнянь спостерігається також під час розрахунку довірчих інтервалів. Один 95 % довірчий інтервал містить справжнє істинне значення невідомого параметра в 95 % випадків. Тобто, якщо ми розрахуємо 100 довірчих інтервалів, то 5 із них не міститимуть невідомий параметр.

Приклад

При порівнянні двох груп, із параметром , імовірність правильного прийняття вірної нульової гіпотези дорівнює (. Порівнюючи три групи, ця імовірність дорівнює ()()(. Відповідно, імовірність хибного відхилення нульової гіпотези () вже дорівнює . Цей процес називається інфляцією альфа, тобто, збільшення імовірності неправильного відхилення нульової гіпотези яка насправді є вірною.

Таблиця нижче ілюструє як параметр альфа залежить від кількості порівнянь.

Кількість груп Кількість попарних порівнянь
2 2 0.05
3 3 0.098
4 6 0.143
5 10 0.185

Методи усунення проблеми

Найбільш консервативним методом є поправка Бонферроні згідно з якою, імовірність помилки першого типу, яка має величину , діляться на кількість попарних порівнянь : , що також веде до зниження сили тесту.

Наприклад, якщо ми маємо чотири групи які ми хочемо порівняти між собою, і параметр , то ми матимемо попарних порівнянь груп одна з одною.

Таким чином, p-значення, отримане при порівнянні кожної із шести пар, порівнюватиметься із і для того, щоб відхилити нульову гіпотезу р-значення має бути меншим за 0.0083.

Дещо менш консервативну поправку дає метод Холма–Бонферроні, який забезпечує більшу силу тесту, ніж проста корекція Бонферроні. Згідно з цим методом найнижче отримане р-значення () порівнюється із найнижчим та вищі р-значення () порівнюються із менш жорсткими критеріями:[4] .

Масштабне багаторазове тестування

Традиційні методи множинних порівнянь, розглянуті вище, використовуються у дисперсійному аналізі, для коригування порівнянь невеликої кількості груп. Для широкомасштабного множинного тестування, під час якого виконується більша кількість тестів, існують інші методи. Наприклад, у геноміці, використовуючи такі технології, як мікроматриці, можна виміряти рівні експресії десятків тисяч генів, а також генотипи для мільйонів генетичних маркерів. Зокрема, у сфері досліджень генетичних зв'язків існувала серйозна проблема з нереплікацією — результат був статистично значущим в одному дослідженні, але його не вдалося відтворити в наступному дослідженні. Таке невідтворення може мати багато причин, але вважається, що неврахування наслідків багаторазових порівнянь є однією з причин.[5] Прогрес у вимірюванні та інформаційних технологіях значно полегшив збіг великих масивів даних для аналізу, що збільшує кількість гіпотез які треба тестувати. У цій ситуації можна очікувати дуже високі показники хибнопозитивних результатів якщо не корегувати результати методами для множинних порівнянь.

Існує практика, коли множинні порівняння навмисно не корегуються аби збільшити шанси отримати значимі результати дослідження — що є важливим для багатьох дослідників та їх праць. Але такі некореговані значимі результати можуть бути отримані через помилку першого типу статистичного тесту. Така проблема має назву «p-hacking».[6][7]

Ключові поняття
Загальні методи коригування альфа для множинних порівнянь

Список літератури

  1. 6.1: Multiple Comparisons. Statistics LibreTexts (англ.). 27 червня 2017. Процитовано 28 жовтня 2023.
  2. Bonferroni, Carlo E. (1936). Teoria statistica delle classi e calcolo delle probabilità (італ.). Seeber.
  3. Home. mcp-conference.org.
  4. Aickin, M; Gensler, H (May 1996). Adjusting for multiple testing when reporting research results: the Bonferroni vs Holm methods. Am J Public Health. 86 (5): 726—728. doi:10.2105/ajph.86.5.726. PMC 1380484. PMID 8629727.
  5. Qu, Hui-Qi; Tien, Matthew; Polychronakos, Constantin (1 жовтня 2010). Statistical significance in genetic association studies. Clinical and Investigative Medicine. 33 (5): E266—E270. ISSN 0147-958X. PMC 3270946. PMID 20926032.
  6. Young, S. S., Karr, A. (2011). Deming, data and observational studies (PDF). Significance. 8 (3): 116—120. doi:10.1111/j.1740-9713.2011.00506.x.
  7. Smith, G. D., Shah, E. (2002). Data dredging, bias, or confounding. BMJ. 325 (7378): 1437—1438. doi:10.1136/bmj.325.7378.1437. PMC 1124898. PMID 12493654.

Інші джерела

Read other articles:

Tata Motors LimitedSebelumnyaTata Engineering and Locomotive Company Ltd. (TELCO)JenisPublikKode emitenBSE: 500570NSE: TATAMOTORSNYSE: TTMKomponen NSE NIFTY 50ISININ9155A01020IndustriOtomotifDidirikan1945; 79 tahun lalu (1945)PendiriJ. R. D. TataKantorpusatMumbai, Maharashtra, India[1]Wilayah operasiSeluruh duniaTokohkunci Natarajan Chandrasekaran (chairman) Guenter Butschek (CEO) ProdukMobilMobil mewahKendaraan niagaSuku cadang kendaraanMobil pikapSUVProduksi 961.463 (2020)...

 

 

Potret Jean-Joseph Carriès oleh John Singer Sargent Jean-Joseph Marie Carriès (15 Februari 1855 – 1 Juli 1894) merupakan seorang pemahat, pembuat keramik, dan miniaturis Prancis. Karya keramiknya sebagian besar dalam periuk-belanga, dan bagian dari gerakan seni tembikar Prancis, dan mencakup banyak wajah dan kepala, sering kali dengan ekspresi aneh, ia menciptakan beberapa pot konvensional, dengan efek glasir abu tebal yang tidak mencolok dalam gaya Jepang.[1] Galeria Daftar pusta...

 

 

Artikel ini membutuhkan rujukan tambahan agar kualitasnya dapat dipastikan. Mohon bantu kami mengembangkan artikel ini dengan cara menambahkan rujukan ke sumber tepercaya. Pernyataan tak bersumber bisa saja dipertentangkan dan dihapus.Cari sumber: Spermatogenesis – berita · surat kabar · buku · cendekiawan · JSTOR artikel ini perlu dirapikan agar memenuhi standar Wikipedia. Tidak ada alasan yang diberikan. Silakan kembangkan artikel ini semampu Anda. M...

كليفتون سبرينغز   الإحداثيات 42°57′44″N 77°08′15″W / 42.9622°N 77.1375°W / 42.9622; -77.1375  [1] تاريخ التأسيس 1801  تقسيم إداري  البلد الولايات المتحدة[2]  التقسيم الأعلى مقاطعة أونتاريو  خصائص جغرافية  المساحة 3.934369 كيلومتر مربع3.93437 كيلومتر مربع (1 أبريل 2010)&...

 

 

العلاقات الصينية التشيلية الصين تشيلي   الصين   تشيلي تعديل مصدري - تعديل   العلاقات الصينية التشيلية هي العلاقات الثنائية التي تجمع بين الصين وتشيلي.[1][2][3][4][5] مقارنة بين البلدين هذه مقارنة عامة ومرجعية للدولتين: وجه المقارنة الصين تشيلي �...

 

 

South Dakota affiliate of the Republican Party South Dakota Republican Party ChairpersonJohn WiikSenate LeaderKris LangerHouse LeaderLee QualmHeadquartersP.O. Box 1099.Pierre, South Dakota 57501[1]Membership (2021)279,921[2]IdeologyConservatismNational affiliationRepublican PartyColorsRed, White, BlueSeats in the Senate30 / 35Seats in the House62 / 70Statewide Offices12 / 13WebsiteSouth Dakota GOPPolitics of South DakotaElections The South Dakota Republican Party is the affili...

Religion in Malawi Religion in Malawi (2020 estimate[1])   Christianity (79.3%)  Islam (14%)  Traditional faiths (5.9%)  None (0.5%)  Others (0.3%) St. Helen's Cathedral in Livingstonia Christianity is the most widely professed religion in Malawi, with significant populations of the adherents of Islam and traditional faiths.[2] Religious pluralism is both a prominent social value and enshrined in the country's constitution.[...

 

 

Artikel ini sebatang kara, artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini.Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala.Tag ini diberikan pada November 2022. Edge of InnocenceNama lainTradisional夏天19岁的肖像Sederhana夏天19岁的肖像MandarinXiàtiān Shíjiǔ Suì De Xiàoxiàng SutradaraChang Jung-ChiProduserDesen International MediaDitulis olehSoji ShimadaBerdasarkanSummer Portrait of a ...

 

 

Swedish sailor Olle ÅkerlundPersonal informationFull nameOlle Erik Cyrus ÅkerlundBorn28 September 1911Annedal, SwedenDied4 February 1978 (aged 66)Stockholm, SwedenSailing careerClubRoyal Swedish Yacht Club Medal record Men's Sailing Representing  Sweden Olympic Games 1932 Los Angeles 6 metre class Olle Erik Cyrus Åkerlund (28 September 1911 – 4 February 1978) was a Swedish sailor. He was a crew member of the Swedish boat Bissbi that won the gold medal in the 6 m class at the 19...

1973 song by George HarrisonThe Day the World Gets 'RoundSong by George Harrisonfrom the album Living in the Material World PublishedMaterial World Charitable Foundation (administered by Harrisongs)Released30 May 1973GenreFolk rockLength2:53LabelAppleSongwriter(s)George HarrisonProducer(s)George Harrison The Day the World Gets 'Round is a song by English musician George Harrison, released on his 1973 album Living in the Material World. Harrison was inspired to write the song following the su...

 

 

Beethoven VirusPoster promosi untuk Beethoven VirusGenreRomanMusikDitulis olehHong Jin-ahHong Ja-ramSutradaraLee Jae-kyooPemeranKim Myung-minLee Ji-ahJang Keun-sukNegara asalKorea SelatanBahasa asliKoreaJmlh. episode18ProduksiProduser eksekutifOh Kyung-hoonProduserPark Chang-shikLokasi produksiKoreaSinematografiSong In-hyuk Hong Sung-wookDurasiRabu dan Kamis pukul 21:55 (WSK)Rumah produksiKim Jong-hak ProductionRilis asliJaringanMunhwa Broadcasting CorporationRilis11 September (2008-09-...

 

 

American politician (born 1956)This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Betsy Markey – news · newspapers · books · scholar · JSTOR (April 2024) (Learn how and when to remove this message)Betsy MarkeyU.S. Assistant Secretary of Homeland Security for Intergovernmental AffairsIn office2011–2013Presiden...

Evolutionary theory of depression Rank theory is an evolutionary theory of depression, developed by Anthony Stevens and John Price, and proposes that depression promotes the survival of genes.[1] Depression is an adaptive response to losing status (rank) and losing confidence in the ability to regain it. The adaptive function of the depression is to change behaviour to promote survival for someone who has been defeated. According to rank theory, depression was naturally selected to al...

 

 

For other people with similar names, see Sam Shepherd (disambiguation). The Right HonourableSir Samuel ShepherdKS FRSESolicitor General for EnglandIn officeDecember 1813 – 1817Attorney General for EnglandIn office1817 – June 1819Lord Chief Baron of the Scottish Court of ExchequerIn officeJune 1819 – February 1830 Personal detailsBorn6 April 1760Died3 November 1840(1840-11-03) (aged 80)NationalityBritishAlma materMerchant Taylors' SchoolProfessionBarrister...

 

 

この項目には、一部のコンピュータや閲覧ソフトで表示できない文字が含まれています(詳細)。 数字の大字(だいじ)は、漢数字の一種。通常用いる単純な字形の漢数字(小字)の代わりに同じ音の別の漢字を用いるものである。 概要 壱万円日本銀行券(「壱」が大字) 弐千円日本銀行券(「弐」が大字) 漢数字には「一」「二」「三」と続く小字と、「壱」「�...

ÖFB-Cup 2009-2010ÖFB-Stiegl-Cup Competizione ÖFB-Cup Sport Calcio Edizione 75ª Organizzatore ÖFB Date dal 2 agosto 2009al 16 maggio 2010 Luogo  Austria Partecipanti 97 Risultati Vincitore  Sturm Graz(4º titolo) Secondo  Wiener Neustadt Statistiche Miglior marcatore Jonathan (4) Elvir Karahasonović (4) Mensur Kurtiši (4) Klemen Lavrič (4) Đorđe Rakić (4) Thomas Stadler (4) Incontri disputati 94 Lo Sturm Graz festeggia la vittoria Cronologia della c...

 

 

Частина серії проФілософіяLeft to right: Plato, Kant, Nietzsche, Buddha, Confucius, AverroesПлатонКантНіцшеБуддаКонфуційАверроес Філософи Епістемологи Естетики Етики Логіки Метафізики Соціально-політичні філософи Традиції Аналітична Арістотелівська Африканська Близькосхідна іранська Буддій�...

 

 

French actress (1921–1950) Corinne LuchaireLuchaire in 1943BornRosita Christiane Yvette Luchaire(1921-02-11)11 February 1921Paris, FranceDied22 January 1950(1950-01-22) (aged 28)Paris, FranceYears active1935–1940[1]SpouseGuy de Voisins-LavernièreParentJean Luchaire (father) Corinne Luchaire (11 February 1921 – 22 January 1950) was a French film actress who was a star of French cinema on the eve of World War II.[2] Her association with the German occupation led...

هذه المقالة يتيمة إذ تصل إليها مقالات أخرى قليلة جدًا. فضلًا، ساعد بإضافة وصلة إليها في مقالات متعلقة بها. (نوفمبر 2023) محمد بن سعيد الخنيزي معلومات شخصية الميلاد 2 فبراير 1925 (العمر 99 سنة)محافظة القطيف  السعودية مواطنة  السعودية الحياة العملية المهنة محامي سبب الشهرة شاع...

 

 

Battle of the American Civil War Battle of Big MoundPart of Sioux Wars, American Civil WarBig Mound battlefieldDateJuly 24, 1863LocationDakota TerritoryPresent-day Kidder County, North DakotaResult U.S. victoryBelligerents United States of America Santee SiouxYankton, Yanktonai and Teton SiouxCommanders and leaders Henry Hastings Sibley InkpadutaStanding BuffaloStrength 2,056 soldiers60 mixed-blood and Sioux scouts 1,000-1,500Casualties and losses 3 killed, 4 wounded Uncertain, 9 or more kill...