Альтернативний метод перевірки статистичних гіпотез полягає у визначенні множини статистичних моделей, по одній для кожної гіпотези кандидата, після чого використовуються техніки відбору моделі, аби вибрати ту, яка підходить найбільше.[2] Найбільш загальні техніки відбору моделей основані на інформаційному критерії Акаіке або коефіцієнті Баєса.
Протилежністю такого аналізу вибірки може бути розвідувальний аналіз вибірки, який може не мати наперед визначених гіпотез.
Статистичні гіпотези не слід плутати із науковими гіпотезами. Наукові гіпотези прагнуть дати пояснення природним явищам, в той час як статистичні гіпотези зазвичай використовують для встановлення факту існування зв'язку (або його відсутність) між вибірками даних. Таким прикладом є методи медичного лікування, де статистична гіпотеза використовується як спроба ілюстрації, з мірою статистичної значимості, чи ліки діють краще за плацебо. Наукова гіпотеза потім шукатиме пояснення результатів, незалежно від результатів перевірки статистичної гіпотези.
Статистичні гіпотези
Визначення
Нехай у (статистичному) експерименті спостерігається реалізація деякої випадкової величини, розподіл якої є невідомим повністю чи частково. Тоді будь-яке твердження, що стосується , називається статистичною гіпотезою. Гіпотези розрізняються за видом припущень, що містяться в них:
Статистичну гіпотезу, що однозначно визначає розподіл , тобто, , де якийсь конкретний закон, називають простою.
Статистична гіпотеза, що стверджує, що розподіл належить до деякої сім'ї розподілів, тобто , де — сім'я розподілів, називається складною.
На практиці зазвичай потрібно перевірити якусь конкретну і, як правило, просту гіпотезу . Таку гіпотезу прийнято називати нульовою. При цьому паралельно розглядається гіпотеза, що суперечить їй , що називається конкуруючою або альтернативною[en].
Висунута гіпотеза потребує перевірки, яка здійснюється статистичними методами, тому гіпотезу називають статистичною. Для перевірки гіпотези використовують критерії, що дозволяють прийняти або спростувати гіпотезу.
В більшості випадків статистичні критерії засновані на випадковій вибірці фіксованого об'єму з розподілу . У послідовному аналізі вибірка формується в ході самого експерименту і тому її об'єм є випадковою величиною.
Приклад
Нехай дано незалежну вибірку з нормального розподілу, де — невідомий параметр. Тоді , де — фіксована стала, є простою гіпотезою, а альтернативна до неї — складною.
Визначення термінів
Наступні визначення термінів в основному взяті із тлумачень в книзі Леманна і Романо[3]:
Статистична гіпотеза
Твердження щодо параметрів, які описують сукупність (не вибірку).
Статистика
Значення розраховане із вибірки, що часто підсумовують вибірку з метою порівняння.
Проста гіпотеза
Будь-яка гіпотеза яка повністю визначає розподіл сукупності.
Складна гіпотеза
Будь-яка гіпотеза, яка не визначає розподіл сукупності повністю.
Імовірність для випробування, що визначає правильність відкидання нульової гіпотези. Доповнення до хибнонегативної частоти, β. Потужність називається чутливістю в області біостатистики. («Ця перевірка є перевіркою на чутливість, оскільки результат є негативним, можна із упевненістю зробити висновок, що пацієнт не має цього стану.») Див. Чутливість і специфічність і Помилки першого і другого роду за більш вичерпними визначеннями.
Для простої гіпотези це імовірність неправильного відкидання нульової гіпотези при випробуванні. Хибнопозитивна частота. Для складних гіпотез це супремум імовірності відкидання нульової гіпотези по всім випадках, які покриває нульова гіпотеза. В біостатистиці доповнення до хибнопозитивної частоти називається специфічністю. («Це є специфічною перевіркою, оскільки при позитивному результаті ми можемо з упевненістю зробити висновок, що пацієнт має цей стан.») Див. Чутливість і специфічність і Помилки першого і другого роду за більш вичерпними визначеннями.
Рівень значимості тесту (α)
Це верхня межа накладається на розмір випробування. Це значення, яке обирає статист перед тим як вивчити дані або обрати будь-який спосіб перевірки, який застосувати. Це максимальний показник помилкового відхилення H0, який дослідник готовий допустити. Перевірка H0 на рівні значимості α означає перевірку H0, при якій розмір випробування не перевищує α. В більшості випадків, використовують випробування розмір якого дорівнює рівню значимості.
попередник перевірки статистичних гіпотез. Результат експерименту вважався статистично значущим, якщо вибірка була достатньо несумісною із (нульовою) гіпотезою. Це по різному розглядали у загальному сенсі, прагматична евристика для встановлення значущості експериментальних результатів, конвенція, яка встановлювала порогове значення статистичного доведення або метод для отримання висновків із даних. Метод перевірки статистичних гіпотез додав цьому математичної суворості і філософську послідовність поняттю, зробивши альтернативну гіпотезу однозначною. Цей термін тепер використовується здебільшого для описання сучасної версії, яка тепер є частиною перевірки статистичних гіпотез.
Етапи перевірки статистичних гіпотез
Формулювання основної гіпотези і альтернативної гіпотези[en]. Гіпотези повинні бути чітко формалізовані в математичних термінах.
Задання достовірності , що називається рівнем значущості і що відповідає помилкам першого роду, на якому надалі і буде зроблений висновок про правдивість гіпотези.
Розрахунок статистики критерію такий, що:
її величина залежить від початкової вибірки ;
за її значенням можна зробити висновки про істинність гіпотези ;
сама статистика повинна підкорятися якомусь невідомому закону розподілу, так як сама є випадковою в силу випадковості .
Побудова критичної області. З області значень виділяємо підмножину таких значень, за якими можна судити про суттєвість розбіжностей з припущенням. Її розмір вибирається таким чином, щоб виконувалась рівність . Ця множина і називається критичною областю.
Висновок про істинність гіпотези. Спостережувані значення вибірки підставляються в статистику і за попаданням (або непопаданням) у критичну область виноситься ухвала про відкидання (або ухвалення) висунутої гіпотези .
Види критичної області
Двобічна критична область визначається двома інтервалами , де знаходять з умов .
Лівобічна критична область визначається інтервалом , де знаходять з умови .
Правобічна критична область визначається інтервалом , де знаходять з умови .
Арбутнот дослідив записи про народження дітей в Лондоні від 1629 до 1710 (всього за 82 роки), і застосував критерій знаків[en], просту непараметризовану статистичну перевірку[en][6][7][8]. В кожному із досліджених років, кількість народжених хлопчиків, перевищувала кількість народжених дівчаток. Розглядаючи рівноймовірним народження більшої кількості чоловіків або більшої кількості жінок, імовірність спостережуваного результату складала 0.582, або близько 1 до 4,8360,0000,0000,0000,0000,0000; в сучасних термінах, це є p-значенням. Що є неймовірно малим, після чого Арбутнот зробив висновок, що це не є випадковістю, а божим провидінням: «Звідки випливає, що цим процесом керує Провидіння, а не Випадок (англ.From whence it follows, that it is Art, not Chance, that governs)». Кажучи більш сучасними термінами, він відкинув нульову гіпотезу щодо рівності шансів народження хлопчика чи дівчинки із рівнем значимості p = 1/282.
Лаплас дослідив статистику майже половини мільйона народжень. Статистика показала більшу кількість народжуваних хлопчиків ніж дівчаток[9][10]. Розрахувавши p-значення, він зробив висновок, що ця перевага у кількості є об'єктивним явищем, а не випадковістю[11].
Леді дегустує чай
В одному із відомих прикладів перевірки статистичної гіпотези під назвою Леді дегустує чай[12] доктор біології Маріель Брістол[en], яка працювала як і Рональд Фішер у Ротамстедській дослідній станції[en], стверджувала, що вона здатна визначити, як було приготовано чай з молоком, а саме, спочатку налили у філіжанку чай або молоко. Фішер запропонував налити їй на пробу вісім філіжанок чаю у випадковому порядку, по чотири із кожним варіантом. Було поставлене питання, з якою імовірністю випадковим чином її відповідь буде вдалою. Нульова гіпотеза передбачала, що леді не має здатності відрізнити чай. Тест полягав у простому підрахунку кількість вдалих спроб із вибраних 4 чашок чаю. Критичним інтервалом був єдиний випадок із 4 вдалих вгадувань із 4 можливих, що базувався на традиційному критерії імовірності (< 5 %). Випадок із 4 вгадуваннями відповідає 1 із 70 можливих комбінацій (p ≈ 1,4 %). Фішер стверджував, що ніякої альтернативної гіпотези не потрібно. Леді вірно визначила кожну чашку[13], що вважалося статистично значимим результатом.
Судочинство
Процедуру статистичної перевірки можна порівняти із законами правосуддя; обвинувачений вважається невинним, доки його чи її вина не доведена. Прокурор намагається довести вину обвинуваченого. І лише тоді, коли доказів для обвинувачення буде достатньо, обвинувачений буде засуджений.
На початку процедури, існує дві гіпотези: стверджує, що «обвинувачений є невинним», і — «обвинувачений є винним». Перша гіпотеза — , називається нульовою гіпотезою, і вона визнається на початковому етапі. Друга, , називається альтернативною гіпотезою. Це та альтернативна гіпотеза, яку ми намагаємося довести або заперечити.
Гіпотеза про невинуватість буде відкинута лише тоді, коли помилка стане малоймовірною, оскільки небажано засуджувати невинного обвинувачуваного. Така помилка називається помилкою першого роду (тобто, засудження невинної особи), контролюють, аби ця помилка була невеликою. Наслідком такої асиметричної поведінки є більше поширення помилок другого роду (виправдання особи, яка вчинила злочин).
H0 вірна Дійсно не винний
H1 вірна Дійсно винний
Прийняття нульової гіпотези Виправдання
Вірне рішення
Невірне рішення Помилка II роду
Відкидання нульової гіпотези Засудження
Невірне рішення Помилка I роду
Вірне рішення
Процес судочинства можна розглядати як один з двох або обидва процеси прийняття рішення: винний чи не винний, або докази проти непевності («за межею певного розумного сумніву»). З одного боку, оцінюється обвинувачений; з іншого боку оцінюється ефективність обвинувачення (вага винесених доказів). Перевірку статистичної гіпотези можна сприймати як присуд гіпотезі, або присуд доказам.
Філософські боби
Наступний приклад описувався філософом, який описував сімейство наукових методів до того, як перевірка гіпотез була формалізована і популяризована[14].
Замало бобів у цій жменьці є білими.
Більшість бобів із цієї торбинки є білими.
Тому: ймовірно, ці боби були взяті із іншої торбинки.
Це гіпотетичний висновок.
Боби у торбинці є генеральною сукупністю. Жменька бобів є вибіркою (зразком). Нульовою гіпотезою є припущення, що вибірка була взята із певної сукупності. Критерієм відхилення нульової гіпотези є «очевидна» різниця зовнішнього вигляду (неформальна відмінність у середньому). Цікавим є висновок із того, що розглядаючи реальну сукупність і реальну вибірку, було отримано висновок про уявну торбинку. Філософ скоріше міркував про логіку, а не ймовірність. Аби бути справжньою статистичною перевіркою гіпотези, цей приклад вимагає виконання формальностей із розрахунку ймовірності і порівняння отриманої імовірності із стандартною.
Просте узагальнення цього прикладу передбачає дослідження торбинки із перемішаними бобами і жменьки, яка містить або лише малу кількість, або дуже багато білих бобів. При узагальненні розглядають два екстремуми. Це вимагає більше розрахунків і більше порівнянь, аби дати формальну відповідь, але основна суть філософії залишається незмінною; якщо склад жменьки сильно відрізняється від складу торбинки, тоді, ймовірно, цю вибірку було отримано із іншої торбинки. Початковий оригінальний приклад називають односторонньою перевіркою, в той час як його узагальнення називається двосторонньою перевіркою.
Твердження також спирається на припущення, що вибірка була випадковою. Якщо хтось навмисно вишукував і вибирав із торбинки білі боби, тоді це б могло пояснити, чому у жменьці так багато білих бобів, а також пояснює чому кількість білих бобів у торбинці була вичерпана (хоча, також передбачається, що мішок повинен бути набагато більшим за одну жменю).
↑Conover, W.J. (1999), Chapter 3.4: The Sign Test, Practical Nonparametric Statistics (вид. Third), Wiley, с. 157—176, ISBN978-0-471-16068-7
↑Sprent, P. (1989), Applied Nonparametric Statistical Methods (вид. Second), Chapman & Hall, ISBN [[Special:BookSources/978-0-412-44980-2
From whence it follows, that it is Art, not Chance, that governs.|978-0-412-44980-2
From whence it follows, that it is Art, not Chance, that governs.]] {{citation}}: Перевірте значення |isbn=: недійсний символ (довідка)
↑Stigler, Stephen M. (1986). The History of Statistics: The Measurement of Uncertainty Before 1900. Harvard University Press. с. 225–226. ISBN978-0-67440341-3.
↑Laplace, P. (1778). Mémoire sur les probabilités(PDF). Mémoires de l'Académie Royale des Sciences de Paris. 9: 227—332. Архів оригіналу(PDF) за 27 квітня 2015. Процитовано 21 лютого 2019.
В іншому мовному розділі є повніша стаття Statistical hypothesis testing(англ.). Ви можете допомогти, розширивши поточну статтю за допомогою перекладу з англійської.
Перекладач повинен розуміти, що відповідальність за кінцевий вміст статті у Вікіпедії несе саме автор редагувань. Онлайн-переклад надається лише як корисний інструмент перегляду вмісту зрозумілою мовою. Не використовуйте невичитаний і невідкоригований машинний переклад у статтях української Вікіпедії!
Машинний переклад Google є корисною відправною точкою для перекладу, але перекладачам необхідно виправляти помилки та підтверджувати точність перекладу, а не просто скопіювати машинний переклад до української Вікіпедії.
Не перекладайте текст, який видається недостовірним або неякісним. Якщо можливо, перевірте текст за посиланнями, поданими в іншомовній статті.
Artikel ini sebatang kara, artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini.Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala.Tag ini diberikan pada Maret 2016. SMP Negeri 2 PaluInformasiRentang kelasVII, VIII, IXKurikulumKurikulum Tingkat Satuan PendidikanAlamatLokasiJl. Monginsidi 4, Palu, Sulawesi TengahMoto SMP Negeri (SMPN) 2 Palu, merupakan salah satu Sekolah Menengah Pertama Negeri yang ada di Provinsi Su...
Adolf Otto Reinhold WindausLahir25 Desember 1876Berlin, Kekaisaran JermanMeninggal9 Juni 1959(1959-06-09) (umur 82)Göttingen, Jerman BaratKebangsaanJermanPenghargaanHadiah Nobel dalam Kimia (1928)Karier ilmiahBidangKimia organik biokimiaMahasiswa doktoralAdolf Friedrich Johann Butenandt Adolf Otto Reinhold Windaus (25 Desember 1876 – 9 Juni 1959) ialah seorang kimiawan Jerman yang memenangkan Nobel Kimia pada tahun 1928 untuk karyanya pada sterol dan hubungannya dengan vitamin. Ia me...
André DerainAndré Derain pada tahun 1903Lahir(1880-06-10)10 Juni 1880Chatou, Yvelines, Île-de-FranceMeninggal8 September 1954(1954-09-08) (umur 74)Garches, Hauts-de-Seine, Île-de-FrancePendidikanAcadémie Camillo, Académie JulianDikenal atasSeni Lukis, Seni PahatGerakan politikFauvisme André Derain (bahasa Prancis: [dəʁɛ̃] (Lahir: Chatou, Prancis, 10-Juni-1880) adalah seorang pelukis, pemahat patung, ilustrator, dan pionir seni lukis modern Prancis.[1][2] ...
Artikel ini sebatang kara, artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini.Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala.Tag ini diberikan pada Desember 2023. Daftar penghargaan dan nominasi yang diterima oleh Zindagi Na Milegi Dobara Dari kiri: Hrithik Roshan, Katrina Kaif, Abhay Deol, dan Farhan Akhtar pada pembukaan Zindagi Na Milegi Dobara. Penghargaan dan nominasi Penghargaan Menang Nominasi Penghargaa...
Toxin produced by cyanobacteria Green scum produced by and containing cyanobacteria, washed up on a rock in California during an algal bloom Cyanotoxins are toxins produced by cyanobacteria (also known as blue-green algae). Cyanobacteria are found almost everywhere, but particularly in lakes and in the ocean where, under high concentration of phosphorus conditions, they reproduce exponentially to form blooms. Blooming cyanobacteria can produce cyanotoxins in such concentrations that they can ...
Species of wheat used for food This article is about the cultivar of wheat. For the Turkish döner wrap, see dürüm. Durum Durum wheat Scientific classification Kingdom: Plantae Clade: Tracheophytes Clade: Angiosperms Clade: Monocots Clade: Commelinids Order: Poales Family: Poaceae Subfamily: Pooideae Genus: Triticum Species: T. durum Binomial name Triticum durumDesf. Synonyms[1] List Triticum accessorium Flaksb. nom. inval. Triticum alatum Peterm. Triticum algeriense Desf. ex M...
Office skyscraper in Manhattan, New York 195 BroadwaySeen from Fulton Street and BroadwayAlternative namesAmerican Telephone & Telegraph Company Building, Western Union BuildingGeneral informationTypeCommercialArchitectural styleNeoclassicalAddress195–207 BroadwayTown or cityFinancial District, Manhattan, New York City, New YorkCountryUnited StatesCoordinates40°42′40″N 74°00′33″W / 40.7111°N 74.0093°W / 40.7111; -74.0093Construction started1912Complet...
Sporting event delegationVenezuela at the1948 Summer OlympicsIOC codeVENNOCVenezuelan Olympic CommitteeWebsitecov.com.ve (in Spanish)in London, United Kingdom29 July–14 August 1948Competitors1 in 1 sportFlag bearerJulio César LeónMedals Gold 0 Silver 0 Bronze 0 Total 0 Summer Olympics appearances (overview)19481952195619601964196819721976198019841988199219962000200420082012201620202024 Venezuela competed in the 1948 Summer Olympic Games held in London, United Kingdom. The count...
Extinct family of mammals GroeberiidaeTemporal range: Eocene - Oligocene 45–28 Ma PreꞒ Ꞓ O S D C P T J K Pg N Scientific classification Domain: Eukaryota Kingdom: Animalia Phylum: Chordata Class: Mammalia Clade: Theriiformes Family: †GroeberiidaePatterson, 1952 Genera †Epiklohnia? †Groeberia †Klohnia? †Praedens? Synonyms Groeberidae Groeberiidae is a family of strange non-placental mammals from the Eocene and Oligocene epochs of Patagonia, Argentina and Chile, South Ameri...
Pour les articles homonymes, voir Échevin (homonymie). Un échevin est, historiquement, dans le nord de la France au Moyen Âge, un magistrat nommé par un seigneur pour rendre justice sur ses terres. Dans certaines régions il est, sous l'Ancien Régime, un magistrat communal équivalent à l'actuel titre de conseiller municipal, comme tel est le cas de nos jours en Belgique où les échevins sont des élus adjoints au bourgmestre, équivalents en France d'adjoints au maire. Aux Pays-Bas, ...
Non-metropolitan district and Borough in EnglandBorough of WaverleyNon-metropolitan district and BoroughWaverley Abbey, after which the borough is named.Motto(s): Oppida Rusque Una(Latin: Town and countryside in unity)Waverley shown within SurreySovereign stateUnited KingdomConstituent countryEnglandRegionSouth East EnglandNon-metropolitan countySurreyStatusNon-metropolitan districtAdmin HQGodalmingIncorporated1 April 1974Government • TypeNon-metropolitan district council...
Jepang padaOlimpiadeKode IOCJPNKONKomite Olimpiade JepangSitus webwww.joc.or.jp (dalam bahasa Jepang)Medali 156 158 183 Total 497 Penampilan Musim Panas1912192019241928193219361948195219561960196419681972197619801984198819921996200020042008201220162020Penampilan Musim Dingin19281932193619481952195619601964196819721976198019841988199219941998200220062010201420182022 Jepang pada Olimpiade Musim Panas 1912 Berikut ini adalah daftar pembawa bendera yang mewakili Jepang pada Olimpia...
هذه المقالة تحتاج للمزيد من الوصلات للمقالات الأخرى للمساعدة في ترابط مقالات الموسوعة. فضلًا ساعد في تحسين هذه المقالة بإضافة وصلات إلى المقالات المتعلقة بها الموجودة في النص الحالي. (نوفمبر 2018) لمعانٍ أخرى، طالع مقاطعة ستارك (توضيح). مقاطعة ستارك الإحداثيات ...
Shopping mall in Tel Aviv, IsraelDizengoff CenterLocationTel Aviv, IsraelCoordinates32°4′30.73″N 34°46′29.42″E / 32.0752028°N 34.7748389°E / 32.0752028; 34.7748389Opening date1983ArchitectYitzhak YasharAliza ToledoMordechai Ben-HorinNo. of stores and servicesabout 420 Dizengoff Center (Hebrew: דיזנגוף סנטר) is a shopping mall at the intersection of Dizengoff Street and King George Street in Tel Aviv, Israel. The mall is named for Meir Dizengoff,...
The Military ranks of South Korea are the military insignia used by the Republic of Korea Armed Forces. Due to the close military cooperation and the presence of the United States Forces Korea, South Korean ranks are inspired by the United States.[1] Current ranks Commissioned officer ranks The rank insignia of commissioned officers. Rank group General/flag officers Field/senior officers Junior officers Rank title 원수元帥Wonsu 대장大將Daejang 중장中將Jungjang 소장少�...