У статистицісередньоквадрати́чна по́хибка, сере́дня квадрати́чна по́хибка (СКП, англ.mean squared error, MSE)[1][2] або середньоквадрати́чне відхи́лення, сере́днє квадрати́чне відхи́лення (СКВ, англ.mean squared deviation, MSD) оцінювача (процедури оцінювання неспостережуваної величини) вимірює усереднення квадратів похибок — тобто, середнє квадратичної різниці між оцінками значень та справжнім значенням. СКП є функцією ризику, яка відповідає математичному сподіванню квадрату похибкових втрат.[на чию думку?][прояснити: ком.] Той факт, що СКП є майже завжди строго додатною (а не нульовою), випливає з випадковості, або з того, що оцінювач не враховує інформації[en], яка могла би давати точнішу оцінку.[3]
СКП є мірою якості оцінювача. Оскільки вона походить від квадрата евклідової відстані, її значення є завжди додатним, і зменшується, коли похибка наближається до нуля.
СКП є другим моментом похибки (відносно оригіналу),[прояснити: ком.] і, таким чином, охоплює як дисперсію оцінювача (наскільки широким є розкид оцінок від одного зразка даних до іншого), так і його зміщення (наскільки віддаленим є усереднене оцінене значення від істинного).[джерело?] Для незміщеного оцінювача СКП є його дисперсією. Як і дисперсія, СКП має ті ж одиниці вимірювання, що й квадрат оцінюваної величини. За аналогією зі стандартним відхиленням, взяття квадратного кореня СКП дає кореневу середньоквадратичну похибку, або кореневе середньоквадратичне відхилення[en] (КСКП або КСКВ, англ.RMSE, RMSD), що має ті ж одиниці вимірювання, що й оцінювана величина. Для незміщеного оцінювача КСКП є квадратним коренем дисперсії, відомим як стандартна похибка.
Визначення та основні властивості
СКП оцінює якість або передбачувача (тобто функції, що відображує довільні входи до вибірки значень деякої випадкової величини), або оцінювача (тобто математичної функції, що відображує вибірку даних до оцінки параметрасукупності, з якої відбираються ці дані). Визначення СКП різниться залежно від того, чи вона описує передбачувач, чи оцінювач.
Передбачувач
Якщо вектор з передбачень породжується з вибірки точок даних на всіх змінних, є вектором спостережуваних значень передбачуваної змінної, а є передбаченими значеннями (наприклад, як із допасовування найменшими квадратами), тоді СКП цього передбачувача в межах цієї вибірки обчислюється як
Іншими словами, СКП є середнім значеннямквадратів похибок. Це є легко обчислюваною величиною для конкретної вибірки (й отже, залежить від вибірки).
СКП також можливо обчислювати на q точках даних, які не використовували для оцінювання моделі, чи то через те, що їх було притримано для цієї мети, чи то через те, що ці дані було отримано щойно. У цьому процесі (відомому як перехресне затверджування) СКП часто називають середньоквадратичною похибкою передбачування[en][джерело?], й обчислюють як
Оцінювач
СКП оцінювача відносно невідомого параметра визначають як[2]
Це визначення залежить від невідомого параметра, але СКП апріорі є властивістю оцінювача. СКП може бути функцією від невідомих параметрів, і в цьому випадку будь-який оцінювач СКП на основі оцінок цих параметрів буде функцією від даних (і відтак випадковою величиною). Якщо оцінювач виводять як статистику вибірки й використовують для оцінювання якогось параметра сукупності, тоді математичне сподівання стосується ви́біркового розподілу цієї статистики вибірки.
СКП можливо записувати як суму дисперсії оцінювача та квадрату його зміщення, що забезпечує корисний спосіб обчислювання СКП й виражає те, що у випадку незміщених оцінювачів СКП та дисперсія дорівнюють одна одній.[4]
Доведення взаємозв'язку з дисперсією та зміщенням
Як альтернативний варіант, маємо
Але у випадку реального моделювання, СКП можливо описувати як суму дисперсії моделі, зміщення моделі, та незвідної невизначеності[джерело?][прояснити: ком.]. Відповідно до цього взаємозв'язку, СКП оцінювачів можливо просто використовувати для порівнювання ефективності[en], що враховує інформацію про дисперсію та зміщення оцінювача. Це називають критерієм СКП (англ.MSE criterion).
В регресійному аналізі природнішим способом перегляду загальної тенденції даних у цілому є побудова графіків. Середнє значення відстані від кожної з точок до передбачуваної регресійної моделі можливо обчислювати й показувати як середньоквадратичну похибку. Піднесення до квадрату має вирішальне значення для подолання складності з від'ємними знаками. Для мінімізування СКП модель може бути точнішою, що означатиме, що модель є ближчою до фактичних даних. Одним із прикладів лінійної регресії з використанням цього методу є метод найменших квадратів, який оцінює адекватність моделі лінійної регресії для моделювання двовимірного набору даних[en],[5] але обмеження якого пов'язане з відомим розподілом цих даних.
Термін середньоквадратична похибка іноді використовують як позначення незміщеної оцінки дисперсії похибок: за́лишкової суми квадратів[en], поділеної на кількість ступенів вільності. Це визначення для відомої, обчислюваної величини відрізняється від наведеного вище визначення для обчислюваної СКП передбачувача використанням іншого знаменника. Цим знаменником є розмір вибірки, зменшений на кількість параметрів моделі, оцінюваних з тих самих даних, (n − p) для pрегресорів, або (n − p − 1), якщо використовують відтин[en] (докладніше див. похибки та залишки у статистиці).[6] Незважаючи на те, що СКП (визначене як у цій статті) не є незміщеним оцінювачем дисперсії похибок, вона є слушним оцінювачем за умови слушності передбачувача.
У регресійнім аналізі «середньоквадратична похибка», яку часто називають середньоквадратичною похибкою передбачування[en] або «позави́бірковою середньоквадратичною похибкою» (англ.out-of-sample mean squared error), може також позначувати середнє значення квадратів відхилень[en] передбачень від істинних значень на позавибірковому випробувальному просторі, породженому моделлю, оціненою за певним ви́бірковим простором. Вона також є відомою, обчислюваною величиною, і вона різниться залежно від вибірки та позавибіркового випробувального простору.
Приклади
Середнє значення
Нехай є випадкова вибірка розміру з генеральної сукупності, . Нехай зразки вибірки було вибрано з вертанням[en]. Тобто, зразків вибирають по одному, і раніше вибрані зразки все одно мають право бути вибраними для всіх витягувань. Звичайним оцінювачем для є ви́біркове середнє[1]
яке має математичне сподівання, що дорівнює істинному середньому (тож воно є незміщеним), і середньоквадратичну похибку
Проте можливо використовувати й інші оцінювачі для , пропорційні , і належний вибір може завжди давати нижчу середньоквадратичну похибку. Якщо ми визначимо
тоді обчислюємо:
Це мінімізується, коли
Для гауссового розподілу, де , це означає, що СКП зводиться до мінімуму при діленні суми на . Мінімальний коефіцієнт ексцесу становить ,[a] що досягається розподілом Бернуллі з p = 1/2 (підкидання монети), й СКП зводиться до мінімуму при Отже, незалежно від коефіцієнту ексцесу, ми отримуємо «кращу» оцінку (в сенсі нижчої СКП), трохи зменшивши незміщений оцінювач. Це є простим прикладом стискального оцінювача[en]: оцінювач «стискають» у бік нуля (зменшують незміщений оцінювач).
Далі, хоч виправлена дисперсія вибірки і є найкращим незміщеним оцінювачем[en] (мінімальна середньоквадратична похибка серед незміщених оцінювачів) дисперсії для гауссових розподілів, якщо розподіл не є гауссовим, то навіть серед незміщених оцінювачів найкращим незміщеним оцінювачем дисперсії бути не може.
Гауссів розподіл
В наступній таблиці наведено декілька оцінювачів істинних параметрів сукупності, μ та σ2, для гауссового випадку.[8]
Нульова СКП, що означає, що оцінювач передбачує спостереження параметру з бездоганною точністю, є ідеальною (але зазвичай неможливою).
Значення СКП можна використовувати з метою порівнювання. Дві або більше статистичних моделей можна порівнювати, використовуючи їхні СКП — як міру того, наскільки добре вони пояснюють заданий набір спостережень: незміщений оцінювач (оцінений зі статистичної моделі) з найменшою дисперсією серед усіх незміщених оцінювачів є найкращим незміщеним оцінювачем[en], або англ.MVUE (Minimum Variance Unbiased Estimator).
Як методика лінійної регресії, так і методика дисперсійного аналізу оцінюють СКП як частину аналізу й використовують оцінену СКП, щоби визначати статистичну значущість досліджуваних чинників або предикторів. Метою планування експериментів є побудова експериментів таким чином, щоби при аналізі спостережень СКП була близькою до нуля відносно величини щонайменше одного з оцінюваних впливів експерименту.
В однофакторнім дисперсійнім аналізі СКП можливо обчислювати шляхом ділення суми квадратів похибок на ступінь вільності. Також, F-значення є відношенням середньоквадратичного впливу до СКП.
СКП також використовують у декількох методиках покрокової регресії[en] як частину визначання того, скільки предикторів з набору кандидатів включити до моделі для заданого набору спостережень.
Застосування
Ця стаття має вигляд переліку, який краще подати прозою. Ви можете допомогти викласти список прозою, де це доречно. Ознайомтеся з довідкою з редагування.(липень 2021)
У статистичному моделюванні СКП може подавати різницю між фактичними спостереженнями та значеннями спостережень, передбаченими моделлю. У цьому контексті її використовують для того, щоб визначати, наскільки модель допасовано до даних, а також чи можливо вилучити деякі пояснювальні змінні без значної шкоди для передбачувальної здатності моделі.
Втрати квадрату похибки є однією з найширше використовуваних функцій втрат у статистиці[джерело?], хоча її широке використання більше випливає з математичної зручності, ніж з міркувань фактичних втрат у застосуваннях. Карл Фрідріх Гаусс, який запровадив використання середньоквадратичної похибки, усвідомлював її довільність і погоджувався з запереченнями проти неї на цих підставах.[3] Математичні переваги середньоквадратичної похибки особливо очевидні при її використанні для аналізу продуктивності лінійної регресії, оскільки це дозволяє розділити дисперсію в наборі даних на дисперсію, що пояснюється моделлю, та дисперсію, що пояснюється випадковістю.
Критика
Беззаперечне використання середньоквадратичної похибки критикував фахівець із теорії рішеньДжеймс Бергер[en]. Середньоквадратична похибка — це мінус математичного сподівання однієї конкретної функції корисності, квадратичної, яка може не бути слушною функцією корисності для використання за заданої сукупності обставин. Проте існують деякі сценарії, за яких середньоквадратична похибка може слугувати добрим наближенням функції втрат, що зустрічається у застосуванні природним чином.[9]
Як і дисперсія, середньоквадратична похибка має недолік надавання великої ваги викидам.[10] Це є результатом піднесенням до квадрату кожного члену, через яке більші похибки заважують сильніше за менші. Ця властивість, небажана у багатьох застосуваннях, змусила дослідників використовувати такі альтернативи як середня абсолютна похибка[en], або такі, що ґрунтуються на медіані.
↑Це можливо довести за допомогою нерівності Єнсена наступним чином. Четвертий центральний момент є верхньою межею для квадрату дисперсії, тож найменшим значенням для їхнього відношення є одиниця, відтак, найменшим значенням для коефіцієнта ексцесу є −2, отримуваним, наприклад, Бернуллі з p = 1/2.
↑Steel, R.G.D, and Torrie, J. H., Principles and Procedures of Statistics with Special Reference to the Biological Sciences., McGraw Hill[en], 1960, page 288. (англ.)
Florent GrobergGroberg pada 2015JulukanFloLahir08 Mei 1983 (umur 40)Poissy, PrancisPengabdian Amerika SerikatDinas/cabang Angkatan Darat Amerika SerikatLama dinas2008–2015Pangkat KaptenKesatuanTask Force Mountain Warrior, 4th Infantry Brigade Combat Team, 4th Infantry DivisionPerang/pertempuranOperasi Enduring Freedom Perang Afganistan PenghargaanMedal of HonorBronze Star (2)Purple Heart Florent Groberg (lahir 8 Mei 1983) adalah seorang purnawirawan militer Prancis-Ameri...
كأس السوبر الأوروبي 2019استضاف ملعب فودافون بارك في إسطنبول النهائي. ليفربول تشيلسي 2 2 بعد الوقت الإضافيليفربول فاز 5–4 بركلات الجزاءالتاريخ14 أغسطس 2019 (2019-08-14)الملعبفودافون بارك، إسطنبولرجل المباراةساديو ماني (ليفربول)[1]الحكمستيفاني فرابارت (فرنسا)الحضور38434 ...
Artikel ini perlu diwikifikasi agar memenuhi standar kualitas Wikipedia. Anda dapat memberikan bantuan berupa penambahan pranala dalam, atau dengan merapikan tata letak dari artikel ini. Untuk keterangan lebih lanjut, klik [tampil] di bagian kanan. Mengganti markah HTML dengan markah wiki bila dimungkinkan. Tambahkan pranala wiki. Bila dirasa perlu, buatlah pautan ke artikel wiki lainnya dengan cara menambahkan [[ dan ]] pada kata yang bersangkutan (lihat WP:LINK untuk keterangan lebih lanjut...
Country at the crossroads of Central and Southern Africa This article is about the Southern African nation. For the 18th-century BC king of Isin, see Zambiya. For the part of Kaliningrad Oblast, see Sambia Peninsula. For the West African state, see The Gambia. Not to be confused with Jambi. Republic of Zambia Flag Coat of arms Motto: One Zambia, One NationAnthem: Stand and Sing of Zambia, Proud and FreeCapitaland largest cityLusaka15°25′S 28°17′E / 15.417°S 28...
FIFA Ballon d'Or 2013Pemenang FIFA Ballon d'Or 2013 Cristiano RonaldoTanggal13 Januari 2014 (2014-01-13)LokasiZürich, SwissNegaraSwissDipersembahkan olehFIFAIkhtisarDimenangkan oleh Cristiano Ronaldo (gelar ke-2 Ballon d'Or)Situs webwww.francefootball.fr← 2012 FIFA Ballon d'Or2014 → FIFA Ballon d'Or Gala 2013 merupakan tahun keempat penghargaan untuk pemain terbaik sepak bola FIFA dan pelatih sepanjang tahun. Penghargaan ini diadakan pada 13 Januari 2014 di Zürich.[1 ...
Questa voce sugli argomenti musei della Sardegna e Alghero è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Museo naturalisticoMare Nostrum Acquarium UbicazioneStato Italia LocalitàAlghero Indirizzovia XX Settembre 1 Coordinate40°33′24.12″N 8°18′57.85″E / 40.5567°N 8.31607°E40.5567; 8.31607Coordinate: 40°33′24.12″N 8°18′57.85″E / 40.5567°N 8.31607°E40.5567; 8.31607 CaratteristicheTipoMuseo v...
المئذنة والجامع نغار إحداثيات 29°51′37″N 56°47′43″E / 29.860277777778°N 56.795138888889°E / 29.860277777778; 56.795138888889 معلومات عامة الموقع نغار القرية أو المدينة نغار الدولة إيران أبعاد المبنى التفاصيل التقنية المواد المستخدمة طابوق، وملاط التصميم والإنشاء النمط المعم�...
Questa voce sugli argomenti Stati scomparsi e Libano è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento. Grande Libano (dettagli) Dati amministrativiNome completoStato del Grande Libano Nome ufficialeÉtat du Grand Liban Lingue ufficialifrancese, arabo CapitaleBeirut Dipendente da Francia PoliticaForma di Statomandato della SDN sotto tutela della Francia capo di statopresidenti del Libano Nascita1926 Causa...
Follonica AirfieldPart of Twelfth Air ForceCoordinates42°55′08.76″N 10°45′42.76″E / 42.9191000°N 10.7618778°E / 42.9191000; 10.7618778 (Approximate)TypeMilitary airfieldSite informationControlled byUnited States Army Air ForcesSite historyBuilt1944In use1944 Follonica Airfieldclass=notpageimage| Location of Follonica Airfield, Sicily Follonica Airfield is an abandoned World War II military airfield in Italy, located in the vicinity of Follonica in...
Complex irrigation system from the Sassanid era, island city Shushtar, Iran You can help expand this article with text translated from the corresponding article in Persian. (January 2021) Click [show] for important translation instructions. View a machine-translated version of the Persian article. Machine translation, like DeepL or Google Translate, is a useful starting point for translations, but translators must revise errors as necessary and confirm that the translation is accurate, r...
See also: Foreign policy of the Barack Obama administration This article needs to be updated. Please help update this article to reflect recent events or newly available information. (March 2021) This article is part of a series aboutBarack Obama Pre-presidency Early life and career Illinois State Senator 2004 DNC keynote address U.S. Senator from Illinois 2004 election sponsored bills 44th President of the United States Presidency timeline Transition Inaugurations Trips international Policie...
1933 play by Cao Yu Thunderstorm (Chinese: 雷雨; pinyin: Léiyǔ; Wade–Giles: Lei-yü) is a play written in 1933 by the Chinese dramatist Cao Yu. It is one of the most popular Chinese dramatic works of the period prior to the Japanese invasion of China in 1937. History The drama Thunderstorm was first published in the literary magazine, Literary Quarterly. Shortly after its publication, a production of the play was mounted in Jinan, and later, in 1935, in Shanghai and in Tokyo...
Abundance of financial assets or possessions Several terms redirect here. For other uses, see Wealth (disambiguation), Wealthy (disambiguation), Affluence (disambiguation), and Affluent (disambiguation). Total wealth per capita, in 2014[1][failed verification][dead link] Wealth is the abundance of valuable financial assets or physical possessions which can be converted into a form that can be used for transactions. This includes the core meaning as ...
Argentine footballer and manager Carlos Leeb Leeb in 2013Personal informationFull name Carlos Fabián LeebDate of birth (1968-07-18) 18 July 1968 (age 55)Place of birth Buenos Aires, ArgentinaPosition(s) ForwardSenior career*Years Team Apps (Gls)1987–1991 Independiente 13 (2)1991 Estudiantes 5 (0)1992–1997 Chacarita Juniors 126 (64)1997–2002 Banfield 128 (52)2002 Ferro Carril Oeste 3 (0)Managerial career2005–2006 Banfield2007–2009 Guaraní2009–2010 Universitario de Sucre2010�...
The topic of this article may not meet Wikipedia's notability guideline for music. Please help to demonstrate the notability of the topic by citing reliable secondary sources that are independent of the topic and provide significant coverage of it beyond a mere trivial mention. If notability cannot be shown, the article is likely to be merged, redirected, or deleted.Find sources: At the Point – news · newspapers · books · scholar · JSTOR (May 2024) (Le...
العلاقات السويدية السورية السويد سوريا السويد سوريا تعديل مصدري - تعديل العلاقات السويدية السورية هي العلاقات الثنائية التي تجمع بين السويد وسوريا.[1][2][3][4][5] مقارنة بين البلدين هذه مقارنة عامة ومرجعية للدولتين: وجه المقارنة السويد سو...
Systems of grouping meteorites based on shared characteristics In meteoritics, a meteorite classification system attempts to group similar meteorites and allows scientists to communicate with a standardized terminology when discussing them. Meteorites are classified according to a variety of characteristics, especially mineralogical, petrological, chemical, and isotopic properties. Meteorites Terminology There is no single, standardized terminology used in meteorite classification; however, c...
Kemp Powers nel 2023 Kemp Powers (New York, 30 ottobre 1973) è un drammaturgo, sceneggiatore e regista statunitense. Indice 1 Carriera 2 Filmografia 2.1 Sceneggiatore 2.1.1 Cinema 2.1.2 Televisione 2.1.3 Cortometraggi 2.2 Regista 2.3 Produttore 2.4 Attore 3 Teatrografia 3.1 Drammaturgo 4 Riconoscimenti 5 Note 6 Altri progetti 7 Collegamenti esterni Carriera Dopo aver esordito col cortometraggio This Day Today (2012), nel 2013 Kemp Powers ha scritto il dramma One Night in Miami, osannato dall...
Paula van der OestLahir1965 (umur 58–59)Laag-Soeren, Gelderland, BelandaPekerjaanSutradara, penulis latarTahun aktif1988-sekarang Penghargaan(2012) Golden Calf for Best Director (en) (1994) Golden Calf for Best Television Drama (en) Paula van der Oest (kelahiran 1965 di Laag-Soeren, Gelderland) adalah seorang penulis latar dan sutradara Belanda. Filmnya Zus & Zo (2001) dinominasikan pada Academy Award untuk Film Berbahasa Asing Terbaik. Filmografi 1988 - Zinderend 1994 - ...
Dewan Perwakilan Rakyat Daerah Kabupaten Tulang BawangDewan Perwakilan RakyatKabupaten Tulang Bawang2019-2024JenisJenisUnikameral SejarahSesi baru dimulai19 Agustus 2019PimpinanKetuaSopi'i Azhari, S.H., M.H. (PDI-P) sejak 24 Oktober 2019 Wakil Ketua IAliasan (Gerindra) sejak 24 Oktober 2019 Wakil Ketua IIMursidah, S.E. (PAN) sejak 24 Oktober 2019 KomposisiAnggota40Partai & kursi PDI-P (10) NasDem (1) PKB (2) Demokrat (3) ...