Функције губитака за класификацију

Бајесове конзистентне функције губитка: губитак нула-један (сива), губитак дивљака (зелена), логистички губитак (наранџаста), експоненцијални губитак (љубичаста), губитак тангента (браон), губитак квадрата (плава)

У машинском учењу и математичкој оптимизацији, функције губитка за класификацију су рачунски изводљиве функције губитка које представљају цену плаћену за нетачност предвиђања у проблемима класификације (проблеми идентификације којој категорији припада одређено запажање). Дато као простор свих могућих улаза (обично ), и као скуп ознака (могућих излаза), типичан циљ класификационих алгоритама је проналажење функције који најбоље предвиђа ознаку за дати улаз . Међутим, због непотпуних информација, шума у мерењу или вероватноћа компоненти у основном процесу, могуће је да исти генерише различите . Као резултат, циљ проблема учења је да се минимизира очекивани губитак (такође познат као ризик), дефинисан као

где је дата функција губитка, и је функција густине вероватноће процеса који је генерисао податке, што је еквивалентно:

У оквиру класификације, неколико често коришћених функција губитка је написано искључиво у смислу производа праве лабеле и предвиђене лабеле . Стога се могу дефинисати као функције само једне променљиве , тако да са прикладно одабраном функцијом . Оне се називају функције губитка засноване на маржи . Одабир функције губитка засноване на маржи представља избор . Избор функције губитка унутар овог оквира утиче на оптималну што минимизира очекивани ризик.

У случају бинарне класификације, могуће је поједноставити израчунавање очекиваног ризика из горе наведеног интеграла. Односно:

Друга једнакост произилази из горе описаних својстава. Трећа једнакост произилази из чињенице да су 1 и −1 једине могуће вредности за , а четврта јер је . Термин у заградама је познат као условни ризик.

Може се решити за минимизатор од узимањем функционалног извода последње једнакости у односу на и изједначавањем извода са 0. Ово ће резултирати следећом једначином:

што је еквивалентно постављању извода условног ризика једнаком нули.

С обзиром на бинарну природу класификације, природна селекција за функцију губитка (под претпоставком да је једнака цена за лажне позитивне и лажно негативне ) била би функција губитка 0-1 ( функција индикатора 0–1), која узима вредност 0 ако је предвиђено класификација једнака оној праве класе или 1 ако се предвиђена класификација не поклапа са правом класом. Овај избор је моделован по следећој једнокости:

где означава функцију Хевисајдовог корака. Међутим, ова функција губитка није конвексна и није глатка, а решавање оптималног решења је НП-тежак комбинаторни оптимизациони проблем. Као резултат тога, боље је заменити сурогате функције губитка који су погодни за уобичајено коришћене код алгоритама учења, јер имају погодна својства као што је конвексност и глаткос. Поред њихове рачунске поправљивости, може се показати да решења проблема учења помоћу ових сурогата губитака омогућавају опоравак стварног решења оригиналног проблема класификације. Неки од ових сурогата су описани у наставку.

У пракси, расподела вероватноће је непозната. Сходно томе, користити тренинг сет за обуку независно и идентично распоређених тачки узорка

извучен из простора елемантарних узорака података, настоји се минимизирати емпиријски ризик

као замена за очекивани ризик.

Бајесова конзистенција

Користећи Бајесову теорему, може се показати да је оптимална , тј. она који минимизује очекивани ризик повезан са губитком нула-један, имплементира Бајесово правило оптималне одлуке за проблем бинарне класификације и у облику је:

.

За функцију губитка се каже да је калибрисана класификацијом или Бајесова конзистентна ако је оптимална је такава да и стога је оптималана према Бајесовом правилу одлучивања. Бајесова конзистентна функција губитка омогућава нам да пронађемо Бајесову оптималну функцију одлучивања директним минимизовањем очекиваног ризика и без потребе за експлицитним моделирањем функција густине вероватноће.

За губитак конвексне маргине , може се показати да је Бајес конзистентан ако и само ако је диференцибилан на 0 и . Ипак, овај резултат не искључује постојање неконвексних Бајесових конзистентних функција губитка. Општији резултат каже да се Бајесове конзистентне функције губитка могу генерисати коришћењем следеће формулације:

,

где је било која инверзибилна функција таква да је и било која диференцибилна стриктно конкавна функција таква да је . Табела-И приказује генерисане Бајесове конзистентне функције губитка за неке примере избора и . Имајте на уму да нису сви губитци конвексни. Показало се да су такве неконвексне функције губитка корисне у раду са одступницима у класификацији. За све функције губитка генерисане из (2), постериорна вероватноћа може се наћи помоћу функције инверзне везе као . Такве функције губитка где се задња вероватноћа може повратити коришћењем инверзибилне везе називају се функције правилног губитка .

Табела-И
Име губитка
Експоненцијално
Логистиц
Квадрат
Севиџ
Тангента


Једини минимизатор очекиваног ризика, , повезан са горе генерисаним функцијама губитака може се директно наћи из једначине (1) и показати да је једнака одговарајућој . Ово важи чак и за неконвексне функције губитка, што значи да се алгоритми засновани на градијенту спуштања, као што је повећање градијента, који се може користити за конструисање минимизатора.

Исправне функције губитка, маргина губитка и регуларизација

(Црвени) стандардни логистички губитак ( ) и (Плава) повећана маржа Логистички губитак ( ).

За валидне функције губитка, маргина губитка се може дефинисати као а показало се да је директно повезана са својствима регуларизације класификатора. Конкретно, функција губитка веће маргине повећава регуларизацију и даје боље процене постериорне вероватноће. На пример, маржа губитка се може повећати за логистички губитак увођењем а параметар и писање логистичког губитка као где мањи повећава маргину губитка. Показано је да је ово директно еквивалентно смањењу стопе учења у подизању градијента где смањење побољшава регуларизацију појачаног класификатора. Теорија јасно показује да када стопа учења од се користи, исправна формула за добијање постериорне вероватноће је сада .

Закључујемо, избором функције губитка са већом маргином (мањом ) повећавамо регуларизацију и побољшавамо наше процене постериорне вероватноће што заузврат побољшава ROC(површину конвергенције) криву коначног класификатора.

Квадратни губитак

Иако је чешће коришћена у регресији, функција квадратног губитка може се поново написати као функција и користи се за класификацију. Може се генерисати коришћењем израза (2) и табеле-И на следећи начин:

Функција квадратног губитка је и конвексна и глатка. Међутим, функција квадратног губитка има тенденцију да прекомерно кажњава граничне вредности, што доводи до спорије конвергенције (у односу на сложеност узорка) него за функције логистичког губитка или губитка зглоба. Поред тога, функције које дају високе вредности за за неке ће имати лошије перформансе са функцијом квадратног губитка, пошто ће високе вредности од бити строго кажњене, без обзира на то да ли се знаци од и поклапају.

Предност функције квадратног губитка је у томе што њена структура омогућава лаку унакрсну валидацију параметара регуларизације. Конкретно за Тихоновљеву регуларизацију, параметар регуларизације се може решити коришћењем унакрсне валидације за исто време које би било потребно за решавање једног проблема.

Минимизација за за функцију квадратног губитка може се директно наћи из једначине (1) као:

Логистички губитак

Функција логистичких губитака може се генерисати коришћењем (2) и табеле-И као:

Логистички губитак је конвексан и расте линеарно за негативне вредности што га чини мање осетљивим на одступања. Логистички губитак се користи у ЛогитБоост алгоритму .

Минимизатор за за функцију логистичког губитка може се директно наћи из једначине (1) као

Ова функција је недефинисана када или (тежући ка ∞ и −∞ респективно), али предвиђа глатку криву која расте када расте и једнака је 0 када .

Лако је проверити да ли су логистички губитак и бинарни губитак ентропије у ствари исти (до мултипликативне константе ). Губитак унакрсне ентропије је уско повезан са Кулбек-Лајблеровом дивергенцијом између емпиријске расподеле и предвиђене расподеле. Губитак унакрсне ентропије је свеприсутан у савременим дубоким неуронским мрежама .

Експоненцијални губитак

Функција експоненцијалног губитка може се генерисати коришћењем (2) и табеле-И као:

Експоненцијални губитак је конвексан и расте експоненцијално за негативне вредности што га чини осетљивијим на одступања. Експоненцијални губитак се користи у АдаБуст алгоритму .

Минимизатор за за експоненцијалну функцију губитка може се директно наћи из једначине (1) као:

Севиџ(дивљи) губитак

Савиџ губитак се може генерисати коришћењем (2) и табеле-И на следећи начин:

Савиџ губитак је квази-конвексан и ограничен је за велике негативне вредности што га чини мање осетљивим на спољне вредности. Севиџ губитак је коришћен у појачавању градијента и алгоритму СавиџБуст.

Минимизатор за за Севиџ функцију губитка може се директно наћи из једначине (1) као:

Губитак тангенте

Губитак тангенте може се генерисати коришћењем (2) и табеле-И на следећи начин:

Губитак тангенте је квази-конвексан и ограничен је за велике негативне вредности што га чини мање осетљивим на одступања. Занимљиво је да губитак тангенте такође додељује ограничену казну тачкама података које су класификоване „превише исправне (оверфит)“. Ово може помоћи у спречавању претеране обуке на скупу података. Губитак тангенте је коришћен у појачавању градијента, алгоритму ТангентБуст и шумама наизменичних одлука.

Минимизатор за за тангентну функцију губитка може се директно наћи из једначине (1) као:

Губитак зглоба

Функција губитка зглоба је дефинисана као , где је функција позитивног дела .

Губитак зглоба обезбеђује релативно чврсту, конвексну горњу границу на функцији индикатора 0–1. Конкретно, губитак зглоба је једнак функцији индикатора 0–1 када и . Поред тога, емпиријска минимизација ризика од овог губитка је еквивалентна класичној формулацији за машине подржане векторима (SVMs). Тачно класификоване тачке које леже изван маргиналних граница вектора подршке се не кажњавају, док се тачке унутар граница маргине или на погрешној страни хиперравне кажњавају на линеарни начин у поређењу са њиховом удаљености од исправне границе.

Док је функција губитка зглоба и конвексна и континуирана, није глатка (не може се разликовати) на . Сходно томе, функција губитка зглоба се не може користити са методама градијентног спуста или методама стохастичког градијента које се ослањају на диференцијабилност у целом домену. Међутим, губитак зглоба има субградијент на , што омогућава коришћење субградијентних метода спуштања . SVM-ови који користе функцију губитка зглоба такође се могу решити коришћењем квадратног програмирања .

Минимизатор од за функцију губитка зглоба је

када , што одговара функцији индикатора 0–1. Овај закључак чини губитак зглоба прилично атрактивним, јер се могу поставити границе између очекиваног ризика и знака функције губитка зглоба. Губитак зглоба се не може извести из (2) јер није инверзибилан.

Генерализовани глатки губитак зглоба

Генерализована глатка функција губитка зглоба са параметром се дефинише као:

где је

Она се монотоно повећава и достиже 0 када .

Read other articles:

غلاف لكتاب كتب عليه الشعر الشعر العربي في العصر الأموي يعد العصر الأموي واحدًا من أكثر عصور الأدب ازدهارًا في نتاجِه الشعري، فقد بلغ الأدب العربي أوجها في هذا العصر، واحتضنته بيئات جديدة غير بيئة الجزيرة العربية، مما جعل هذا الأدب يتلون بألوان هذه البيئات ويتأثر بها، فقد �...

Wappen Deutschlandkarte 52.5947222222228.836111111111140Koordinaten: 52° 36′ N, 8° 50′ O Basisdaten Bundesland: Niedersachsen Landkreis: Diepholz Samtgemeinde: Kirchdorf Höhe: 40 m ü. NHN Fläche: 47,8 km2 Einwohner: 2343 (31. Dez. 2022)[1] Bevölkerungsdichte: 49 Einwohner je km2 Postleitzahl: 27245 Vorwahl: 04273 Kfz-Kennzeichen: DH, SY Gemeindeschlüssel: 03 2 51 021 LOCODE: DE KFS Gemeindegliederung: 15 O...

Les deux rhapsodies pour violon et orchestre sont des œuvres de Béla Bartók, écrites les deux en 1928. La seconde est en outre révisée en 1944. L'œuvre concertante pour violon et orchestre de Bartók comprend, outre ces deux pièces, deux concertos pour violon. Ces rhapsodies sont écrites chronologiquement entre son premier et son second concerto pour piano. Elles sont composées initialement pour violon et piano et sont orchestrées par la suite. Elles reprennent la forme de la csard...

Pour les articles homonymes, voir Tokaïev. Kassym-Jomart TokaïevҚасым-Жомарт Тоқаев Kassym-Jomart Tokaïev en 2016. Fonctions Chef du Conseil de sécurité du Kazakhstan En fonction depuis le 5 janvier 2022(1 an, 10 mois et 29 jours) Prédécesseur Noursoultan Nazarbaïev Président de l'Assemblée du peuple En fonction depuis le 28 avril 2021(2 ans, 7 mois et 6 jours) Prédécesseur Noursoultan Nazarbaïev Président de la république du Kazak...

Animated short film from Skydance Animation BlushOfficial posterDirected byJoe MateoWritten byJoe MateoProduced byHeather Schmidt Feng YanuEdited byTim MertensMusic byJoy NgiawProductioncompaniesApple StudiosSkydance AnimationDistributed byApple TV+Release date October 1, 2021 (2021-10-01) Running time10 minsCountriesUnited StatesSpainLanguageEnglish Blush is a 2021 computer-animated science fiction short film inspired by a true story from writer and director Joe Mateo, produce...

Sawo duren Chrysophyllum cainito Status konservasiRisiko rendahIUCN197735752 TaksonomiDivisiTracheophytaSubdivisiSpermatophytesKladAngiospermaeKladmesangiospermsKladeudicotsKladcore eudicotsKladasteridsOrdoEricalesFamiliSapotaceaeGenusChrysophyllumSpesiesChrysophyllum cainito Linnaeus, 1753 lbs Beberapa kultivar sawo duren dari Lumajang, Jawa Timur Sawo duren, sawo hijau, atau kenitu adalah nama sejenis buah dari suku sawo-sawoan (Sapotaceae). Buah ini juga dikenal dengan nama sawo apel, sawo...

Selección de voleibol de Brasil Datos generalesPaís BrasilFederación CBVConfederación CSVSeleccionador Renan Dal ZottoCapitán Bruno RezendeRanking FIVB Campeonato MundialParticipaciones 17 (primera vez en 1956)Mejor resultado en 2002, 2006 y 2010Liga MundialParticipaciones 28 (primera vez en 1990)Mejor resultado en 1993, 2001, 2003, 2004, 2005, 2006, 2007, 2009 y 2010Campeonato Sudamericano de VoleibolParticipaciones 33 (primera vez en 1951)Mejor resultado en 1951, 1956, 1958, 1961, 1962...

2021 American comedy-drama anthology television series This article is about the TV series. For the religious and political movement, see White Lotus. The White LotusTitle card for the first seasonGenre Comedy drama[1] Satire[2] Black comedy[3] Anthology Created byMike WhiteWritten byMike WhiteDirected byMike WhiteStarringsee belowMusic by Cristobal Tapia de Veer Kim Neundorf Country of originUnited StatesOriginal languageEnglishNo. of seasons2No. of episodes13Producti...

Cemetery in Michigan This article does not cite any sources. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Glen Eden Lutheran Memorial Park – news · newspapers · books · scholar · JSTOR (March 2022) (Learn how and when to remove this template message) Glen Eden Lutheran Memorial ParkDetailsEstablished1929 (1929)LocationLivonia, Michigan Glen Eden Lutheran Me...

أنغورود تقسيم إداري البلد إيران  إحداثيات 32°44′00″N 52°42′05″E / 32.7333°N 52.7014°E / 32.7333; 52.7014  تعديل مصدري - تعديل   أنغورود هي قرية في مقاطعة أصفهان، إيران. في تعداد عام 2006، لوحظ وجودها، ولكن لم يتم الإبلاغ عن سكانها.[1] مراجع ^ تعداد سكان جمهورية إيران الإسلام�...

Israel's foreign ministry Ministry of Foreign AffairsIsraelמשרד החוץوزارة الخارجية الإسرائيليةSeal of the MFAAgency overviewFormed1948JurisdictionGovernment of IsraelHeadquartersForeign Ministry Building, Givat Ram, Jerusalem31°46′57″N 35°12′04″E / 31.78250°N 35.20111°E / 31.78250; 35.20111Annual budget1.59 billion New Shekel[1]Minister responsibleEli CohenWebsitewww.mfa.gov.il The Israeli Ministry of Foreign Affairs ...

2009 studio album by Mike Stern Big NeighborhoodStudio album by Mike SternReleasedAugust 11, 2009 (2009-08-11)StudioNew York City, Los Angeles; Austin, TexasGenreJazz, jazz fusionLength68:49LabelHeads Up InternationalProducerJim BeardMike Stern chronology Who Let the Cats Out?(2006) Big Neighborhood(2009) All Over the Place(2012) Big Neighborhood is the fourteenth solo studio album by jazz guitarist Mike Stern. The 2009 release was produced by Jim Beard and released by Head...

RTV YogyakartaPT Jogja Citra Nuansa Nusantara Televisi[2]Sleman, Daerah Istimewa Yogyakarta[1]IndonesiaSaluranDigital: 32 UHFSloganMakin CakepPemrogramanAfiliasiRTVKepemilikanPemilikRajawali CorporaRiwayatDidirikan2003Siaran perdana2007 (siaran percobaan)20 Juli 2013 (siaran resmi)Bekas tanda panggilNusa TVBekas nomor kanal44 UHF (analog)52 UHF (analog)56 UHF (analog)55 UHF (analog)29 UHF (digital)25 UHF (digital)Informasi teknisOtoritas perizinanKementerian Komunikasi dan Inf...

Wife of Vasishtha in Hinduism For other uses, see Arundhati. ArundhatiVasishtha and Arundhati performing a Yajna, with Kamadhenu, in their Ashram. Art from the back cover of the Hindi epic Arundhati (1994).PersonalReligionHinduismSpouseVasishthaChildrenŚakti Maharṣi, Citraketu, Surocis, Virajas, Mitra, Ulbana, Vasubhrdyana and Dyumat Arundhati (Sanskrit: अरुन्धती, romanized: Arundhatī) is the wife of the sage Vasishtha, one of the seven sages (Saptarshi) of Hinduism.&...

2019 Brazilian romance film directed by Bruno Garotti Cinderela PopTheatrical release posterDirected byBruno GarottiScreenplay by Marcelo Saback Bruno Garotti Flávia Lins Based onCinderela Popby Paula PimentaProduced by Rodrigo Montenegro Mara Lobão Rodrigo Guimarães Starring Maisa Fernanda Paes Leme Filipe Bragança CinematographyDante BellutiEdited byDiana VasconcellosProductioncompanyPanorâmicaDistributed byGaleria DistribuidoraRelease date 28 February 2019 (2019-02-28)&...

US & Samoa international rugby league footballer Joseph 'Sefa' PauloPersonal informationFull nameJoseph PauloBorn (1988-01-02) 2 January 1988 (age 35)Auckland, New ZealandHeight6 ft 2 in (1.88 m)Weight16 st 10 lb (106 kg)Playing informationPositionLock, Second-row, Five-eighth Club Years Team Pld T G FG P 2008–11 Penrith Panthers 30 4 0 0 16 2011–15 Parramatta Eels 86 2 9 0 26 2016–18 Cronulla Sharks 51 1 0 0 4 2019–20 St Helens 37 1...

誕生吧!家族떴다! 패밀리开创金凡《奶奶回來了》编剧金信惠导演朱東民主演 李貞賢、真理翰、吳尚津、朴元淑制作国家/地区 韩国语言韓語集数20每集长度約70分鐘制作制作人洪成昌制作公司A Story播出信息 首播频道SBS播出国家/地区 韩国播出日期 2015年1月3日 (2015-01-03)—2015年3月15日 (2015-03-15) 外部链接官方网站 《誕生吧!家族》(韓語:떴다! 패밀리,�...

National highway in India National Highway 752KMap of National Highway 752K in redRoute informationAuxiliary route of NH 52Length254 km (158 mi)Major junctionsNorth endJinturSouth endBhalki LocationCountryIndiaStatesMaharashtra, Karnataka Highway system Roads in India Expressways National State Asian ← NH 752I→ NH 50 National Highway 752K, commonly referred to as NH 752K is a national highway in India.[1][2] It is a spur road of National Highway 52...

The ArtchiveFoundedLate 1990sFounder(s)Mark HardenURLwww.artchive.com Image of Bride of the Wind, a 1913 painting by Oskar Kokoschka, from the Artchive. The Artchive is a virtual art gallery website. It was established in the late 1990s by Mark Harden. He contributed to WebMuseum from 1995 before establishing the Artchive. A biography of the founder called it a top art resource.[1] A user on Pinterest called it such a valuable website.[2] However, the contact email does not cu...

Lac de Joux dr Lac de Joux vo Südweschte Geographischi Lag Kanton Waadt Zueflüss Orbe Abflüss (Orbe) Ort am Ufer Le Chenit, L’Abbaye Date Koordinaten 511626 / 16582246.6377777777786.28444444444441004Koordinate: 46° 38′ 16″ N, 6° 17′ 4″ O; CH1903: 511626 / 165822 Lac de Joux (Schweiz)Lac de Joux Höchi über em Meeresspiegel 1'004 m ü. M. Flechi 8,77 km² Maximali Diefi 32 m Bsundrigs unter...