Теорія статистичного навчання

Тео́рія статисти́чного навча́ння (англ. statistical learning theory) — це система машинного навчання, що тягнеться з галузей статистики та функціонального аналізу.[1][2] Теорія статистичного навчання займається задачею знаходження передбачувальної функції на основі даних. Теорія статистичного навчання привела до успішних застосунків у таких областях як комп'ютерний зір, розпізнавання мовлення, біоінформатика та бейсбол.[3]

Введення

Цілями навчання є передбачення та розуміння. Навчання поділяється на багато категорій, включно з керованим, некерованим, інтерактивним навчанням, та навчанням з підкріпленням. З точки зору теорії статистичного навчання найзрозумілішим є кероване навчання.[4] Кероване навчання включає навчання з тренувального набору даних. Кожна точка тренувального набору є парою входу-виходу, де вхід відображується на вихід. Задача навчання полягає у виведенні такої функції відображення між входом та виходом, яку можна застосовувати для передбачення виходу з майбутнього входу.

В залежності від типу виходу, задачі керованого навчання є задачами або регресії, або класифікації. Якщо вихід набуває неперервного діапазону значень, це є задачею регресії. Якщо взяти за приклад закон Ома, регресію може бути виконувано з напругою як вхід та струмом як вихід. Регресія встановить, що функційним взаємозв'язком між напругою та струмом є така , що

Задачі класифікації — це такі, для яких вихід буде елементом із дискретної множини міток. Серед застосувань машинного навчання класифікація є дуже поширеною. Наприклад, у розпізнаванні облич зображення обличчя особи буде входом, а вихідною міткою буде ім'я особи. Вхід представлятиметься великим багатовимірним вектором, чиї елементи представлятимуть пікселі цього зображення.

Після навчання функції на основі тренувального набору даних цю функцію перевіряють на перевірному наборі даних: даних, яких не було в тренувальному наборі.

Формальний опис

Нехай буде векторним простором усіх можливих входів, а  — векторним простором усіх можливих виходів. Теорія статистичного навчання розглядає можливість існування якогось невідомого розподілу ймовірності над простором добутку , тобто, що існує якийсь невідомий . Тренувальний набір робиться з зразків із цього розподілу ймовірності, й записується як

Кожен є вхідним вектором з тренувальних даних, а є виходом, що йому відповідає.

За такого формулювання задача виведення складається з пошуку такої функції , що . Нехай буде простором функцій , що називається простором гіпотез. Простір гіпотез є простором функцій, пошук яким здійснюватиме алгоритм. Нехай буде функціоналом втрат, метрикою різниці між передбаченим значенням та справжнім значенням . Очікуваний ризик визначається як

Цільова функція, найкраща можлива функція , яку може бути обрано, задається такою , яка задовольняє

Оскільки розподіл імовірності є невідомим, для очікуваного ризику мусить застосовуватися замінна міра. Ця міра ґрунтується на тренувальному наборі, вибірці з цього невідомого розподілу ймовірності. Вона називається емпіричним ризиком

Алгоритм навчання, який обирає таку функцію , яка мінімізує емпіричний ризик, називається мінімізацією емпіричного ризику.

Функції втрат

Вибір функції втрат є визначальним чинником для функції , яку буде обрано алгоритмом навчання. Функція втрат також впливає й на темп збіжності алгоритму. Важливо, щоби функція втрат була опуклою.[5]

В залежності від того, чи відноситься задача до задач регресії, чи класифікації, застосовуються різні функції втрат.

Регресія

Найзвичнішою функцією втрат для регресії є квадратична функція втрат (англ. square loss function, відома також як норма L2). Ця знайома функція втрат використовується у звичайній регресії найменших квадратів[en]. Вона виглядає так:

Іноді використовуються й втрати абсолютного значення (англ. absolute value loss, відомі також як норма L1):

Класифікація

Характеристична функція 0-1 є в певному сенсі найприроднішою функцією втрат для класифікації. Вона набуває значення 0, якщо передбачений вихід є таким самим, як і справжній, і набуває значення 1, якщо передбачений вихід відрізняється від справжнього. Для бінарної класифікації з це є

де є функцією Гевісайда.

Регуляризація

Це зображення представляє приклад перенавчання в машинному навчанні. Червоні точки представляють дані тренувального набору. Зелена лінія представляє справжній функційний взаємозв'язок, тоді як синя ліній показує навчену функцію, що стала жертвою перенавчання.

Головною проблемою, яка виникає в задачах машинного навчання, є перенавчання. Оскільки навчання є задачею передбачення, метою є не знайти функцію, яка найщільніше допасовується до (попередньо спостережуваних) даних, а знайти таку, яка найточніше передбачуватиме вихід від майбутнього входу. Мінімізація емпіричного ризику запускає цей ризик перенавчання: шукаючи функцію, яка точно відповідає даним, але не передбачує добре майбутній вихід.

Перенавчання є симптомом нестійких розв'язків: невелике збурення в даних тренувального набору спричинюватиме великі відхилення в навченій функції. Може бути показано, що якщо може бути гарантовано стійкість розв'язку, то узагальнення та послідовність також гарантовано.[6][7] Регуляризація може розв'язувати проблему перенавчання й надавати задачі стійкості.

Регуляризації можна досягати обмеженням простору гіпотез . Поширеним прикладом може слугувати обмеження лінійними функціями: це можна розглядати як зведення задачі до стандартної задачі лінійної регресії. також може бути обмежено многочленами степеню , показниковими функціями, або обмеженими функціями на L1. Обмеження простору гіпотез дозволяє уникати перенавчання, оскільки обмежує вигляд потенційних функцій, і відтак унеможливлює вибір функції, що давала би як завгодно близький до нуля емпіричний ризик.

Одним із прикладів регуляризації є Регуляризація Тихонова. Вона складається з мінімізування

де є зафіксованим додатним параметром, параметром регуляризації. Регуляризація Тихонова забезпечує існування, унікальність та стійкість розв'язку.[8]

Див. також

Примітки

  1. Trevor Hastie[en], Robert Tibshirani, Jerome Friedman (2009) The Elements of Statistical Learning, Springer-Verlag ISBN 978-0-387-84857-0. (англ.)
  2. Mehryar Mohri[en], Afshin Rostamizadeh, Ameet Talwalkar (2012) Foundations of Machine Learning, The MIT Press ISBN 9780262018258. (англ.)
  3. Gagan Sidhu, Brian Caffo. Exploiting pitcher decision-making using Reinforcement Learning. Annals of Applied Statistics (англ.)
  4. Tomaso Poggio, Lorenzo Rosasco, et al. Statistical Learning Theory and Applications, 2012, Class 1 [Архівовано 16 вересня 2012 у Wayback Machine.] (англ.)
  5. Rosasco, L., Vito, E.D., Caponnetto, A., Fiana, M., and Verri A. 2004. Neural computation Vol 16, pp 1063-1076 (англ.)
  6. Vapnik, V.N. and Chervonenkis, A.Y. 1971. On the uniform convergence of relative frequencies of events to their probabilities. Theory of Probability and its Applications Vol 16, pp 264-280. (англ.)
  7. Mukherjee, S., Niyogi, P. Poggio, T., and Rifkin, R. 2006. Learning theory: stability is sufficient for generalization and necessary and sufficient for consistency of empirical risk minimization. Advances in Computational Mathematics. Vol 25, pp 161-193. (англ.)
  8. Tomaso Poggio, Lorenzo Rosasco, et al. Statistical Learning Theory and Applications, 2012, Class 2 [Архівовано 16 серпня 2016 у Wayback Machine.] (англ.)

Джерела

  • Bousquet, Olivier; Boucheron, Stéphane; Lugosi, Gábor (2004). Bousquet, Olivier; von Luxburg, Ulrike; Rätsch, Gunnar (ред.). Introduction to Statistical Learning Theory (PDF). Advanced Lectures on Machine Learning. Т. 3176. Berlin, Heidelberg: Springer Berlin Heidelberg. с. 169—207. doi:10.1007/978-3-540-28650-9_8. ISBN 978-3-540-23122-6.

Read other articles:

Kepulauan Amsterdam(Amsterdam Baru)Île Amsterdam BenderaSemboyan: Liberté, égalité, fraternitéLagu kebangsaan: La Marseillaise Sunting kotak info • Lihat • BicaraBantuan penggunaan templat ini Île AmsterdamJulukan: Nouvelle AmsterdamÎle AmsterdamGeografiKoordinat37°49′33″S 77°33′17″E / 37.82583°S 77.55472°E / -37.82583; 77.55472Luas55 km2Panjang10 kmLebar7 kmTitik tertinggiMont de la Dives (867 m)...

 

2014 video games 2014 video gamePokémon Omega RubyPokémon Alpha SapphireBox art for Pokémon Alpha Sapphire depicting the legendary Pokémon Primal Kyogre. The box art for Pokémon Omega Ruby depicts the legendary Pokémon Primal Groudon (not pictured).Developer(s)Game FreakPublisher(s)JP: The Pokémon CompanyWW: NintendoDirector(s)Shigeru OhmoriProducer(s)Junichi MasudaShusaku EgamiTakato UtsunomiyaHitoshi YamagamiDesigner(s)Masafumi SaitoKazumasa IwaoMasafumi NukitaSuguru NakatsuiArtist(s...

 

Dubes Federasi Rusia untuk AlbaniaLambang Kementerian Luar Negeri RusiaPetahanaMikhail Afanasyev [ru]sejak 16 September 2019Kementerian Urusan Luar NegeriKedubes Rusia di TiranaAtasanMenteri Urusan Luar NegeriKantorTiranaDitunjuk olehPresiden RusiaMasa jabatanAtas keinginan presidenSitus webEmbassy of Russia in Tirana Duta Besar Luar Biasa dan Berkuasa Penuh Federasi Rusia untuk Republik Albania adalah perwakilan resmi Presiden dan Pemerintahan Federasi Rusia untuk Presiden ...

This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: School of Education and Social Services – news · newspapers · books · scholar · JSTOR (December 2011) (Learn how and when to remove this template message) Public, secondary, magnet school in Dallas, Texas, United StatesSchool of Education and Social ServicesLoc...

 

This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these template messages) This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Low Tatras – news · newspapers · books · scholar · JSTOR (July 2008) (Learn how and when to remove this tem...

 

この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方)出典検索?: コルク – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2017年4月) コルクを打ち抜いて作った瓶の栓 コルク(木栓、�...

2012 Indian filmMarinaTheatrical release posterDirected byPandirajWritten byPandirajProduced byPandirajStarring Sivakarthikeyan Oviya Pakkada Pandi Gautham Purushoth CinematographyVijayEdited byAthiappan ShivaMusic byGirishh GProductioncompanyPasanga ProductionsRelease date 3 February 2012 (2012-02-03) [1]Running time134 minutesCountryIndiaLanguageTamilBudget₹80 lakhBox office₹3 crore Marina is a 2012 Tamil-language comedy drama film written, produced, and directed...

 

  「俄亥俄」重定向至此。关于其他用法,请见「俄亥俄 (消歧义)」。 俄亥俄州 美國联邦州State of Ohio 州旗州徽綽號:七葉果之州地图中高亮部分为俄亥俄州坐标:38°27'N-41°58'N, 80°32'W-84°49'W国家 美國加入聯邦1803年3月1日,在1953年8月7日追溯頒定(第17个加入联邦)首府哥倫布(及最大城市)政府 • 州长(英语:List of Governors of {{{Name}}}]]) •&...

 

Pour l’article ayant un titre homophone, voir Ayroles. Cet article possède un paronyme, voir Léon Eyrolles. Cet article concerne la maison d'édition. Pour la commune de la Drôme, voir Eyroles. Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus. Cet article n’est pas rédigé dans un style encyclopédique (avril 2023). Vous pouvez améliorer sa rédaction ! Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus. Le ton de ...

土库曼斯坦总统土库曼斯坦国徽土库曼斯坦总统旗現任谢尔达尔·别尔德穆哈梅多夫自2022年3月19日官邸阿什哈巴德总统府(Oguzkhan Presidential Palace)機關所在地阿什哈巴德任命者直接选举任期7年,可连选连任首任萨帕尔穆拉特·尼亚佐夫设立1991年10月27日 土库曼斯坦土库曼斯坦政府与政治 国家政府 土库曼斯坦宪法 国旗 国徽 国歌 立法機關(英语:National Council of Turkmenistan) ...

 

此條目需要补充更多来源。 (2021年7月4日)请协助補充多方面可靠来源以改善这篇条目,无法查证的内容可能會因為异议提出而被移除。致使用者:请搜索一下条目的标题(来源搜索:美国众议院 — 网页、新闻、书籍、学术、图像),以检查网络上是否存在该主题的更多可靠来源(判定指引)。 美國眾議院 United States House of Representatives第118届美国国会众议院徽章 众议院旗...

 

The HonourableMaliki OsmanCBE[1]محمد مالكي بن عثمانMaliki pada 2024 Menteri di Kantor Perdana MenteriPetahanaMulai menjabat 27 Juli 2020Menjabat bersama Indranee Rajah (2018–sekarang)Tan See Leng (2020–2021)Perdana MenteriLee Hsien LoongLawrence WongPendahuluNg Chee MengPenggantiPetahanaMenteri Kedua PendidikanPetahanaMulai menjabat 27 Juli 2020Perdana MenteriLee Hsien LoongLawrence WongMenteriLawrence Wong(2020–2021)Chan Chun Sing(2021–sekarang...

Senate of the State of Texas Texas SenateEighty-eighth Texas LegislatureTypeTypeUpper house of the Texas Legislature Term limitsNoneHistoryNew session startedJanuary 10, 2023LeadershipPresidentDan Patrick (R) since January 20, 2015 President pro temporeCharles Schwertner (R) since May 29, 2023 Majority LeaderAngela Paxton (R) since September 16, 2023 Minority LeaderCarol Alvarado (D) since January 8, 2020 StructureSeats31Political groupsMajority   Republican (19) Minority  ...

 

Berkelium(IV) oxide Names Other names Berkelium dioxide Identifiers 3D model (JSmol) Interactive image SMILES [O-2].[O-2].[Bk+4] Properties Chemical formula BkO2 Molar mass 278.9988 g/mol Appearance Brown solid Structure[1] Crystal structure cubic Space group Fm3m Lattice constant a = 533.2 pm, b = 533.2 pm, c = 533.2 pm Related compounds Other anions Berkelium(IV) sulfide Other cations Americium(IV) oxideCurium(IV) oxideCalifornium(IV...

 

Neolithic culture in northeast China Hongshan culture-3000SUMERProto-ElamiteEBLAJeul-munINDUSVALLEYCIVILIZATIONCorded WareCultureYamnayaCultureKura-AraxesAfanasievocultureBotaicultureBolshemyscultureSarazmcultureAncientNortheast AsiansHongshanLong-shanDawen-kouLiang-zhuMajia-yaoQujia-lingEARLYDYNASTICEGYPTclass=notpageimage| The Hongshan culture and other contemporary cultures c. 3000 BCPeriodNeolithicDatesc. 4700 to 2900 BCPreceded byXinglongwa culture, Xinle culture, Zhaobaogou cultur...

2017 mobile video game 2017 video gameTerminator Genisys: Future WarDeveloper(s)PlariumPublisher(s)PlariumPlatform(s)iOS, AndroidReleaseMay 18, 2017[1]Genre(s)Strategy, massively multiplayer onlineMode(s)Multiplayer Terminator Genisys: Future War is a mobile MMO strategy video game created by Plarium in cooperation with Skydance Media.[2][3] The events of the game take place in a post-apocalyptic future years after the events of the Terminator Genisys film. Originally ...

 

1981 1988 Élections législatives de 1986 dans le Rhône 14 sièges de députés à l'Assemblée nationale 16 mars 1986 Corps électoral et résultats Population 1 445 208 Inscrits 862 545 Votants 657 756   76,26 %  10 Votes exprimés 637 927 Majorité présidentielle – Charles Hernu Liste Parti socialisteMouvement des radicaux de gauche Voix 186 834 29,29 %   7,3 Députés élus 5  1 Union pour la démocratie ...

 

Disambiguazione – Se stai cercando altri significati, vedi Rock (disambigua). RockOrigini stilisticheRock and rollBritish invasion Origini culturaliStati Uniti, Regno Unito, anni cinquanta e sessanta Strumenti tipicivoce, chitarra elettrica, chitarra acustica, basso elettrico, basso acustico, batteria, organo, tastiera, pianoforte, sintetizzatore PopolaritàElevata dagli anni cinquanta. SottogeneriRock alternativo – Art rock – Musica beat – Britpop – Emo �...

French painter and writer (1883–1956) Jean MetzingerMetzinger, before 1913BornJean Dominique Antony Metzinger(1883-06-24)24 June 1883Nantes, FranceDied3 November 1956(1956-11-03) (aged 73)Paris, FranceEducationÉcole des Beaux-Arts (Nantes)Known forPainting, drawing, writing, poetryNotable workTwo Nudes in an Exotic Landscape (1905–06)Coucher de soleil no. 1 (1905–06)La danse, Bacchante (c. 1906)Nu à la cheminée (1910)Le goûter (Tea Time) (1911)La Femme au Cheval (1911–12...

 

Board wargame published in 1972 Cover of 1st edition, 1972 Quebec 1759 is a board wargame published in 1972 by Gamma Two Games (now Columbia Games) that simulates the Battle of the Plains of Abraham outside the walls of Quebec in 1759. The game uses wooden blocks set on their edge rather than the more traditional cardboard counters, unique for a wargame in 1972. Background In 1759, as part of the French and Indian War, British general James Wolfe, using British soldiers and elements of the Ro...