Статистическая теория обучения

Статистическая теория обучения — это модель для машинного обучения на основе статистики и функционального анализа[1][2]. Статистическая теория обучения имеет дело с задачами нахождения функции предсказывания, основанной на данных. Статистическая теория обучения привела к успешным приложениям в таких областях, как компьютерное зрение, распознавание речи и биоинформатика.

Введение

Целью обучения является понимание и предвидение. Обучение распадается на несколько категорий, включая обучение с учителем, обучение без учителя, онлайновое обучение и обучение с подкреплением. С точки зрения статистической теории обучения обучение с учителем является наиболее понятным[3]. Обучение с учителем вовлекает обучение с помощью тренировочного набора[англ.] данных. Любой момент тренировки является парой вход/выход, где входное значение отображается в выходное. Задача обучения состоит в реконструкции функции, которая отображает входные значения в выходные так, что функция может быть использована для предсказания вывода при будущих вводах.

В зависимости от типа вывода, задачи обучения с учителем либо являются задачами регрессии, либо задачами классификации. Если вывод может принимать непрерывную область значений, это задача регрессии. Используя закон Ома в качестве примера, регрессия могла бы брать напряжение в качестве входа и выдавать ток как выход. Регрессия могла бы найти связь напряжения и тока как , так что

Задачи классификации — это те, для которых выводом будет элемент из набора меток. Классификация очень обычна для приложений машинного обучения. В системе распознавания лиц, например, изображение лица будет входом, а выходом может быть фамилия человека. Вход может быть представлен как большой многомерный вектор, элементы которого представляют пиксели в изображении.

После обучения функция, основанная на тренировочном наборе данных, это функция проверяется на тестовом наборе данных, которые не появляются в тренировочном наборе.

Формальное описание

Пусть будет векторным пространством всех возможных входных данных, а  — векторным пространством всех возможных выходов. Статистическая теория обучения предполагает, что имеется некоторое неизвестное распределение вероятности над произведением пространств , то есть существует некоторая неизвестная . Тренировочное множество состоит из экземпляров этого распределения вероятности и обозначается

Каждый является входным вектором из тренировочных данных, а является выходом, соответствующим этому входному вектору.

В такой формализации задача вывода состоит в нахождении функции , такой что . Пусть  — пространство функций , которое называется пространством гипотез. Пространство гипотез — это пространство, которое алгоритм будет просматривать. Пусть будет функцией потерь, метрикой разницы между предсказанным значением и истинным значением . Ожидаемый риск определяется как

Целевая функция, лучшая функция , которая может быть выбрана, это функция, удовлетворяющая условию

Поскольку распределение вероятности неизвестно, должны быть использованы косвенные показатели ожидаемого риска. Эти показатели основываются на тренировочном множестве, выборке из этого неизвестного распределения вероятности. Такой показатель называется эмпирическим риском:. Алгоритм обучения, который выбирает функцию , минимизирующую эмпирический риск, называется минимизацией эмпирического риска[англ.].

Функции потерь

Выбор функции потерь — это определение определяющего фактора для функции , которая будет выбрана обучающим алгоритмом. Функция потерь влияет также на скорость сходимости алгоритма. Важно, чтобы функции потерь была выпуклой [4].

Используются разные функции потерь в зависимости от того, является задача регрессией или классификацией.

Регрессия

Наиболее употребительной функцией потерь для регрессии является квадратичная функция потерь (известная также как L2-норма). Эта знакомая функция потерь используется в обычном методе наименьших квадратов[англ.]. Формула:

Абсолютная величина потери (известная также как L1-норма) также иногда используется:

Классификация

В некотором смысле 0-1 индикаторная функция является наиболее естественной функцией потерь для задач классификации. Функция принимает значение 0, если предсказанный результат совпадает с верным значением и значение 1, если предсказанный результат не совпадает с верным значением. Для двоичной классификации это будет:

где  — функция Хевисайда.

Рисунок показывает пример переобучения при машинном обучении. Красные точки представляют тренировочные данные. Зелёная линия представляет истинную функциональную зависимость, в то время как синяя линия показывает функцию — результат обучения, ставшую жертвой переобучения.

Регуляризация

В задачах машинного обучения главной проблемой становится переобучение. Поскольку обучение является задачей предсказания, целью является не поиск функции, которая наиболее близко подходит для (предварительно просмотренных) данных, а поиск функции, которая будет наиболее точно предсказывать выход из будущих входных данных. Минимизация эмпирического риска попадает в этот риск переобучения — нахождение функции, которая соответствует в точности данным, но не в состоянии предсказать будущее.

Переобучение является симптомом нестабильных решений — малые изменения в тренировочном наборе могут вызвать большие вариации в функции обучения. Можно показать, что стабильность решения может быть гарантирована[5][6]. Регуляризация может решить проблему переобучения и обеспечить стабильность.

Регуляризация может быть осуществлена путём ограничения пространства гипотез . Можно ограничить, например, линейными функциями — это можно рассматривать как ограничение до стандартной задачи линейной регрессии. можно ограничить до многочленов степени , экспонент или ограниченных функций на L1. Ограничение на пространстве гипотез исключает переобучение ограничением вида потенциальных функций, что не даёт выбирать функции, дающие эмпирический риск произвольно близким нулю.

Одним из примеров регуляризации является регуляризация Тихонова. Она состоит в минимизации

,

где фиксированный положительный параметр. Метод регуляризации Тихонова обеспечивает существование, единственность и стабильность решения[7].

Примечания

  1. Hastie, Tibshirani, Friedman, 2009.
  2. Mohri, Rostamizadeh, Talwalkar, 2012.
  3. Tomaso Poggio, Lorenzo Rosasco, et al. Statistical Learning Theory and Applications, 2012, Class 1 Архивная копия от 16 сентября 2012 на Wayback Machine
  4. Rosasco, Vito, Caponnetto, Fiana, Verri, 2004, с. 1063—1076.
  5. Vapnik, Chervonenkis, 1971, с. 264—280.
  6. Mukherjee, Niyogi, Poggio, Rifkin, 2006, с. 161—193.
  7. Tomaso Poggio, Lorenzo Rosasco, et al. Statistical Learning Theory and Applications, 2012, Class 2 Архивная копия от 16 августа 2016 на Wayback Machine

Литература

  • Trevor Hastie, Robert Tibshirani, Jerome Friedman. The Elements of Statistical Learning. — Springer-Verlag, 2009. — ISBN 978-0-387-84857-0.
  • Mehryar Mohri, Afshin Rostamizadeh, Ameet Talwalkar. Foundations of Machine Learning.. — USA, Massachusetts: MIT Press., 2012. — ISBN 9780262018258.
  • Gagan Sidhu, Brian Caffo. Exploiting pitcher decision-making using Reinforcement Learning // Annals of Applied Statistics. — 2014. — Т. 8, вып. 2. — doi:10.1214/13-AOAS712.
  • Rosasco L., Vito E.D., Caponnetto A., Fiana M., Verri A. Are loss functions all the same? // Neural computation. — 2004. — Т. 16.
  • Vapnik V. N., Chervonenkis A. Y. On the uniform convergence of relative frequencies of events to their probabilities // Theory of Probability and its Applications. — 1971. — Т. 16.
  • Mukherjee S., Niyogi P., Poggio T., Rifkin R. Learning theory: stability is sufficient for generalization and necessary and sufficient for consistency of empirical risk minimization // Advances in Computational Mathematics. — 2006. — Т. 25.

Read other articles:

Town in Carbon County, Montana, United States Town in Montana, United StatesFromberg, MontanaTownPost Office in 2019Location within Carbon County and MontanaCoordinates: 45°23′30″N 108°54′31″W / 45.39167°N 108.90861°W / 45.39167; -108.90861[1]CountryUnited StatesStateMontanaCountyCarbonArea[2] • Total0.45 sq mi (1.16 km2) • Land0.44 sq mi (1.15 km2) • Water0.00 sq mi...

Public House in Mount Pleasant Road, SouthamptonOld FarmhouseThe Old Farmhouse pub in SouthamptonTypePublic HouseLocationMount Pleasant Road, SouthamptonCoordinates50°54′53″N 1°23′33″W / 50.9148°N 1.3925°W / 50.9148; -1.3925OS grid referenceSU 42806 12986AreaHampshireBuiltBef 1560Rebuilt 1611 Listed Building – Grade II*Official nameThe Old Farm House Public HouseDesignated14 July 1953Reference no.1302207 Location of Old Farmhouse in Southampton The O...

Ле-МолюнLes Molunes Країна  Франція Регіон Бургундія-Франш-Конте  Департамент Жура  Округ Сен-Клод Кантон Сен-Клод Код INSEE 39341 Поштові індекси 39310 Координати 46°20′45″ пн. ш. 5°55′27″ сх. д.H G O Висота 750 - 1330 м.н.р.м. Площа 20,51 км² Населення 143 (2011-01-01) Густота 6,97 ос./км² Ро

The Clement Peerens Explosition The Clement Peerens Explosition Achtergrondinformatie Jaren actief 1990-2023 Oorsprong  België Genre(s) Humor, Rock Leden leadzanger, leadgitarist Clement Peerens basgitarist, zanger Sylvain Aertbeliën drummer Dave de Peuter Oud-leden drummer François Vettige Swa de Bock Officiële website (en) Discogs-profiel (en) MusicBrainz-profiel Portaal    Muziek The Clement Peerens Explosition (ook CPeX genaamd) is een Vlaamse rockgroep. De groep i...

Artikel ini sebatang kara, artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini.Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala.Tag ini diberikan pada Oktober 2022. Balok T merupakan struktur penahan beban dari balok beton bertulang, kayu atau logam yang digunakan pada konstruksi bangunan dan gedung. Pada konstruksi bangunan gedung bertingkat posisi balok dan pelat lantai merupakan satu kesatuan, balok yang dileng...

يوتان     الإحداثيات 41°14′40″N 96°23′54″W / 41.2444°N 96.3983°W / 41.2444; -96.3983  تقسيم إداري  البلد الولايات المتحدة[1]  التقسيم الأعلى مقاطعة ساوندرس  خصائص جغرافية  المساحة 1.486267 كيلومتر مربع1.368711 كيلومتر مربع (1 أبريل 2010)  ارتفاع 356 متر  عدد السكان  �...

  「扬州」重定向至此。关于其他用法,请见「揚州 (消歧义)」。   提示:此条目的主题不是楊州市。 扬州市扬地级市扬州瘦西湖五亭桥扬州市在江苏省的地理位置坐标:32°23′35″N 119°24′54″E / 32.393°N 119.415°E / 32.393; 119.415坐标:32°23′35″N 119°24′54″E / 32.393°N 119.415°E / 32.393; 119.415国家 中华人民共和国省江苏省設�...

Iglesia de Santa Ana Monumento Histórico(Decreto Supremo n.º 3861, del 29 de octubre de 1970) Vista de la iglesia.LocalizaciónPaís Chile ChileDivisión Región Metropolitana de SantiagoSubdivisión Provincia de SantiagoLocalidad SantiagoDirección Catedral 1547Coordenadas 33°26′16″S 70°39′31″O / -33.437806, -70.658715Información religiosaCulto Iglesia católicaArquidiócesis Santiago de ChileAdvocación Santa AnaHistoria del edificioConstrucción 1806 - 185...

Legendary Chinese ruler, one of the Five Emperors For other uses, see Yao (disambiguation). Yao堯Chinese Emperor YaoReign99 years[1]PredecessorEmperor ZhiSuccessorEmperor ShunBornGaoyou, Jiangsu or Tianchang, AnhuiSpouseSan Yi (concubine)IssueDanzhuEhuangNuyingFatherEmperor KuMotherQingdu Emperor YaoSong dynasty depiction of Yao Emperor Yao (simplified Chinese: 尧; traditional Chinese: 堯; pinyin: Yáo; Wade–Giles: Yao2; traditionally c. 2356 – 2255 BCE) ...

For other uses, see Blue Anchor (disambiguation). Human settlement in EnglandBlue AnchorThe PubBlue AnchorLocation within SomersetOS grid referenceST022433Civil parishCarhamptonDistrictSomerset West and TauntonShire countySomersetRegionSouth WestCountryEnglandSovereign stateUnited KingdomPost townMINEHEADPostcode districtTA24Dialling code01984PoliceAvon and SomersetFireDevon and SomersetAmbulanceSouth Western UK ParliamentBridgwater and West Somerset List of...

Опис файлу Опис Емблема чемпіонату України з футболу 1994—1995 Джерело http://ukranianfootball.narod.ru/ukraine.html Час створення 1994 Автор зображення ФФУ Ліцензія див. нижче Ліцензування Це логотип (емблема) організації, товару, або заходу, що перебуває під захистом авторських прав та/або є тов...

American college football award Ray Guy AwardAwarded forCollege football's top punterCountryUnited StatesPresented byGreater Augusta Sports CouncilHistoryFirst award2000Most recentAdam Korsak, RutgersWebsitehttp://www.augustasportscouncil.org/ The Ray Guy Award is presented annually to college football's most outstanding punter as adjudged by the Augusta Sports Council. The award is named after punter Ray Guy, an All-American for Southern Mississippi and an All-Pro in the National Football Le...

У этого термина существуют и другие значения, см. Петрово. ДеревняПетрово 56°32′12″ с. ш. 84°49′06″ в. д.HGЯO Страна  Россия Субъект Федерации Томская область Район Томский История и география Часовой пояс UTC+7:00 Население Население 536 человек (2015) Цифровые иденти�...

Not to be confused with Freethought, Cognitive liberty, or Freedom of speech. Freedom to hold a thought This article is written like a personal reflection, personal essay, or argumentative essay that states a Wikipedia editor's personal feelings or presents an original argument about a topic. Please help improve it by rewriting it in an encyclopedic style. (July 2018) (Learn how and when to remove this template message) Without freedom of thought there can be no such thing as wisdom & no ...

This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these template messages) This article relies excessively on references to primary sources. Please improve this article by adding secondary or tertiary sources. Find sources: Douglas Anderson School of the Arts – news · newspapers · books · scholar · JSTOR (October 2013) (Learn how and when to remove this template message) Thi...

この名前は、ポルトガル語圏の人名慣習に従っています。第一姓(母方の姓)はジ・アラウージョ、第二姓(父方の姓)はジ・カルヴァーリョです。 ジェフェルソン 名前本名 ジェフェルソン・ジ・アラウージョ・ジ・カルヴァーリョラテン文字 Jeferson de Araújo de Calvalho基本情報国籍 ブラジル生年月日 (1996-06-22) 1996年6月22日(27歳)出身地 カンピーナス身長 170cm選手情�...

四十六囤蛮夷千户所,元朝四川等处行中书省管理的千户所。 管理豕蛾夷地区,在庆符向南直抵定川,古代夜郎国之地,唐朝羁縻定州的支江县。至元十三年(1276年)收附,在庆符县(今四川省高县西北)侨置千户所,管理领四十六囤: 黄水口上下落骨,山落牟许满吴,麽落财,麽落贤,腾息奴,屯莫面,落搔,麽落梅,麽得幸,上落松,麽得会,麽得恶,落魂,落昧下�...

Acronym for the economies of Portugal, Italy, Greece and Spain A graph showing the economic data from Greece, Ireland, Italy, Portugal, Spain, Great-Britain, Germany, the EU and the eurozone for 2009 Net international investment position of PIIGS plus some other states PIGS is a derogatory acronym that has been used to designate the economies of the Southern European countries of Portugal, Italy, Greece, and Spain.[1][2][3][4][5] During the European deb...

This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Sahadeva of Magadha – news · newspapers · books · scholar · JSTOR (December 2007) (Learn how and when to remove this template message) This article contains Indic text. Without proper rendering support, you may see question marks or boxes, misplaced vowels or m...

Chinese language 1986 novel by Mo Yan Red Sorghum First edition (Chinese)AuthorMo YanOriginal title红高粱家族 Hong Gao Liang Jia ZuTranslatorHoward Goldblatt (1993)CountryChinaLanguageChineseSet in20th-century ShandongPublication date1986/1987 Red Sorghum: A Novel of China (simplified Chinese: 红高粱家族; traditional Chinese: 紅高粱家族; pinyin: Hóng Gāoliáng Jiāzú; lit. 'red sorghum family') is a Chinese-language novel by Mo Yan. Its five par...