Гіперпараметр (машинне навчання)

У машинному навчанні гіперпараметр — це параметр, значення якого використовується для керування процесом навчання. На відміну від цього, значення інших параметрів (як правило, вага вузлів) виводяться за допомогою навчання.

Гіперпараметри можна класифікувати як гіперпараметри моделі, які неможливо визначити під час підгонки моделі до навчального набору[en], оскільки вони відносяться до задачі вибору моделі, або гіперпараметри алгоритму, які в принципі не впливають на продуктивність моделі, але впливають на швидкість і якість навчального процесу. Прикладом гіперпараметра моделі є топологія та розмір нейронної мережі. Прикладами гіперпараметрів алгоритму є швидкість навчання та розмір пакету, а також розмір міні-пакету. Розмір пакету може посилатися на повну вибірку даних, де розмір міні-партії буде меншим набором вибірки.

Різні алгоритми навчання моделі вимагають різних гіперпараметрів, деякі прості алгоритми (наприклад, звичайна регресія найменших квадратів[en]) не потребують жодного. Враховуючи ці гіперпараметри, навчальний алгоритм вивчає параметри з даних. Наприклад, LASSO[en] — це алгоритм, який додає гіперпараметр регуляризації до звичайної регресії за найменшими квадратами, який необхідно встановити перед оцінкою параметрів за допомогою навчального алгоритму.[1]

Міркування

Час, необхідний для навчання та тестування моделі, може залежати від вибору її гіперпараметрів.[2] Гіперпараметр зазвичай має безперервний або цілочисельний тип, що призводить до проблем оптимізації змішаного типу.[2] Існування одних гіперпараметрів залежить від значення інших, наприклад, розмір кожного прихованого шару в нейронній мережі може залежати від кількості шарів.[2]

Важкі для сприйняття параметри

Зазвичай, але не завжди, гіперпараметри неможливо вивчити за допомогою відомих методів, заснованих на градієнті (таких як градієнтний спуск, LBFGS), які зазвичай використовуються для вивчення параметрів. Ці гіперпараметри — це параметри, що описують представлення моделі, які неможливо дізнатися за допомогою звичайних методів оптимізації, але, тим не менш, впливають на функцію втрат. Прикладом може бути гіперпараметр допуску для помилок у машинах опорних векторів.

Параметри, які не підлягають навчанню

Іноді гіперпараметри не можна дізнатися з навчальних даних, оскільки вони швидко збільшують ємність моделі і можуть знизити функцію втрат до небажаного мінімуму (перевірка даних і збільшення шуму в даних), на відміну від правильного відображення насиченості даних. Наприклад, якщо ми розглядатимемо степінь многочлена, що відповідає моделі регресії, як параметр, який можна навчати, степінь буде збільшуватися до тих пір, поки модель ідеально не відповідатиме даним, що дасть низьку похибку навчання, але не велику продуктивність узагальнення.

Можливість налаштування

Більшу частину змін продуктивності можна пояснити лише кількома гіперпараметрами.[2][3][4] Можливість налаштування алгоритму, гіперпараметра або взаємодіючих гіперпараметрів є мірою того, наскільки продуктивність може бути досягнута шляхом їх налаштування.[5] Для LSTM, в той час як швидкість навчання, а потім розмір мережі є його найважливішими гіперпараметрами,[6] пакетна робота та імпульс не мають значного впливу на його продуктивність.[7]

Міцність

Внутрішня стохастичність навчання прямо означає, що емпірична продуктивність гіперпараметра не обов'язково є його справжньою продуктивністю.[2] Методи, які не стійкі до простих змін гіперпараметрів, випадкових початкових даних або навіть різних реалізацій одного і того ж алгоритму, не можуть бути інтегровані в критично важливі системи керування без значного спрощення та надійності.[8]

Алгоритми навчання з підкріпленням, зокрема, вимагають вимірювання їхньої ефективності щодо великої кількості випадкових зародків, а також вимірювання їх чутливості до вибору гіперпараметрів.[8] Їхня оцінка за допомогою невеликої кількості випадкових зерен не фіксує належним чином продуктивність через високу дисперсію.[8] Деякі методи навчання з підкріпленням, напр DDPG (Deep Deterministic Policy Gradient) є більш чутливими до вибору гіперпараметрів, ніж інші.[8]

Оптимізація

Оптимізація гіперпараметрів знаходить набір гіперпараметрів, що дає оптимальну модель, яка мінімізує попередньо визначену функцію втрат на заданих тестових даних.[2] Цільова функція приймає набір гіперпараметрів і повертає пов'язані втрати.[2]

Відтворюваність

Окрім налаштування гіперпараметрів, машинне навчання передбачає збереження й упорядкування параметрів і результатів, а також забезпечення їх відтворюваності.[9] За відсутності надійної інфраструктури для цієї мети код дослідження часто розвивається швидко і ставить під загрозу такі важливі аспекти, як бухгалтерський облік і відтворюваність.[10] Онлайн-платформи для співпраці для машинного навчання йдуть далі, дозволяючи вченим автоматично обмінюватися, організовувати та обговорювати експерименти, дані та алгоритми.[11] Відтворюваність може бути особливо важкою для моделей глибокого навчання.[12]

Існує ряд відповідних служб і програмного забезпечення з відкритим кодом:

Послуги

Ім'я Інтерфейси
Comet.ml [Архівовано 27 січня 2020 у Wayback Machine.][13] Python[14]
OpenML [Архівовано 25 травня 2022 у Wayback Machine.][11][15][16][17] REST, Python, Java, R[18]
Вага та упередження [Архівовано 20 листопада 2020 у Wayback Machine.][19] Python[20]

Програмне забезпечення

Ім'я Інтерфейси Магазин
Вирішується [Архівовано 30 травня 2022 у Wayback Machine.] REST, Python PostgreSQL
OpenML Docker [Архівовано 24 травня 2022 у Wayback Machine.][11][15][16][17] REST, Python, Java, R[18] MySQL
sacred [Архівовано 24 травня 2022 у Wayback Machine.][9][10] Python[21] file, MongoDB, TinyDB, SQL

Див. також

Примітки

  1. Yang, Li; Shami, Abdallah (20 листопада 2020). On hyperparameter optimization of machine learning algorithms: Theory and practice. Neurocomputing (англ.). 415: 295—316. doi:10.1016/j.neucom.2020.07.061. ISSN 0925-2312.
  2. а б в г д е ж Claesen, Marc, and Bart De Moor. "Hyperparameter Search in Machine Learning." arXiv preprint arXiv:1502.02127 (2015). arXiv:1502.02127. Bibcode:2015arXiv150202127C.
  3. Leyton-Brown, Kevin; Hoos, Holger; Hutter, Frank (27 січня 2014). An Efficient Approach for Assessing Hyperparameter Importance: 754—762. Архів оригіналу за 20 травня 2022. Процитовано 28 травня 2022 — через proceedings.mlr.press.
  4. van Rijn, Jan N., and Frank Hutter. "Hyperparameter Importance Across Datasets." arXiv preprint arXiv:1710.04725 (2017). arXiv:1710.04725. Bibcode:2017arXiv171004725V.
  5. Probst, Philipp, Bernd Bischl, and Anne-Laure Boulesteix. "Tunability: Importance of Hyperparameters of Machine Learning Algorithms." arXiv preprint arXiv:1802.09596 (2018). arXiv:1802.09596. Bibcode:2018arXiv180209596P.
  6. Greff, K.; Srivastava, R. K.; Koutník, J.; Steunebrink, B. R.; Schmidhuber, J. (23 жовтня 2017). LSTM: A Search Space Odyssey. IEEE Transactions on Neural Networks and Learning Systems. 28 (10): 2222—2232. arXiv:1503.04069. doi:10.1109/TNNLS.2016.2582924. PMID 27411231.
  7. Breuel, Thomas M. "Benchmarking of LSTM networks." arXiv preprint arXiv:1508.02774 (2015). arXiv:1508.02774. Bibcode:2015arXiv150802774B.
  8. а б в г Mania, Horia, Aurelia Guy, and Benjamin Recht. "Simple random search provides a competitive approach to reinforcement learning." arXiv preprint arXiv:1803.07055 (2018). arXiv:1803.07055. Bibcode:2018arXiv180307055M.
  9. а б Greff, Klaus, and Jürgen Schmidhuber. "Introducing Sacred: A Tool to Facilitate Reproducible Research." (PDF). 2015. Архів оригіналу (PDF) за 7 квітня 2018. Процитовано 28 травня 2022.
  10. а б Greff, Klaus, et al. "The Sacred Infrastructure for Computational Research." (PDF). 2017. Архів оригіналу (PDF) за 29 вересня 2020. Процитовано 28 травня 2022.
  11. а б в Vanschoren, Joaquin, et al. "OpenML: networked science in machine learning." arXiv preprint arXiv:1407.7722 (2014). arXiv:1407.7722. Bibcode:2014arXiv1407.7722V.
  12. Villa, Jennifer; Zimmerman, Yoav (25 травня 2018). Reproducibility in ML: why it matters and how to achieve it. Determined AI Blog. Архів оригіналу за 19 вересня 2020. Процитовано 31 серпня 2020.
  13. Comet.ml – Machine Learning Experiment Management. Архів оригіналу за 12 червня 2021. Процитовано 28 травня 2022.
  14. Inc, Comet ML. comet-ml: Supercharging Machine Learning. Архів оригіналу за 27 січня 2020. Процитовано 28 травня 2022.
  15. а б Van Rijn, Jan N.; Bischl, Bernd; Torgo, Luis; Gao, Bo; Umaashankar, Venkatesh; Fischer, Simon; Winter, Patrick; Wiswedel, Bernd; Berthold, Michael R. (2013). OpenML: A Collaborative Science Platform. Van Rijn, Jan N., et al. "OpenML: A collaborative science platform." Joint European Conference on Machine Learning and Knowledge Discovery in Databases. Springer, Berlin, Heidelberg, 2013. Lecture Notes in Computer Science. Т. 7908. с. 645—649. doi:10.1007/978-3-642-40994-3_46. ISBN 978-3-642-38708-1.
  16. а б Vanschoren, Joaquin, Jan N. van Rijn, and Bernd Bischl. "Taking machine learning research online with OpenML." Proceedings of the 4th International Conference on Big Data, Streams and Heterogeneous Source Mining: Algorithms, Systems, Programming Models and Applications-Volume 41. JMLR. org, 2015 (PDF).{{cite web}}: Обслуговування CS1: Сторінки з параметром url-status, але без параметра archive-url (посилання)
  17. а б van Rijn, J. N. Massively collaborative machine learning. Diss. 2016. 19 грудня 2016. Архів оригіналу за 4 січня 2017. Процитовано 28 травня 2022.
  18. а б OpenML. GitHub. Архів оригіналу за 24 травня 2022. Процитовано 28 травня 2022.
  19. Weights & Biases for Experiment Tracking and Collaboration. Архів оригіналу за 28 жовтня 2020.
  20. Monitor your Machine Learning models with PyEnv. Архів оригіналу за 8 листопада 2020.
  21. Greff, Klaus (3 січня 2020). sacred: Facilitates automated and reproducible experimental research. Архів оригіналу за 24 травня 2022. Процитовано 28 травня 2022.

Read other articles:

Educational YouTube channel Crash CourseCrash Course YouTube channel iconGenreEducational[1]Created byJohn Green Hank GreenDeveloped by Complexly PBS Digital Studios Written byVariousDirected by Stan Muller Nicholas Jenkins Brandon Brungard Nicole Sweeney Hannah Bodenhausen Creative directorThought Café (Formerly Thought Bubble)Presented by List of presenters John GreenHank GreenPhil PlaitCraig BenzineStan MullerAdriene HillJacob CliffordShini SomaraAndre MeadowsCarrie Anne PhilbinMi...

 

Insiden Penembakan Nangpa LaPengungsi selamat yang ditangkap oleh penjaga perbatasan di tempat penampungan di Cho OyuTanggal30 September 2006Waktu10:30 AMLokasiNangpa La, Tibet, ChinaKoordinat28°6′27.8″N 86°35′17.5″E / 28.107722°N 86.588194°E / 28.107722; 86.588194Koordinat: 28°6′27.8″N 86°35′17.5″E / 28.107722°N 86.588194°E / 28.107722; 86.588194JenisPenembakan sipil oleh pernjaga perbatasanPelapor pertamaMountEverest.ne...

 

Future high-rise hotel in Seattle, Washington, U.S. The Langham, SeattleThe Terminal Sales Annex in 2008Location within downtown SeattleHotel chainLanghamGeneral informationStatusProposedTypeHotel, ResidentialAddress1931 2nd AvenueSeattle, Washington, U.S.Coordinates47°36′41″N 122°20′30″W / 47.61139°N 122.34167°W / 47.61139; -122.34167Estimated completion2026OwnerLangham Hospitality GroupHeight484 feet (148 m)Technical detailsSize552,000 square feet (5...

Pour les articles homonymes, voir Arif. Kader Arif Kader Arif en 2012. Fonctions Ministre délégué aux Anciens combattants[a] 16 mai 2012 – 21 novembre 2014(2 ans, 6 mois et 5 jours) Président François Hollande Premier ministre Jean-Marc AyraultManuel Valls Gouvernement Ayrault I et IIValls I et II Prédécesseur Marc Laffineur Successeur Jean-Marc Todeschini Député français 22 décembre 2014 – 20 juin 2017(2 ans, 5 mois et 29 jours) Élection 17 juin...

 

رئيسة الكومنولث إليزابيث الثانية (بالإنجليزية: Elizabeth II)‏  إليزابيث سنة 2015 ملكة المملكة المتحدة وعوالم كومنولوث الأخرى كندا 1952–2022 أستراليا 1952–2022 نيوزيلندا 1952–2022 جنوب أفريقيا 1952–1961 باكستان 1952–1956 سيلان 1952–1972 غانا 1957–1960 نيجيريا 1960–1963 سيراليون 1961–1971 تنجانيقا 1961–1962 ج...

 

العلاقات السلوفينية اللبنانية سلوفينيا لبنان   سلوفينيا   لبنان تعديل مصدري - تعديل   العلاقات السلوفينية اللبنانية هي العلاقات الثنائية التي تجمع بين سلوفينيا ولبنان.[1][2][3][4][5] مقارنة بين البلدين هذه مقارنة عامة ومرجعية للدولتين: وجه الم...

Village and municipality in Slovakia Košice-okolie District in the Košice Region Hrašovík (Hungarian: Rás) is a village and municipality in Košice-okolie District in the Košice Region of eastern Slovakia. History Historically, the village was first mentioned in 1270. Geography The village lies at an altitude of 215 metres and covers an area of 2.05 km2. It has a population of 300 people. Genealogical resources The records for genealogical research are available at the state archiv...

 

The Secret Life of Bees Sampul edisi IndonesiaPengarangSue Monk KiddIlustratorKim EllingtonNegaraAmerika SerikatGenreFiksi sejarahDiterbitkan8 November, 2001Halaman336 pp. The Secret Life of Bees adalah sebuah novel karangan Sue Monk Kidd. Berlatarkan tahun 1964, Bees mengisahkan tentang kehilangan, pengkhianatan, dan lanskap antar-ras dari era hak-hak sipil di Amerika Selatan. Bees lantas mendapat pujian kritis dan bertengger di daftar buku terlaris New York Times. Bees juga berhasil memenan...

 

Estonian judge and legal scientist This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these template messages) This article may require cleanup to meet Wikipedia's quality standards. No cleanup reason has been specified. Please help improve this article if you can. (December 2010) (Learn how and when to remove this template message) This article is in list format but may read better as prose. You can help by convert...

Artikel ini memiliki beberapa masalah. Tolong bantu memperbaikinya atau diskusikan masalah-masalah ini di halaman pembicaraannya. (Pelajari bagaimana dan kapan saat yang tepat untuk menghapus templat pesan ini) Artikel atau sebagian dari artikel ini mungkin diterjemahkan dari Xcode di en.wikipedia.org. Isinya masih belum akurat, karena bagian yang diterjemahkan masih perlu diperhalus dan disempurnakan. Jika Anda menguasai bahasa aslinya, harap pertimbangkan untuk menelusuri referensinya dan m...

 

Norwegian football club Football clubÅlgårdFull nameÅlgård FotballklubbFounded1915GroundÅlgård stadion,Ålgård, NorwayCapacity3,000ChairmanTor Eivind MossManagerGeir MidtsianLeagueSecond Division2012Second Division/ 3, 6th[1] Home colours Away colours Ålgård Fotballklubb is a men's football club located in Ålgård, Norway that was founded in 1915. Ålgård played in Hovedserien, then the highest division in Norway, for several years after World War II. The club has been play...

 

Dalam nama Tionghoa ini, nama keluarganya adalah Sim (沈). Yang Berhormat TuanSteven SimAP沈志强 Menteri Sumber Daya ManusiaPetahanaMulai menjabat 12 Desember 2003Perdana MenteriAnwar IbrahimWakilAbdul Rahman MohamadPendahuluV. SivakumarPenggantiPetahanaWakil Menteri Keuangan IIMasa jabatan10 Desember 2022 – 12 Desember 2023Menjabat bersama Ahmad Maslan (Wakil Menteri Keuangan I)Perdana MenteriAnwar IbrahimMenteriAnwar IbrahimPendahuluYamani Hafez MusaPenggantiLim H...

Artikel ini sebatang kara, artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini.Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala.Tag ini diberikan pada November 2022. Alime AbdenanovaNama lahirAlime BorasanovLahir4 Januari 1924Kerch, Republik Sosialis Soviet Otonom KrimeaMeninggal5 April 1944 (usia 20)Simferopol, Krimea pada masa pendudukan NaziPengabdian Uni SovietDinas/cabang Tentara Merah (intelijensi milit...

 

本條目存在以下問題,請協助改善本條目或在討論頁針對議題發表看法。 此條目需要編修,以確保文法、用詞、语气、格式、標點等使用恰当。 (2013年8月6日)請按照校對指引,幫助编辑這個條目。(幫助、討論) 此條目剧情、虛構用語或人物介紹过长过细,需清理无关故事主轴的细节、用語和角色介紹。 (2020年10月6日)劇情、用語和人物介紹都只是用於了解故事主軸,輔助�...

 

L'histoire de la sociologie, en tant que discipline scientifique, commence à la fin du XIXe siècle, même si l'on peut retrouver des raisonnements sociologiques dès l'Antiquité. La sociologie se développe principalement en Europe de l'Ouest alors que la révolution industrielle fait émerger les premières enquêtes et réflexions sur les conditions de vie des ouvriers. Mais ce n'est qu'à partir des années 1890 que la sociologie s'institutionnalise avec les premières revues e...

St George's Chapel, Windsor Castle The historical monographs relating to St George's Chapel, Windsor Castle are a series of scholarly publications supported by the Dean and Canons of Windsor.[1] Much of the scholarship is based on the material held in the archives at St. George’s Chapel, Windsor Castle. History In 1939 the Rev. E. H. Fellowes, Minor Canon of St George’s Chapel, published a list of the Knights of the Garter from 1348 to 1939 along with a complete list of the stall...

 

Soviet space station in orbit from April to October 1971 Salyut 1 (DOS-1)Salyut 1 as seen from the departing Soyuz 11Station statisticsCOSPAR ID1971-032ASATCAT no.05160Call signSalyut 1Crew3LaunchApril 19, 1971, 01:40:00 (1971-04-19UTC01:40) UTC[1]Carrier rocketProton-KLaunch padSite 81/24, Baikonur Cosmodrome, Soviet UnionReentryOctober 11, 1971 (1971-10-12)Mission statusDe-orbitedMass18,425 kg (40,620 lb)Length~20 m (66 ft)Diameter~4 m (13...

 

Yoon Chae-kyungChaekyung di tahun 2019Nama asal윤채경LahirYoon Chae-kyung7 Juli 1996 (umur 28)Incheon, Korea SelatanPekerjaanPenyanyiKarier musikGenreK-popInstrumenVokalTahun aktif2012-sekarangLabelDSP MediaLOEN EntertainmentArtis terkaitDSP FriendsAprilI.B.IC.I.V.AProduce 101Baby KaraPuretty Nama KoreaHangul윤채경 Hanja尹彩暻 Alih AksaraYun Chae-gyeongMcCune–ReischauerYun Ch'ae-kyŏng Templat:Korean membutuhkan parameter |hangul=. Yoon Chae-kyung (lahir 7 Juli ...

Ethnic group native to Denmark This article is about Danes as a nation and ethnic group. For the Iron Age Germanic tribe, see Danes (tribe). For other uses, see Dane. Ethnic group DanesDanskereTotal populationc. 8 million Regions with significant populations Denmark5,961,249[1] United States1,430,897[2] Canada207,470[3][4] Norway52,510[5] Brazil52,000[6][7][8] Australia50,413[9] Germany5...

 

Men's 110 metres hurdlesat the Games of the XV OlympiadLeft-right: Davis, Dillard, BarnardVenueHelsinki Olympic StadiumDatesJuly 23 (heats)July 24 (semifinals, final)Competitors30 from 20 nationsWinning time13.7 ORMedalists Harrison Dillard United States Jack Davis United States Arthur Barnard United States← 19481956 → Video on YouTube amateur filmVideo on YouTube Official film Athletics at the1952 Summer OlympicsTrack events100 mmenwomen200 mmen...