Entrenament i validació de conjunts de dades

Principis de l'aprenentatge automàtic.

En l'aprenentatge automàtic, una tasca habitual és l'estudi i la construcció d'algorismes que puguin aprendre i fer prediccions sobre les dades.[1] Aquests algorismes funcionen fent prediccions o decisions basades en dades,[2] mitjançant la construcció d'un model matemàtic a partir de dades d'entrada. Aquestes dades d'entrada que s'utilitzen per construir el model solen dividir-se en diversos conjunts de dades. En particular, s'utilitzen habitualment tres conjunts de dades en diferents etapes de la creació del model: formació, validació i conjunts de proves.

El model s'ajusta inicialment a un conjunt de dades d'entrenament,[3] que és un conjunt d'exemples utilitzats per ajustar els paràmetres (per exemple, els pesos de les connexions entre neurones en xarxes neuronals artificials) del model.[4] El model (per exemple, un classificador Bayes ingenu) s'entrena en el conjunt de dades d'entrenament mitjançant un mètode d'aprenentatge supervisat, per exemple utilitzant mètodes d'optimització com ara el descens del gradient o el descens del gradient estocàstic. A la pràctica, el conjunt de dades d'entrenament sovint consta de parells d'un vector d'entrada (o escalar) i el vector de sortida corresponent (o escalar), on la clau de resposta es denota habitualment com a objectiu (o etiqueta). El model actual s'executa amb el conjunt de dades d'entrenament i produeix un resultat, que després es compara amb l' objectiu, per a cada vector d'entrada del conjunt de dades d'entrenament. A partir del resultat de la comparació i de l'algorisme d'aprenentatge específic que s'utilitza, s'ajusten els paràmetres del model. L'ajustament del model pot incloure tant la selecció de variables com l'estimació de paràmetres.

Un conjunt d'entrenament (esquerra) i un conjunt de proves (dreta) de la mateixa població estadística es mostren com a punts blaus. Dos models predictius s'ajusten a les dades d'entrenament. Els dos models equipats es representen amb els conjunts d'entrenament i de prova. Al conjunt d'entrenament, el MSE de l'ajust que es mostra en taronja és 4, mentre que el MSE de l'ajust que es mostra en verd és 9. Al conjunt de proves, el MSE de l'ajust que es mostra en taronja és 15 i el MSE de l'ajust que es mostra en verd és 13. La corba taronja sobrepassa greument les dades d'entrenament, ja que el seu MSE augmenta gairebé un factor de quatre quan es compara el conjunt de proves amb el conjunt d'entrenament. La corba verda sobreajusta les dades d'entrenament molt menys, ja que el seu MSE augmenta menys d'un factor de 2.

Successivament, el model ajustat s'utilitza per predir les respostes de les observacions en un segon conjunt de dades anomenat conjunt de dades de validació.[5] El conjunt de dades de validació proporciona una avaluació imparcial de l'ajust d'un model al conjunt de dades d'entrenament mentre s'ajusten els hiperparàmetres del model [6] (per exemple, el nombre d'unitats ocultes (capes i amplades de capes) en una xarxa neuronal [7]). Els conjunts de dades de validació es poden utilitzar per a la regularització mitjançant una aturada anticipada (aturant l'entrenament quan augmenta l'error del conjunt de dades de validació, ja que això és un signe d'adaptació excessiva al conjunt de dades d'entrenament).[8] Aquest procediment senzill es complica a la pràctica pel fet que l'error del conjunt de dades de validació pot fluctuar durant l'entrenament, produint múltiples mínims locals. Aquesta complicació ha portat a la creació de moltes regles ad-hoc per decidir quan ha començat realment el sobreajustament.[8]

Referències

  1. Ron Kohavi; Foster Provost Machine Learning, 30, 1998, pàg. 271–274. DOI: 10.1023/A:1007411609915 [Consulta: free].
  2. Bishop, Christopher M. Pattern Recognition and Machine Learning (en anglès). New York: Springer, 2006, p. vii. ISBN 0-387-31073-8. 
  3. James, Gareth. An Introduction to Statistical Learning: with Applications in R (en anglès). Springer, 2013, p. 176. ISBN 978-1461471370.  Arxivat 2019-06-23 a Wayback Machine.
  4. Ripley, Brian. Pattern Recognition and Neural Networks. Cambridge University Press, 1996, p. 354. ISBN 978-0521717700. 
  5. James, Gareth. An Introduction to Statistical Learning: with Applications in R (en anglès). Springer, 2013, p. 176. ISBN 978-1461471370.  Arxivat 2019-06-23 a Wayback Machine.
  6. Brownlee, Jason. «What is the Difference Between Test and Validation Datasets?» (en anglès), 13-07-2017. [Consulta: 12 octubre 2017].
  7. Ripley, Brian. Pattern Recognition and Neural Networks (en anglès). Cambridge University Press, 1996, p. 354. ISBN 978-0521717700. 
  8. 8,0 8,1 Prechelt, Lutz. «Early Stopping — But When?». A: Grégoire Montavon. Neural Networks: Tricks of the Trade (en anglès). Springer Berlin Heidelberg, 2012, p. 53–67 (Lecture Notes in Computer Science). DOI 10.1007/978-3-642-35289-8_5. ISBN 978-3-642-35289-8. 

Read other articles:

Artikel ini bukan mengenai Daftar kabupaten dan kota di Papua. Peta Provinsi Papua Barat Provinsi Papua Barat memiliki 7 kabupaten dan tidak mempunyai kota dengan ibukota terletak di Manokwari. Berikut adalah daftar kabupaten di Papua Barat No. Kabupaten Ibu kota Bupati Luas wilayah (km²)[1] Jumlah penduduk (2020) Distrik Kelurahan/kampung Lambang Peta lokasi 1 Kabupaten Fakfak Fakfak Untung Tamsil 14.320,00 85.197 17 7/142 2 Kabupaten Kaimana Kaimana Freddy Thie 16.241,84 62.256 7 2...

 

For the villages in Iran, see Danian, Iran. First age of the Paleocene Epoch Danian66.0 – 61.6 Ma PreꞒ Ꞓ O S D C P T J K Pg N ↓ Chronology−65 —–−60 —–−55 —–−50 —–−45 —–−40 —–−35 —–−30 —–−25 —–MZCenozoicKPaleogeneNLKPaleoceneEoceneOligoceneMCMaastricht.DanianSelandianThanetianYp...

 

هذه المقالة تحتاج للمزيد من الوصلات للمقالات الأخرى للمساعدة في ترابط مقالات الموسوعة. فضلًا ساعد في تحسين هذه المقالة بإضافة وصلات إلى المقالات المتعلقة بها الموجودة في النص الحالي. (مارس 2018) مقاطعة مينيدوكا     الإحداثيات 42°51′N 113°38′W / 42.85°N 113.64°W / 42.85; -113...

Imperial dynasty in Vietnam from 1802 to 1945 Kingdom of Vietnam redirects here. For other kingdoms, see List of Vietnamese dynasties. Đại Việt Quốc 大越國(1802–1804) Đại Việt Nam Quốc大越南國(1804–1839; 1945)Đại Nam Quốc大南國(1839–1945)1802–1945 Court flag(c. 1920s–1945) Coat of arms Anthem: Đăng đàn cung(The Emperor Mounts His Throne)Heirloom Seal of the Southern RealmĐại Nam thụ thiên vĩnh mệnh truyền quốc tỷ大南受天永命...

 

Pour les articles homonymes, voir Darquier. Louis Darquier Louis Darquier vers 1942-1944. Fonctions Commissaire général aux questions juives (Vichy) 8 mai 1942 – 26 février 1944(1 an, 9 mois et 18 jours) Gouvernement Laval (6)(Vichy) Prédécesseur Xavier Vallat Successeur Charles du Paty de Clam Conseiller municipal de Paris 1935 – 1940(5 ans) Biographie Nom de naissance Louis Darquier Date de naissance 19 décembre 1897 Lieu de naissance Cahors, Lot, France Date ...

 

Topolino & i cattivi Disneyfilm d'animazione direct-to-video La House of Mouse diventa la House of Villains osservata da Topolino e Minni in una scena del film Titolo orig.Mickey's House of Villains Lingua orig.inglese PaeseStati Uniti RegiaJamie Mitchell Produttore esecutivoBobs Gannaway, Tony Craig ProduttoreMelinda Rediger SceneggiaturaThomas Hart Char. designDana Landsberg, Kexx Singleton Dir. artisticaMike Moon, Jamie Mitchell MusicheMichael Tavera St...

Флаг гордости бисексуалов Бисексуальность      Сексуальные ориентации Бисексуальность Пансексуальность Полисексуальность Моносексуальность Сексуальные идентичности Би-любопытство Гетерогибкость и гомогибкость Сексуальная текучесть Исследования Шк...

 

Olympic athletics event Men's 100 metersat the Games of the XXIV OlympiadVenueOlympic StadiumDate23 & 24 SeptemberCompetitors102 from 69 nationsWinning time9.92 WRMedalists Carl Lewis United States Linford Christie Great Britain Calvin Smith United States← 19841992 → Athletics at the1988 Summer OlympicsTrack events100 mmenwomen200 mmenwomen400 mmenwomen800 mmenwomen1500 mmenwomen3000 mwomen5000 mmen10,000 mmenwomen100 m hurdleswomen110 m hurd...

 

Cargo ship of the United States Navy History United States NameUSS Electron NamesakeA very light particle associated with the elementary charge of negative electricity BuilderBethlehem Hingham Shipyard, Hingham, Massachusetts Laid down8 February 1945 Launched9 March 1945 Commissioned5 April 1945 as USS LST-1070 Decommissioned3 December 1946, at Astoria, Oregon In service6 October 1950 as USS Electron (AG-146) Out of service16 November 1956 RenamedElectron, 1 February 1949 ReclassifiedAG-146 E...

IRC client LeafChatLeafChat 2.41 connected to an IRC networkOriginal author(s)Samuel MarshallDeveloper(s)leafdigitalStable release2.5 / July 29, 2012; 11 years ago (2012-07-29) Written inJava[1]Operating systemMicrosoft Windows, OS X, LinuxPlatformCross-platformSize5.5 MBAvailable inEnglishJapaneseTypeIRC clientLicenseGPL-3.0-or-laterWebsiteleafdigital.com (English)leafdigital.com (Japanese) LeafChat is a free IRC client for Microsoft Windows and Unix-like operating ...

 

التكوين الإثني (بالإنغليزية: Ethnogenesis، من اليونانية إيثنوس ἔθνος، «مجموعة من الناس، أمة»، وgenesis أي تكوين γένεσις، «بداية، يأتي إلى حيز الوجود») هو «تشكل ونشوء مجموعة إثنية».[1][2][3] ويمكن أن ينشأ ذلك عن طريق عملية تحديد الهوية الذاتية، كما أنها تنشأ نتيجة للتعريف ...

 

Seaborne weapon HMS Astute launching a Tomahawk in 2011 A submarine-launched cruise missile (SLCM) is a cruise missile that is launched from a submarine (especially a SSG or SSGN). Current versions are typically standoff weapons known as land-attack cruise missiles (LACMs), which are used to attack predetermined land targets with conventional or nuclear payloads. Anti-ship cruise missiles (ASCMs) are also used, and some submarine-launched cruise missiles have variants for both functions. Hist...

American neo-Nazi (1953–1984) Robert Jay MathewsBorn(1953-01-16)January 16, 1953Marfa, Texas, U.S.DiedDecember 8, 1984(1984-12-08) (aged 31)Whidbey Island, near Freeland, Washington, U.S.Cause of deathSmoke inhalation and fireOrganization(s)Sons of LibertyThe OrderSpouseDebbie McGarity (m. 1976)Children2 (1 adopted) Robert Jay Mathews (January 16, 1953 – December 8, 1984) was an American neo-Nazi activist and the leader of The Order, an American white supremacist militant group...

 

Extinct Pakawan language of Texas and Mexico CoahuiltecoNative toMexico, United StatesRegionCoahuila, TexasEthnicityQuems, Pajalat, etc.Extinctnot attested after 18th centuryLanguage familyHokan ? Coahuiltecan ?PakawanCoahuiltecoDialects Pajalat Language codesISO 639-3xcwLinguist ListxcwGlottologcoah1252Coauhuilteco languageThis article contains IPA phonetic symbols. Without proper rendering support, you may see question marks, boxes, or other symbols instead of Unicode charact...

 

Europa – Demokratie – Esperanto Bundes­vorstand Konrad Gramelspacher, Steffen Eitner, Georg Hennemann, Hartmut Koblischke Gründung 2003 Website http://e-d-e.eu Europa – Demokratie – Esperanto (Kurzbezeichnung: EDE), auf Esperanto Eŭropo – Demokratio – Esperanto, ist eine europäische politische Bewegung, die sich zum Ziel gesetzt hat, mittels der Plansprache Esperanto für eine Verbesserung der Verständigung und eine Stärkung der Demokratie in Europa zu sorgen. Der franz...

1992 personal computer Atari Falcon030ManufacturerAtari CorporationTypePersonal computerRelease date1992; 32 years ago (1992)Discontinued1993 (1993)Operating systemTOS/MultiTOSCPUMotorola 68030 @ 16 MHzMotorola 56001 @ 32 MHzMemory1, 4, or 14 Megabytes of RAMGraphicsVIDEL video controllerSoundSDMA sound/DMA co-processor (16-bits, 50 kHz; 8 stereo channels); Yamaha Y3439-F (3 channel PSG)PredecessorAtari TT030Atari MEGA STE The Atari Falcon030 (usually shortene...

 

HalderbergeKotaOudenbosch cathedral BenderaLambang kebesaranNegaraBelandaProvinsiBrabant UtaraLuas(2006) • Total75,24 km2 (2,905 sq mi) • Luas daratan74,64 km2 (2,882 sq mi) • Luas perairan0,60 km2 (20 sq mi)Populasi (1 Januari 2007) • Total29.349 • Kepadatan393/km2 (1,020/sq mi) Sumber: CBS, Statline.Zona waktuUTC+1 (CET) • Musim panas (DST)UTC+2 (CEST) Halderbe...

 

Coastal town in Scotland For other uses, see Oban (disambiguation). Town and former burgh of barony in ScotlandObanScottish Gaelic: An t-Òban[1]Scots: ObanTown and former burgh of baronyA view over Oban from McCaig's TowerObanLocation within Argyll and ButePopulation8,140 (2022)[2]OS grid referenceNM859298• Edinburgh93 mi (150 km)• London402 mi (647 km)Council areaArgyll and ButeLieutenancy areaArgyll and ButeCountryS...

This article relies excessively on references to primary sources. Please improve this article by adding secondary or tertiary sources. Find sources: Diving at the 2010 Commonwealth Games – Women's synchronised 10 metre platform – news · newspapers · books · scholar · JSTOR (July 2022) (Learn how and when to remove this message) Diving at the2010 Commonwealth GamesIndividual1 m Springboardmenwomen3 m Springboardmenwomen10 m platformmenwomenSynchronis...

 

This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these template messages) The neutrality of this article is disputed. Relevant discussion may be found on the talk page. Please do not remove this message until conditions to do so are met. (January 2019) (Learn how and when to remove this message) This article needs additional citations for verification. Please help improve this article by adding citations to reliab...