Validació encreuada

La validació encreuada[1]cross-validation en anglès— és una tècnica utilitzada per avaluar els resultats d'una anàlisi estadística i garantir que són independents de la partició entre dades d'entrenament i prova. Consisteix a repetir i calcular la mitjana aritmètica obtinguda de les mesures d'avaluació sobre diferents particions. S'utilitza en entorns on l'objectiu principal és la predicció i es vol estimar com és de precís un model que es durà a terme a la pràctica.[2] És una tècnica molt utilitzada en projectes d'intel·ligència artificial per a validar models generats.

Esquema k-fold cross validation, amb k=4 i amb un sol classificador.[3]

Context

La validació creuada prové de la millora del mètode de retenció o holdout method. Aquest consisteix a dividir en dos conjunts complementaris les dades de mostra, realitzar l'anàlisi d'un subconjunt (anomenat dades d'entrenament o training set), i validar l'anàlisi en l'altre subconjunt (anomenat dades de prova o test set), de manera que la funció d'aproximació només s'ajusta amb el conjunt de dades d'entrenament i a partir d'aquí calcula els valors de sortida per al conjunt de dades de prova (valors que no ha analitzat abans). L'avantatge d'aquest mètode és que és molt ràpid a l'hora de computar. No obstant això, aquest mètode no és massa precís degut a la variació del resultats obtinguts per a diferents dades d'entrenament. L'avaluació pot dependre en gran manera de quina és la divisió entre dades d'entrenament i de prova i, per tant, pot ser significativament diferent en funció de com es realitzi aquesta divisió.Degut a aquestes mancances apareix el concepte de validació encreuada.[4]

Mètode de retenció

Objectiu de la validació encreuada

Suposem que tenim un model amb un o més paràmetres d'ajust desconeguts i unes dades d'entrenament que volem analitzar. El procés d'ajust optimitza els paràmetres del model perquè aquest s'ajusti a les dades d'entrenament tan bé com pugui. Si agafem una mostra independent com a dada de prova (validació), del mateix grup que les dades d'entrenament, normalment el model no s'ajustarà a les dades de prova tan bé com a les dades d'entrenament. Això s'anomena sobre-ajust i acostuma a passar quan la mida de les dades d'entrenament és petita o quan el nombre de paràmetres del model és gran. La validació encreuada és una manera de predir l'ajust d'un model a un hipotètic conjunt de dades de prova quan no disposem del conjunt explícit de dades de prova.[5]

Tipus de validacions creuades

Validació encreuada de K iteracions

En la validació encreuada de K iteracions o K-fold cross-validation les dades de mostra es divideixen en K subconjunts. Un dels subconjunts s'utilitza com a dades de prova i la resta (K-1) com a dades d'entrenament. El procés de validació encreuada és repetit durant k iteracions, amb cada un dels possibles subconjunts de dades de prova. Finalment es realitza la mitjana aritmètica dels resultats de cada iteració per a obtenir un únic resultat. Aquests mètode és molt precís, ja que avaluem a partir de K combinacions de dades d'entrenament i de prova, però tot i així té un desavantatge, i és que, a diferència del mètode de retenció, és lent des del punt de vista computacional.[5] A la pràctica, l'elecció del nombre d'iteracions depèn de la mida del conjunt de dades. El més comú és utilitzar la validació encreuada de 10 iteracions (10-fold cross-validation).[6]

Validació encreuada de K iteracions amb K=4.

Validació encreuada aleatòria

Aquest mètode consisteix a dividir aleatòriament el conjunt de dades d'entrenament i el conjunt de dades de prova. Per a cada divisió la funció d'aproximació s'ajusta a partir de les dades d'entrenament i calcula els valors de sortida per al conjunt de dades de prova. El resultat final es correspon a la mitjana aritmètica dels valors obtinguts per a les diferents divisions. L'avantatge d'aquest mètode és que la divisió de dades entrenament-prova no depèn del nombre d'iteracions. Però en canvi amb aquest mètode hi ha algunes mostres que queden sense avaluar i d'altres que s'avaluen més d'una vegada, és a dir, els subconjunts de prova i entrenament es poden solapar.[7]

Validació encreuada aleatòria amb k iteracions

Validació encreuada deixant-ne un fora

La validació encreuada deixant-ne un fora o Leave-one-out cross-validation (LOOCV) implica separar les dades de manera que per a cada iteració tinguem una sola mostra per a les dades de prova i tota la resta conformant les dades d'entrenament. L'avaluació ve donada per l'error, i en aquest tipus de validació encreuada l'error és molt baix, però en canvi, a nivell computacional és molt costós, ja que s'han de realitzar un elevat nombre d'iteracions, tantes com N mostres tinguem i per a cada una analitzar les dades tant d'entrenament com de prova. [8]

Validació encreuada deixant un fora (LOOCV)

Càlcul de l'error

L'avaluació de les diferents validacions creuades normalment ve donada per l'error obtingut en cada iteració, ara bé, per cada un dels mètodes pot variar el nombre d'iteracions, segons l'elecció del dissenyador en funció del nombre de dades total.[9]

Error de la validació encreuada de K iteracions

En cadascuna de les k iteracions d'aquest tipus de validació es realitza un càlcul d'error. El resultat final l'obtenim a partir de realitzar la mitjana aritmètica dels K valors d'errors obtinguts, segons la fórmula:

És a dir, es realitza el sumatori dels K valors d'error i es divideix entre el valor de K.

Error de la validació encreuada aleatòria

En la validació encreuada aleatòria a diferència del mètode anterior, agafem mostres a l'atzar durant k iteracions, tot i que d'igual manera, es realitza un càlcul d'error per a cada iteració. El resultat final també l'obtenim a partir de realitzar la mitjana aritmètica dels K valors d'errors obtinguts, segons la mateixa fórmula:

Error de la validació encreuada deixant un fora

En la validació encreuada deixant un fora es realitzen tantes iteracions com mostres (N) tingui el conjunt de dades. De manera que per a cada una de les N iteracions es realitza un càlcul d'error. El resultat final l'obtenim realitzant la mitjana aritmètica dels N valors d'errors obtinguts, segons la fórmula:

On es realitza el sumatori dels N valors d'error i es divideix entre el valor de N.

Mesures d'ajust

L'objectiu de la validació encreuada consisteix a estimar el nivell d'ajust d'un model a un cert conjunt de dades de prova independents de les utilitzades per entrenar el model. Aquestes mesures obtingudes poden ser utilitzades per estimar qualsevol mesura quantitativa d'ajust apropiada per a les dades i el model. Per exemple, en un model basat en classificació binària, cada mostra es preveu com a correcta o incorrecta (si pertany a la temàtica o no), de manera que en aquest cas, la taxa d'error de classificació pot ser utilitzada per resumir l'ajust del model.

Exemples d'aplicació

  • La validació encreuada es pot utilitzar per comparar els resultats de diferents procediments de classificació predictiva. Per exemple, suposem que tenim un detector que ens determina si una cara pertany a una dona o a un home i considerem que han estat utilitzats dos mètodes diferents, per exemple, màquina de vector de suport (support vector machines, SVM) i k veïns més propers (k nearest neighbors, KNN) que ens permeten classificar les imatges. Doncs amb la validació encreuada podem comparar els dos procediments i determinar quin dels dos mètodes és més precís. Aquesta informació ens la proporciona la taxa d'error que obtenim en aplicar la validació encreuada per cadascun dels mètodes plantejats.
  • La validació encreuada de "k" iteracions (k-fold cross validation) permet avaluar també models en els que s'utilitzen diversos classificadors, per exemple, continuant amb el cas anterior, si tenim un detector que ens determina si en una imatge hi apareix un home o una dona, i aquest utilitza 4 classificadors binaris per detectar-ho, també podem utilitzar la validació encreuada per avaluar la seva precisió. Si tenim un total de 20 dades (imatges), i utilitzem un 4-fold cross validation, es duran a terme 4 iteracions, i en cada una s'utilitzaran unes dades d'entrenament diferents, que seran analitzades per 4 classificadors, que posteriorment avaluaran les dades de prova, d'aquesta manera per cada mostra obtindrem 4 resultats, i si fem la mitjana entre els resultats de cada classificador i entre les 4 iteracions realitzades obtindrem el valor resultant final.
k-fold cross validation, amb k=4 i amb 4 classificadors.

Referències

  1. «validació encreuada amb un». Termcat. [Consulta: 9 abril 2020].
  2. Devijver, P. A., and J. Kittler, Pattern Recognition: A Statistical Approach, Prentice-Hall, London, 1982
  3. Jean-Philippe Lang, Predictors tutorial Arxivat 2014-01-03 a Wayback Machine., Bioinformatic Department Projects
  4. Jeff Schneider, The holdout method, The school of computer science, 7 de Febrer de 1997
  5. 5,0 5,1 Payam Refaeilzadeh, Lei Tang, Huan Lui, k-fold Cross-Validation Arxivat 2011-09-05 a Wayback Machine., Arizona State University, 6 de novembre de 2008
  6. FH Joanneum, Cross-Validation Explained, Institute for Genomics and Bioinformatics, 2005-2006
  7. Andrew W. Moore, Cross-validation for detecting and preventing overfitting Arxivat 2011-08-10 a Wayback Machine., Carnegie Mellon University
  8. Charles Elkan, Evaluating Classifiers Arxivat 2011-12-18 a Wayback Machine. University of California, San Diego, 18 de gener de 2011
  9. Ricardo Gutierrez-Osuna, Leave-one-out Cross Validation Arxivat 2012-12-02 a Wayback Machine. Wright State University

Vegeu també

Enllaços externs

Read other articles:

Raja George I dari YunaniRaja YunaniBerkuasa30 Maret 1863 – 18 Maret 1913PendahuluOttoPenerusConstantine IInformasi pribadiKelahiran(1845-12-24)24 Desember 1845Kopenhagen, DenmarkKematian18 Maret 1913(1913-03-18) (umur 67)Thessaloniki[1]PemakamanRoyal Cemetery, Tatoi Palace, YunaniWangsaDinasti Schleswig-Holstein-Sonderburg-GlücksburgAyahChristian IX dari DenmarkIbuLouise dari Hesse-KasselPasanganOlga Konstantinovna dari RusiaAnakKonstantinus I dari Yunani Pangeran George Putr...

 

Ga yau hei si 2009Poster filmSutradaraVincent KokProduserRaymond WongZhang ZhaoSkenarioVincent KokSteven FungPoon Chun-LamCeritaRaymond WongPemeranRaymond WongSandra NgLouis KooRonald ChengPenata musikRaymond Wong Ying-WahSinematograferCheung Man-PoPenyuntingKong Chi-LeungPerusahaanproduksiMandarin Films Distribution Co. Ltd.Enlight PicturesDistributorHong Kong:Mandarin Films Distribution Co. Ltd.Singapura:Cathay-Keris FilmsTanggal rilis 22 Januari 2009 (2009-01-22) NegaraHong Kong...

 

Синелобый амазон Научная классификация Домен:ЭукариотыЦарство:ЖивотныеПодцарство:ЭуметазоиБез ранга:Двусторонне-симметричныеБез ранга:ВторичноротыеТип:ХордовыеПодтип:ПозвоночныеИнфратип:ЧелюстноротыеНадкласс:ЧетвероногиеКлада:АмниотыКлада:ЗавропсидыКласс:Пт�...

† Человек прямоходящий Научная классификация Домен:ЭукариотыЦарство:ЖивотныеПодцарство:ЭуметазоиБез ранга:Двусторонне-симметричныеБез ранга:ВторичноротыеТип:ХордовыеПодтип:ПозвоночныеИнфратип:ЧелюстноротыеНадкласс:ЧетвероногиеКлада:АмниотыКлада:Синапсиды�...

 

Strappado, digunakan sebagai hukuman publik, detail pelat 10 Les Grandes Misères de la guerre oleh Jacques Callot, 1633 Strapado, juga dikenal sebagai corda,[1] adalah bentuk penyiksaan dengan tangan korban diikat di belakang punggungnya dan korban digantung dengan tali yang diikatkan ke pergelangan tangan, biasanya mengakibatkan bahu terkilir.[2][3] Tambahan Beban dapat diberikan ke tubuh korban untuk mengintensifkan efek penyiksaan dan meningkatkan rasa sakit.[4...

 

Wasselonnecomune Wasselonne – Veduta LocalizzazioneStato Francia RegioneGrand Est Dipartimento Basso Reno ArrondissementMolsheim CantoneSaverne AmministrazioneSindacoMichèle Eschlimann TerritorioCoordinate48°38′N 7°27′E / 48.633333°N 7.45°E48.633333; 7.45 (Wasselonne)Coordinate: 48°38′N 7°27′E / 48.633333°N 7.45°E48.633333; 7.45 (Wasselonne) Superficie14,99 km² Abitanti5 755[1] (2020) Densità383,92 ab./km² C...

  「俄亥俄」重定向至此。关于其他用法,请见「俄亥俄 (消歧义)」。 俄亥俄州 美國联邦州State of Ohio 州旗州徽綽號:七葉果之州地图中高亮部分为俄亥俄州坐标:38°27'N-41°58'N, 80°32'W-84°49'W国家 美國加入聯邦1803年3月1日,在1953年8月7日追溯頒定(第17个加入联邦)首府哥倫布(及最大城市)政府 • 州长(英语:List of Governors of {{{Name}}}]]) •&...

 

  提示:此条目页的主题不是中國—瑞士關係。   關於中華民國與「瑞」字國家的外交關係,詳見中瑞關係 (消歧義)。 中華民國—瑞士關係 中華民國 瑞士 代表機構駐瑞士台北文化經濟代表團瑞士商務辦事處代表代表 黃偉峰 大使[註 1][4]處長 陶方婭[5]Mrs. Claudia Fontana Tobiassen 中華民國—瑞士關係(德語:Schweizerische–republik china Beziehungen、法�...

 

2016年美國總統選舉 ← 2012 2016年11月8日 2020 → 538個選舉人團席位獲勝需270票民意調查投票率55.7%[1][2] ▲ 0.8 %   获提名人 唐納·川普 希拉莉·克林頓 政党 共和黨 民主党 家鄉州 紐約州 紐約州 竞选搭档 迈克·彭斯 蒂姆·凱恩 选举人票 304[3][4][註 1] 227[5] 胜出州/省 30 + 緬-2 20 + DC 民選得票 62,984,828[6] 65,853,514[6]...

Koordinat: 16°27′13″N 107°32′41″E / 16.453599°N 107.544812°E / 16.453599; 107.544812 Pagoda Thiên Mụ Nama Vietnam Vietnam: Chùa Thiên Mụ Pagoda Thiên Mụ (bahasa Vietnam: Chùa Thiên Mụ; chữ Hán: 天姥寺; juga disebut Linh Mụ, 靈姥) adalah sebuah kuil bersejarah di kota Huế, Vietnam. Bangunan ini dibangun pada tahun 1601. Referensi Jacobs, Seth (2006). Cold War Mandarin: Ngo Dinh Diem and the Origins of America's War in Vietnam, 1...

 

Americans of Ethiopian birth or descent This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Ethiopian Americans – news · newspapers · books · scholar · JSTOR (May 2021) (Learn how and when to remove this message) Ethiopian AmericansTotal population261,741 (Ethiopia-born, 2016)[1][2]68,001 (Ethiop...

 

Lauren Hemp Lauren Hemp melakukan pemanasan sebelum bertanding pada 11 Mei 2019Informasi pribadiNama lengkap Lauren May HempTanggal lahir 07 Agustus 2000 (umur 23)Tempat lahir North Walsham, InggrisTinggi 163 m (534 ft 9 in)Posisi bermain PenyerangInformasi klubKlub saat ini Manchester CityNomor 15Karier junior North Walsham Youth FC2008–2015 Norwich CityKarier senior*Tahun Tim Tampil (Gol)2016–2018 Bristol City 24 (9)2018– Manchester City 20 (5)Tim nasional‡2016�...

Pour les articles homonymes, voir Saulces (homonymie). Saulces Lavoir devant la Saulces à Amagne. Cours de la Saulces (carte interactive). Caractéristiques Longueur 29,5 km [1] Bassin 80 km2 [1] Bassin collecteur la Seine Débit moyen (Rethel) Nombre de Strahler 2 Organisme gestionnaire EPTB Entente Oise-Aisne[2] Régime pluvial océanique Cours Source entre les lieux-dits le Buchenet et la Mouilly · Localisation Faissault · Altitude 175 m · Coordonnées 49° 36′&#...

 

Real estate investment trust This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these template messages) A major contributor to this article appears to have a close connection with its subject. It may require cleanup to comply with Wikipedia's content policies, particularly neutral point of view. Please discuss further on the talk page. (November 2019) (Learn how and when to remove this message) This article needs a...

 

Pendle Hill, Inggris, tempat tonggak sejarah Kaum Quaker dari Perkumpulan Agama Sahabat George Fox berperan penting dalam berdirinya Perkumpulan Agama Sahabat Kaum Quaker atau Perkumpulan Agama Sahabat (bahasa Inggris: Religious Society of Friends) adalah suatu kelompok Kristen Protestan, yang muncul pada abad ke-17 di Inggris. Pendiri Perkumpulan Agama Sahabat adalah George Fox (1624-1691), putra seorang tukang tenun yang lahir di Leicestershire, Inggris. Konon, setelah mendengar suatu s...

Istri TercintaGenre Drama Roman SkenarioSerena LunaCeritaSerena LunaSutradaraGita AsmaraPemeran Citra Kirana Rezky Aditya Samuel Zylgwyn Raya Kohandi Zack Lee Penggubah lagu temaRossa feat AfganLagu pembukaKamu yang Kutunggu oleh Rossa feat AfganLagu penutupKamu yang Kutunggu oleh Rossa feat AfganPenata musikBella MaritzaNegara asalIndonesiaBahasa asliBahasa IndonesiaJmlh. musim1Jmlh. episode25ProduksiProduserLeo SutantoSinematografiSetiawan DimazPenyunting Tedy Gunawan Ramdhan Panigor...

 

Desna ČernihivCalcio Siveriany (I Nordisti)[1] Segni distintiviUniformi di gara Casa Trasferta Colori sociali Bianco, azzurro Dati societariCittàČernihiv Nazione Ucraina ConfederazioneUEFA Federazione FFU CampionatoPremjer-liha Fondazione1960 Rifondazione2010Presidente Volodymyr Levin Allenatore Oleksandr Ryabokon StadioStadio Černihiv(12 060 posti) Sito webdesna.football/ PalmarèsSi invita a seguire il modello di voce Il Futbol'nyj Klub Desna Černihiv (in ucraino...

 

التقسم الإداري لقضاء العمارة قضاء العمارة وهو أحد أقضية محافظة ميسان في العراق ويحتل الموقع الأوسط منها ويعتبر مركز المحافظة إذ تبلغ مساحته الكلية حوالي 6474 كيلو متر مربع ويشكل نسبة قدرها ( 40,3% ) من مساحة المحافظة وتتبع له اداريا ناحيتي كميت و المشرح ويقدر عدد سكان القضاء بح�...

This article's factual accuracy is disputed. Relevant discussion may be found on the talk page. Please help to ensure that disputed statements are reliably sourced. (July 2011) (Learn how and when to remove this message) Battle of PandaranePart of First Luso-Malabarese WarDate1504LocationPandarane, IndiaResult Portuguese victoryBelligerents Portuguese Empire Mamluk EmpireCommanders and leaders Lopo Soares de Albergaria UnknownStrength 2 caravels 15 little boats 360 men [1] 17 large ca...

 

This article does not cite any sources. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Iruvanjippuzha – news · newspapers · books · scholar · JSTOR (March 2012) (Learn how and when to remove this message) River in Kerala, IndiaIruvanjippuazhaEtymologyIruvanjipuzhaLocationCountryIndiaStateKeralaRegionAsiaCityAnakkampoyil Thiruvambady MukkamKumaraneloor Kodiyathur ...