Mètode de conjunt

Tres conjunts de dades generats d'un conjunt original. L'exemple A es produeix dues vegades al conjunt 1 perquè es trien amb substitució

En les estadístiques i l'aprenentatge automàtic, els mètodes de conjunt utilitzen diversos algorismes d'aprenentatge per obtenir un millor rendiment predictiu del que es podria obtenir a partir de qualsevol dels algorismes d'aprenentatge constitutius.[1][2][3] A diferència d'un conjunt estadístic en mecànica estadística, que sol ser infinit, un conjunt d'aprenentatge automàtic consta només d'un conjunt finit concret de models alternatius, però normalment permet que hi hagi una estructura molt més flexible entre aquestes alternatives.

Els algorismes d'aprenentatge supervisat realitzen la tasca de cercar a través d'un espai d'hipòtesis per trobar una hipòtesi adequada que faci bones prediccions amb un problema concret.[4] Fins i tot si l'espai d'hipòtesis conté hipòtesis que són molt adequades per a un problema en particular, pot ser molt difícil trobar-ne un de bo. Els conjunts combinen múltiples hipòtesis per formar una (esperem) millor hipòtesi. El terme conjunt es reserva normalment per a mètodes que generen múltiples hipòtesis utilitzant el mateix aprenent base. El terme més ampli de sistemes de classificadors múltiples també cobreix la hibridació d'hipòtesis que no són induïdes pel mateix aprenent de base.[5]

L'avaluació de la predicció d'un conjunt requereix normalment més càlcul que l'avaluació de la predicció d'un sol model. En un sentit, es pot pensar que l'aprenentatge en conjunt és una manera de compensar els mals algorismes d'aprenentatge realitzant molts càlculs addicionals. D'altra banda, l'alternativa és fer molt més aprenentatge en un sistema no conjunt. Un sistema de conjunt pot ser més eficient a l'hora de millorar la precisió general per al mateix augment dels recursos de càlcul, emmagatzematge o comunicació utilitzant aquest augment en dos o més mètodes, que no s'hauria millorat augmentant l'ús de recursos per a un únic mètode. Els algorismes ràpids com els arbres de decisió s'utilitzen habitualment en mètodes de conjunt (per exemple, boscos aleatoris), encara que els algorismes més lents també es poden beneficiar de les tècniques de conjunt.

Per analogia, les tècniques de conjunt s'han utilitzat també en escenaris d'aprenentatge no supervisat, per exemple en l'agrupació de consens o en la detecció d'anomalies.

Tipus comuns de mètodes de conjunts: Classificador òptim de Bayes, Agregació de bootstrap (empaquetament), Boosting, Mitjana del model bayesià, Combinació de models bayesians, Cubeta de models, Apilament.

Referències

  1. Opitz, D.; Maclin, R. Journal of Artificial Intelligence Research, 11, 1999, pàg. 169–198. DOI: 10.1613/jair.614 [Consulta: free].
  2. Polikar, R. IEEE Circuits and Systems Magazine, 6, 3, 2006, pàg. 21–45. DOI: 10.1109/MCAS.2006.1688199.
  3. Rokach, L. Artificial Intelligence Review, 33, 1–2, 2010, pàg. 1–39. DOI: 10.1007/s10462-009-9124-7.
  4. Blockeel H. Encyclopedia of Machine Learning, 2011, pàg. 511–513. DOI: 10.1007/978-0-387-30164-8_373.
  5. «What Is Ensemble Learning? Understanding Machine Learning Techniques» (en anglès). https://www.simplilearn.com,+26-03-2021.+[Consulta: 6 febrer 2023].