En l'aprenentatge automàtic, les màquines del nucli són una classe d'algorismes per a l'anàlisi de patrons, el membre més conegut dels quals és la màquina de vectors de suport (SVM). Aquests mètodes impliquen l'ús de classificadors lineals per resoldre problemes no lineals.[1] La tasca general de l'anàlisi de patrons és trobar i estudiar tipus generals de relacions (per exemple, clústers, rànquings, components principals, correlacions, classificacions) en conjunts de dades. Per a molts algorismes que resolen aquestes tasques, les dades en la representació en brut s'han de transformar explícitament en representacions vectorials de característiques mitjançant un mapa de característiques especificat per l'usuari: en canvi, els mètodes del nucli només requereixen un nucli especificat per l'usuari, és a dir, una funció de similitud sobre tot. parells de punts de dades calculats mitjançant productes interns. El mapa de característiques a les màquines del nucli és de dimensions infinites, però només requereix una matriu de dimensions finites a partir de l'entrada de l'usuari d'acord amb el teorema del Representant. Les màquines del nucli són lentes per calcular per a conjunts de dades més grans que un parell de milers d'exemples sense processament paral·lel. Els mètodes del nucli deuen el seu nom a l'ús de funcions del nucli, que els permeten operar en un espai de característiquesimplícites d'alta dimensió sense calcular mai les coordenades de les dades en aquest espai, sinó simplement calculant els productes interns entre les imatges de tots els parells de dades de l'espai de funcions. Aquesta operació és sovint computacionalment més barata que el càlcul explícit de les coordenades. Aquest enfocament s'anomena " truc del nucli ".[2] S'han introduït funcions del nucli per a dades de seqüències, gràfics, text, imatges i vectors.[3]
Els mètodes del nucli es poden considerar aprenents basats en instàncies: en lloc d'aprendre un conjunt fix de paràmetres corresponents a les característiques de les seves entrades, en lloc d'això "recorden" el -è exemple d'entrenament i aprèn per això un pes corresponent . La predicció per a entrades no etiquetades, és a dir, aquelles que no estan en el conjunt d'entrenament, es tracta mitjançant l'aplicació d'una funció de semblança, anomenat nucli, entre l'entrada sense etiquetar i cadascun dels inputs de formació . Per exemple, un classificador binari amb nucli normalment calcula una suma ponderada de similituds
on
és l'etiqueta prevista del classificador binari nucleat per a l'entrada sense etiquetar la veritable etiqueta oculta és d'interès;
és la funció del nucli que mesura la similitud entre qualsevol parell d'entrades ;
la suma oscil·la entre els n exemples etiquetats al conjunt d'entrenament del classificador, amb ;
el són els pesos dels exemples d'entrenament, tal com determina l'algorisme d'aprenentatge;
la funció de signe determina si la classificació prevista surt positiu o negatiu.