Nucli més suau

Un kernel smoother és una tècnica estadística per estimar una funció de valor real com a mitjana ponderada de les dades observades veïnes. El pes es defineix pel nucli, de manera que els punts més propers reben pes més alts. La funció estimada és suau i el nivell de suavitat el defineix un únic paràmetre. El suavització del nucli és un tipus de mitjana mòbil ponderada.[1][2]

Definicions

Si és un nucli definit per

on:

  • és la norma euclidiana
  • és un paràmetre (radi del nucli)
  • D (t ) és típicament una funció de valor real positiu, el valor de la qual és decreixent (o no augmenta) per a la distància creixent entre X i X 0.

Els nuclis populars utilitzats per allisar inclouen els nuclis parabòlics (Epanechnikov), Tricube i gaussians.

Sigui una funció contínua de X. Per cadascú , la mitjana ponderada pel nucli de Nadaraya-Watson (estimació suau Y (X )) es defineix per

on:

  • N és el nombre de punts observats
  • Y (X i ) són les observacions en X i punts.

A les seccions següents, es descriuen alguns casos particulars de suavitzadors del nucli.[3]

Nucli gaussià més suau

El nucli gaussià és un dels nuclis més utilitzats, i s'expressa amb l'equació següent.

Aquí, b és l'escala de longitud per a l'espai d'entrada.

Veí més proper més suau

La idea del veí més proper més suau és la següent. Per a cada punt X 0, pren els m veïns més propers i estima el valor de Y (X 0 ) fent la mitjana dels valors d'aquests veïns.Formalment, , on és la m- èma més propera a X 0 veí, i

Exemple:

En aquest exemple, X és unidimensional. Per cada X 0, el és un valor mitjà de 16 més proper a X 0 punts (indicat amb vermell). El resultat no és prou suau.

Nucli mitjà més suau

La idea del suau mitjà del nucli és la següent. Per a cada punt de dades X 0, trieu una mida de distància constant λ (radi del nucli o amplada de la finestra per a p = 1) i calculeu una mitjana ponderada per a tots els punts de dades que estan més a prop de a X 0 (com més a prop de X 0 punts obtenen pesos més alts).

Formalment, i D (t ) és un dels nuclis populars.[4]

Referències

  1. «Kernel Methods» (en anglès). [Consulta: 13 octubre 2023].
  2. «Kernel Smoothing — scikit-fda 0.9.1.dev1 documentation» (en anglès). [Consulta: 13 octubre 2023].
  3. PhD, Ruoqing Zhu. Chapter 11 Kernel Smoothing | Statistical Learning and Machine Learning with R (en anglès). 
  4. Clancy, Drew. «Data Science Design Pattern #2: Variable-Width Kernel Smoothing» (en anglès americà), 19-02-2014. [Consulta: 13 octubre 2023].