Anàlisi espectral de mínims quadrats

El resultat d'ajustar un conjunt de punts de dades amb una funció quadràtica

L'anàlisi espectral de mínims quadrats (LSSA) és un mètode per estimar un espectre de freqüència basat en un ajustament de mínims quadrats de sinusoides a mostres de dades, similar a l'anàlisi de Fourier.[1][2] L'anàlisi de Fourier, el mètode espectral més utilitzat en la ciència, generalment augmenta el soroll periòdic llarg en els registres llargs i buits; LSSA mitiga aquests problemes.[3] A diferència de l'anàlisi de Fourier, les dades no han d'estar igualment espaiades per utilitzar LSSA.

Desenvolupat el 1969 [4] i 1971, [5] LSSA també es coneix com el mètode Vaníček i el mètode Gauss-Vaniček després de Petr Vaníček, [6][7] i com el mètode Lomb [8] o el periodograma Lomb-Scargle, [9][10] basat en les simplificacions primer de Nicholas R. Lomb [11] i després de Jeffrey D. Scargle.[12]

Antecedents històrics

Les estretes connexions entre l'anàlisi de Fourier, el periodograma i l'ajustament de mínims quadrats dels sinusoides es coneixen des de fa molt de temps.[13] Tanmateix, la majoria dels desenvolupaments es limiten a conjunts de dades complets de mostres igualment espaiades. L'any 1963, Freek JM Barning de Mathematisch Centrum, Amsterdam, va manejar dades desigualment espaiades mitjançant tècniques similars, [14] incloent tant una anàlisi de periodograma equivalent al que avui en dia s'anomena mètode Lomb i ajustament de mínims quadrats de freqüències seleccionades de sinusoides determinats a partir d'aquests. periodogrames, i connectats per un procediment conegut avui com la recerca de concordança amb l'ajust posterior [15] o l'ortogonal persecució coincident.

Petr Vaníček, geofísic i geodèsic canadenc de la Universitat de New Brunswick, va proposar el 1969 també l'enfocament de recerca de concordança per a dades igualment i desigualment espaiades, que va anomenar "anàlisi espectral successiva" i el resultat un "periodograma de mínims quadrats".[16] Va generalitzar aquest mètode per tenir en compte qualsevol component sistemàtic més enllà d'una simple mitjana, com ara una "tendència secular lineal prevista (quadrada, exponencial,...) de magnitud desconeguda", i la va aplicar a una varietat de mostres el 1971.[17]

El mètode estrictament dels mínims quadrats de Vaníček va ser simplificat el 1976 per Nicholas R. Lomb de la Universitat de Sydney, que va assenyalar la seva estreta connexió amb l'anàlisi del periodograma.[18] Posteriorment, la definició d'un periodograma de dades desigualment espaiades va ser modificada i analitzada per Jeffrey D. Scargle del Centre de Recerca Ames de la NASA, [19] que va demostrar que, amb canvis menors, esdevé idèntic a la fórmula de mínims quadrats de Lomb per ajustar sinusoides individuals. freqüències.

Scargle afirma que el seu treball "no introdueix una nova tècnica de detecció, sinó que estudia la fiabilitat i l'eficiència de la detecció amb la tècnica més utilitzada, el periodograma, en el cas que els temps d'observació estiguin desigualment espaciats ", i apunta a més sobre ajustament de mínims quadrats dels sinusoides en comparació amb l'anàlisi del periodograma, que el seu article "estableix, aparentment per primera vegada, que (amb les modificacions proposades) aquests dos mètodes són exactament equivalent".[20]

Desenvolupament d'LSSA i variants

El mètode Vaníček

En la regressió lineal, se suposa que les observacions ( vermell ) són el resultat de desviacions aleatòries ( verd ) d'una relació subjacent ( blau ) entre una variable dependent ( y ) i una variable independent ( x ). Aleshores, en un ajustament normat, com per exemple pel criteri dels mínims quadrats, els punts de dades ( vermell ) es representen per la línia de millor ajust normativament ( blau ), de la qual sempre queden "residuals" ( verd ).

En el mètode Vaníček, un conjunt de dades discrets s'aproxima mitjançant una suma ponderada de sinusoides de freqüències determinades progressivament mitjançant una regressió lineal estàndard o un ajust de mínims quadrats.[21] Les freqüències s'escullen utilitzant un mètode similar al de Barning, però avançant més en l'optimització de l'elecció de cada nova freqüència successiva escollint la freqüència que minimitzi el residu després de l'ajust de mínims quadrats (equivalent a la tècnica d'ajust que ara es coneix com a recerca de coincidència amb pre- backfitting).[22] El nombre de sinusoides ha de ser inferior o igual al nombre de mostres de dades (comptant sinus i coseus de la mateixa freqüència que sinusoides separats).

El mètode Lomb

Tractant de reduir la càrrega computacional del mètode Vaníček el 1976 [23] (ja no és un problema), Lomb va proposar utilitzar la simplificació anterior en general, excepte per a les correlacions per parelles entre bases sinus i cosinus de la mateixa freqüència, ja que les correlacions entre parells de sinusoides solen ser petits, almenys quan no estan molt espaiats. Aquesta formulació és essencialment la del periodograma tradicional, però adaptada per al seu ús amb mostres espaciades desigualment. El vector x és una estimació raonablement bona d'un espectre subjacent, però com que ignorem qualsevol correlació, A x ja no és una bona aproximació al senyal i el mètode ja no és un mètode de mínims quadrats, però a la literatura continua sent anomenar-se com a tal.

Un espectre de potència (magnitud-quadrat) de dues funcions de base sinusoïdal, calculat pel mètode del periodograma

Aplicacions

La característica més útil de LSSA és permetre que els registres incomplets siguin analitzats espectralment, sense necessitat de manipular dades o d'inventar dades inexistents.

Les magnituds de l'espectre LSSA representen la contribució d'una freqüència o període a la variància de la sèrie temporal.[24] En general, les magnituds espectrals així definides permeten el règim de nivell de significació senzill de la sortida. Alternativament, les magnituds espectrals de l'espectre de Vaníček també es poden expressar en dB. Tingueu en compte que les magnituds espectrals de l'espectre de Vaníček segueixen la distribució β.

La transformació inversa de la LSSA de Vaníček és possible, com es veu més fàcilment escrivint la transformació directa com a matriu; la matriu inversa (quan la matriu no és singular) o pseudo-inversa serà llavors una transformació inversa; la inversa coincidirà exactament amb les dades originals si els sinusoides escollits són mútuament independents als punts de mostra i el seu nombre és igual al nombre de punts de dades. No es coneix aquest procediment invers per al mètode del periodograma.

Distribució beta per a diferents valors dels seus paràmetres

Referències

  1. Cafer Ibanoglu. Variable Stars As Essential Astrophysical Tools (en anglès). Springer, 2000. ISBN 0-7923-6084-2. 
  2. D. Scott Birney. Observational Astronomy (en anglès). Cambridge University Press, 2006. ISBN 0-521-85370-2. 
  3. Press. Numerical Recipes (en anglès). 3rd. Cambridge University Press, 2007. ISBN 978-0-521-88068-8. 
  4. P. Vaníček Astrophysics and Space Science, 4, 4, 01-08-1969, pàg. 387–391. Bibcode: 1969Ap&SS...4..387V. DOI: 10.1007/BF00651344. OCLC: 5654872875.
  5. P. Vaníček Astrophysics and Space Science, 12, 1, 01-07-1971, pàg. 10–33. Bibcode: 1971Ap&SS..12...10V. DOI: 10.1007/BF00656134.
  6. J. Taylor; S. Hamilton Astrophysics and Space Science, 17, 2, 20-03-1972, pàg. 357–367. Bibcode: 1972Ap&SS..17..357T. DOI: 10.1007/BF00642907.
  7. M. Omerbashich Computing in Science & Engineering, 8, 4, 26-06-2006, pàg. 26–30. arXiv: math-ph/0608014. Bibcode: 2006CSE.....8d..26O. DOI: 10.1109/MCSE.2006.68.
  8. Press. Numerical Recipes (en anglès). 3rd. Cambridge University Press, 2007. ISBN 978-0-521-88068-8. 
  9. D. Scott Birney. Observational Astronomy (en anglès). Cambridge University Press, 2006. ISBN 0-521-85370-2. 
  10. Hans P. A. Van Dongen Journal of Biological Rhythms, 14, 6, 1999, pàg. 617–620. DOI: 10.1177/074873099129000984. PMID: 10643760.
  11. Lomb, N. R. Astrophysics and Space Science, 39, 2, 1976, pàg. 447–462. Bibcode: 1976Ap&SS..39..447L. DOI: 10.1007/BF00648343.
  12. Scargle, J. D. Astrophysical Journal, 263, 1982, pàg. 835. Bibcode: 1982ApJ...263..835S. DOI: 10.1086/160554.
  13. David Brunt. The Combination of Observations (en anglès). 2a edició. Cambridge University Press, 1931. 
  14. Barning, F. J. M. Bulletin of the Astronomical Institutes of the Netherlands, 17, 1963, pàg. 22. Bibcode: 1963BAN....17...22B.
  15. Pascal Vincent; Yoshua Bengio Machine Learning, 48, 2002, pàg. 165–187. DOI: 10.1023/A:1013955821559 [Consulta: free].
  16. P. Vaníček Astrophysics and Space Science, 4, 4, 01-08-1969, pàg. 387–391. Bibcode: 1969Ap&SS...4..387V. DOI: 10.1007/BF00651344. OCLC: 5654872875.
  17. P. Vaníček Astrophysics and Space Science, 12, 1, 01-07-1971, pàg. 10–33. Bibcode: 1971Ap&SS..12...10V. DOI: 10.1007/BF00656134.
  18. Lomb, N. R. Astrophysics and Space Science, 39, 2, 1976, pàg. 447–462. Bibcode: 1976Ap&SS..39..447L. DOI: 10.1007/BF00648343.
  19. Scargle, J. D. Astrophysical Journal, 263, 1982, pàg. 835. Bibcode: 1982ApJ...263..835S. DOI: 10.1086/160554.
  20. Scargle, J. D. Astrophysical Journal, 263, 1982, pàg. 835. Bibcode: 1982ApJ...263..835S. DOI: 10.1086/160554.
  21. Wells, D.E., P. Vaníček, S. Pagiatakis, 1985. Least-squares spectral analysis revisited. Department of Surveying Engineering Technical Report 84, University of New Brunswick, Fredericton, 68 pages, Available at .
  22. Pascal Vincent; Yoshua Bengio Machine Learning, 48, 2002, pàg. 165–187. DOI: 10.1023/A:1013955821559 [Consulta: free].
  23. Lomb, N. R. Astrophysics and Space Science, 39, 2, 1976, pàg. 447–462. Bibcode: 1976Ap&SS..39..447L. DOI: 10.1007/BF00648343.
  24. P. Vaníček Astrophysics and Space Science, 4, 4, 01-08-1969, pàg. 387–391. Bibcode: 1969Ap&SS...4..387V. DOI: 10.1007/BF00651344. OCLC: 5654872875.