Anàlisi independent de components

ICA en quatre vídeos barrejats aleatòriament.[1] Fila superior: els vídeos originals. Fila del mig: quatre mescles aleatòries utilitzades com a entrada a l'algorisme. Fila inferior: els vídeos reconstruïts.

En el processament del senyal, l'anàlisi de components independents (ICA) és un mètode computacional per separar un senyal multivariant en subcomponents additius. Això es fa assumint que com a màxim un subcomponent és gaussià i que els subcomponents són estadísticament independents els uns dels altres.[2] L'ICA va ser inventat per Jeanny Hérault i Christian Jutten el 1985. ICA és un cas especial de separació de fonts cegues. Un exemple comú d'aplicació d'ICA és el "problema del còctel" d'escoltar el discurs d'una persona en una habitació sorollosa.[3]

Introducció

L'anàlisi de components independents intenta descompondre un senyal multivariant en senyals independents no gaussians. Com a exemple, el so sol ser un senyal que es compon de l'addició numèrica, en cada moment t, de senyals de diverses fonts. Aleshores, la pregunta és si és possible separar aquestes fonts contribuents del senyal total observat. Quan la hipòtesi d'independència estadística és correcta, la separació cega ICA d'un senyal mixt dona molt bons resultats. També s'utilitza per a senyals que se suposa que no s'han de generar mitjançant la barreja amb finalitats d'anàlisi.

Una aplicació senzilla de l'ICA és el "problema del còctel", on els senyals de parla subjacents es separen d'una mostra de dades que consisteix en persones que parlen simultàniament en una habitació. En general, el problema es simplifica en assumir que no hi ha retards ni ecos. Tingueu en compte que un senyal filtrat i retardat és una còpia d'un component dependent i, per tant, no es viola el supòsit d'independència estadística.

Barreja de pesos per construir el senyals observats de la els components es poden col·locar en un matriu. Una cosa important a tenir en compte és que si les fonts estan presents, almenys es necessiten observacions (per exemple, micròfons si el senyal observat és d'àudio) per recuperar els senyals originals. Quan hi ha un nombre igual d'observacions i senyals font, la matriu de mescla és quadrada (). Altres casos de subdeterminació () i sobredeterminat () han estat investigats.

L'èxit de la separació ICA de senyals mixtes es basa en dos supòsits i tres efectes de la barreja de senyals font. Dos supòsits:

  1. Els senyals font són independents entre si.
  2. Els valors de cada senyal font tenen distribucions no gaussianes.

Tres efectes de la barreja de senyals font:

  1. Independència: segons el supòsit 1, els senyals font són independents; tanmateix, les seves barreges de senyals no ho són. Això es deu al fet que les barreges de senyal comparteixen els mateixos senyals font.
  2. Normalitat: Segons el teorema central del límit, la distribució d'una suma de variables aleatòries independents amb variància finita tendeix a una distribució gaussiana. En termes generals, una suma de dues variables aleatòries independents sol tenir una distribució més propera a la gaussiana que qualsevol de les dues variables originals. Aquí considerem el valor de cada senyal com a variable aleatòria.
  3. Complexitat: la complexitat temporal de qualsevol barreja de senyal és més gran que la del seu senyal font constituent més simple.

Aquests principis contribueixen a l'establiment bàsic de l'ICA. Si els senyals extrets d'un conjunt de mescles són independents i tenen distribucions no gaussianes o tenen poca complexitat, llavors han de ser senyals font.[4][5]

Aplicacions

Anàlisi independent de components en EEGLAB

L'ICA es pot estendre per analitzar senyals no físics. Per exemple, s'ha aplicat l'ICA per descobrir temes de discussió en una bossa d'arxius de llistes de notícies.

Algunes aplicacions ICA s'enumeren a continuació:[6]

  • Imatge òptica de neurones[7]
  • classificació d'espigues neuronals [8]
  • reconeixement facial[9]
  • modelar els camps receptius de les neurones visuals primàries[10]
  • predicció dels preus de la borsa[11]
  • comunicacions de telefonia mòbil[12]
  • detecció basada en el color de la maduració dels tomàquets[13]
  • eliminació d'artefactes, com ara parpelleig, de les dades d'EEG.[14]
  • predir la presa de decisions mitjançant EEG[15]
  • anàlisi dels canvis en l'expressió gènica al llarg del temps en experiments de seqüenciació d'ARN unicel·lular.[16]
  • Estudis de la xarxa d'estats de repòs del cervell.[17]
  • astronomia i cosmologia[18]
  • finances[19]

Referències

  1. Isomura, Takuya; Toyoizumi, Taro Scientific Reports, 6, 2016, pàg. 28073. Bibcode: 2016NatSR...628073I. DOI: 10.1038/srep28073. PMC: 4914970. PMID: 27323661.
  2. «Independent Component Analysis: A Demo» (en anglès).
  3. Hyvärinen, Aapo Philosophical Transactions: Mathematical, Physical and Engineering Sciences, 371, 1984, 2013, pàg. 20110534. Bibcode: 2012RSPTA.37110534H. DOI: 10.1098/rsta.2011.0534. ISSN: 1364-503X. JSTOR: 41739975. PMC: 3538438. PMID: 23277597.
  4. Stone, James V. Independent component analysis : a tutorial introduction (en anglès). Cambridge, Massachusetts: MIT Press, 2004. ISBN 978-0-262-69315-8. 
  5. Hyvärinen, Aapo. Independent component analysis (en anglès). 1st. New York: John Wiley & Sons, 2001. ISBN 978-0-471-22131-9. 
  6. Stone, James V. Independent component analysis : a tutorial introduction (en anglès). Cambridge, Massachusetts: MIT Press, 2004. ISBN 978-0-262-69315-8. 
  7. Brown, GD; Yamada, S; Sejnowski, TJ Trends in Neurosciences, 24, 1, 2001, pàg. 54–63. DOI: 10.1016/s0166-2236(00)01683-0. PMID: 11163888.
  8. Lewicki, MS Network: Computation in Neural Systems, 9, 4, 1998, pàg. 53–78. DOI: 10.1088/0954-898X_9_4_001.
  9. Barlett, MS. Face image analysis by unsupervised learning. Boston: Kluwer International Series on Engineering and Computer Science, 2001. 
  10. Bell, AJ; Sejnowski, TJ Vision Research, 37, 23, 1997, pàg. 3327–3338. DOI: 10.1016/s0042-6989(97)00121-1. PMC: 2882863. PMID: 9425547.
  11. Back, AD; Weigend, AS International Journal of Neural Systems, 8, 4, 1997, pàg. 473–484. DOI: 10.1142/s0129065797000458. PMID: 9730022.
  12. Hyvarinen, A, Karhunen, J & Oja, E. Independent component analysis (en anglès). New York: John Wiley and Sons, 2001a. 
  13. Polder, G; van der Heijen, FWAM Austrian Computer Society, 2003, pàg. 57–64.
  14. Delorme, A; Sejnowski, T; Makeig, S NeuroImage, 34, 4, 2007, pàg. 1443–1449. DOI: 10.1016/j.neuroimage.2006.11.004. PMC: 2895624. PMID: 17188898.
  15. Douglas, P Frontiers in Human Neuroscience, 7, 2013, pàg. 392. DOI: 10.3389/fnhum.2013.00392. PMC: 3728485. PMID: 23914164 [Consulta: free].
  16. Trapnell, C; Cacchiarelli, D; Grimsby, J Nature Biotechnology, 32, 4, 2014, pàg. 381–386. DOI: 10.1038/nbt.2859. PMC: 4122333. PMID: 24658644.
  17. Kiviniemi, Vesa J.; Kantola, Juha-Heikki; Jauhiainen, Jukka; Hyvärinen, Aapo; Tervonen, Osmo NeuroImage, 19, 2, 2003, pàg. 253–260. DOI: 10.1016/S1053-8119(03)00097-1. PMID: 12814576.
  18. Wang, Jingying; Xu, Haiguang; Gu, Junhua; An, Tao; Cui, Haijuan The Astrophysical Journal, 723, 1, 01-11-2010, pàg. 620–633. arXiv: 1008.3391. Bibcode: 2010ApJ...723..620W. DOI: 10.1088/0004-637X/723/1/620. ISSN: 0004-637X [Consulta: free].
  19. Moraux, Franck. «The dynamics of the term structure of interest rates: An Independent Component Analysis». A: Connectionist Approaches in Economics and Management Sciences (en anglès). 6, 2003, p. 215–232 (Advances in Computational Management Science). DOI 10.1007/978-1-4757-3722-6_11. ISBN 978-1-4757-3722-6.