En l'àmbit matemàtic de l'àlgebra lineal, una matriu ortogonal és una matriu quadrada a coeficients reals, tal que les seves columnes (i files) són vectors unitaris ortogonals. Això és el mateix que dir que formen una base ortonormal i, per això, alguns autors les anomenen matrius ortonormals. És a dir,
on I és la matriu identitat.
Una altra manera de descriure les matrius ortogonals és que són les matrius quadrades invertibles a coeficients reals que tenen la seva matriu inversa igual a la seva matriu transposada:
- .
Una matriu ortogonal també és unitària (Q−1 = Q∗) i per tant normal (Q∗Q = QQ∗) sobre els reals. El determinant de qualsevol matriu ortogonal és +1 o −1.
Com a transformació lineal, una matriu ortogonal preserva el producte escalar i, per tant, actua com una isometria d'espais euclidians, com ara una rotació o una reflexió. En altres paraules, és una transformació unitària.
El conjunt O(n,K) de matrius n×n ortogonals a coeficients en un cos K
(on I és la matriu identitat n×n) forma un grup multiplicatiu anomenat grup ortogonal, que és subgrup del grup lineal GL(n,K).
El subgrup del grup ortogonal amb matrius de determinant 1 s'anomena grup ortogonal especial i es denota SO(n,K).
L'anàleg als nombres complexos de les matrius ortogonals són les matrius unitàries.
Generalitats
Una matriu ortogonal és la restricció als reals d'una matriu unitària, i per tant és també una matriu normal. Encara que aquest article tracta només de matrius reals, la definició es pot emprar per a matrius a entrades en qualsevol cos. Tanmateix, les matrius ortogonals sorgeixen de manera natural a partir dels productes interiors, i en el cas dels nombres complexos, la definició porta al concepte de les matrius unitàries. Les matrius ortogonals conserven el producte interior,[1] de tal manera que, per a vectors u, v qualssevol d'un espai euclidià real de dimensió n:
on Q és una matriu ortogonal. Per veure la connexió amb el producte interior, considerem un vector v d'un espai euclidià real de dimensió n. Escrit respecte a una base ortonormal, el quadrat de la longitud de v és vTv. Si una transformació lineal, en forma matricial escrita com Qv, conserva les longituds dels vectors, llavors
- .
Per tant, les isometries (rotacions, reflexions i les seves combinacions) lineals de dimensió finita produeixen matrius ortogonals. El recíproc també és cert: les matrius ortogonals impliquen transformacions ortogonals. Tot i això, l'àlgebra lineal inclou transformacions ortogonals entre espais que poden ser de dimensió infinita o bé de diferents dimensions, i en aquests casos no hi ha cap equivalent en l'àmbit de les matrius ortogonals.
Les matrius ortogonals són importants per diverses raons, tant teòriques com pràctiques. Les matrius ortogonals n×n formen un grup amb la multiplicació de matrius, el grup ortogonal denotat per O(n), el qual (juntament amb els seus subgrups) s'utilitza àmpliament en matemàtiques i en física. Per exemple, el grup puntual d'una molècula és un subgrup d'O(3). Com que les versions en coma flotant de les matrius ortogonals tenen propietats interessants, són un punt clau en molts algorismes d'àlgebra lineal numèrica, com en la descomposició QR. Un altre exemple és la normalització de la transformada cosinus discreta, utilitzada en la compressió MP3, que es representa mitjançant una matriu ortogonal.
Exemples
A continuació es presenten alguns exemples de matrius ortogonals, juntament amb les seves possibles interpretacions:
- Transformació identitat:
- Rotació de 16,26° (exemple d'una matriu de rotació):
- Reflexió respecte l'eix de les x:
- Rotoinversió: eix (0,-3/5,4/5), angle 90°:
- Permutació dels eixos coordenats:
- Matriu de Helmert de dimensió :[2]
S'utilitza en Estadística per fer una descomposició de la suma de quadrats en certes demostracions.
Construccions elementals
Dimensions inferiors
Les matrius ortogonals més simples són les matrius 1×1 i , que es poden interpretar, respectivament, com la identitat i una reflexió de la recta real respecte l'origen.
Les matrius 2 × 2 tenen la forma
- ,
on la ortogonalitat ve definida per les següents tres equacions:
Respecte la primera equació, podem escriure, sense pèrdua de generalitat, p = cos θ, q = sin θ; llavors es té t = −q, u = p o bé t = q, u = −p. Hom pot interpretar el primer cas com una rotació d'angle θ (on θ = 0 és la identitat), i el segon com una reflexió respecte una recta situada en un angle θ/2.
- (rotació), (reflexió)
El cas especial de la matriu de reflexió amb θ = 90° genera una reflexió respecte la recta situada a 45° donada per y = x i per tant intercanvia x i y; és una matriu permutació, amb un 1 a cada columna i fila (i 0 altrament):
La identitat també és una matriu permutació.
Una reflexió és la seva pròpia inversa, la qual cosa implica que una matriu de reflexió és simètrica (igual a la seva transposada), a més d'ortogonal. El producte de dues matrius de rotació és una matriu de rotació, i el producte de dues matrius de reflexió és també una matriu de rotació.
Dimensions superiors
Independentment de la dimensió, sempre és possible classificar les matrius ortogonals com a purament rotacionals o no, però per a matrius de dimensió 3 × 3 o superior, les matrius no rotacionals poden tenir una estructura més complicada que les simples reflexions. Per exemple,
representen una simetria respecte l'origen i una rotoinversió respecte l'eix de les z.
Les rotacions esdevenen més complicades en dimensions superiors; ja no es poden caracteritzar completament per un angle, i poden afectar més que un subespai pla. Hom acostuma a descriure una matriu de rotació 3 × 3 en termes d'un eix i un angle, però això només és suficient per a dimensió 3. En el cas de dimensió superior a 3, es necessiten dos o més angles, cadascun associat a un pla de rotació.
Tanmateix, hom pot establir operacions bàsiques per a permutacions, reflexions i rotacions, que es poden aplicar al cas general.
Primitives
La permutació més elemental és una transposició, obtinguda a partir de la matriu identitat, i intercanviant dues files. Qualsevol matriu de permutació n×n es pot construir com a producte de no més de n − 1 transposicions.
Una reflexió de Householder es construeix a partir d'un vector v no nul com:
- .
Aquí, el numerador és una matriu simètrica, mentre que el denominador és un nombre, el quadrat de la longitud de v. Això és una reflexió respecte l'hiperplà perpendicular a v. Si v és un vector unitari, llavors Q = I − 2vvT. Les reflexions de Householder s'acostumen a utilitzar per anul·lar la part inferior d'una columna. Qualsevol matriu ortogonal de dimensió n × n es pot construir com a producte de, com a molt, n reflexions de Householder.
Una rotació de Givens actua sobre un subespai bidimensional (pla) generat per dos eixos coordenats, i rotant un cert angle. S'acostuma a utilitzar per anul·lar una sola entrada de la subdiagonal d'una matriu. Qualsevol matriu de rotació de dimensió n×n es pot construir com a producte de, com a màxim, n(n − 1)/2 d'aquestes rotacions. En el cas de matrius 3 × 3, només són necessàries 3 rotacions; i ajustant la seqüpencia, hom pot descriure les matrius de rotació 3 × 3 (encara que no de manera unívoca) en termes dels 3 angles utilitzats, sovint anomenats angles d'Euler.
Una rotació de Jacobi té la mateixa forma que una rotació de Givens, però s'utilitza per anul·lar les dues entrades de fora de la diagonal d'una submatriu simètrica 2 × 2.
Propietats
Com a matrius
Una matriu quadrada real és ortogonal si i només si les seves columnes formen una base ortonormal de l'espai euclidià Rn amb el producte interior euclidià ordinari, que és el cas si i només si les seves files formen una base ortonormal de Rn. Contràriament al que es podria suposar, una matriu amb columnes ortogonals (no ortonormals) no formen una matriu ortogonal; només satisfan MTM = D, on D és una matriu diagonal.
El determinant de qualsevol matriu ortogonal és +1 o -1. Això és una conseqüència de les propietats dels determinants:
- .
El recíproc no és cert; si una matriu té determinant ±1, la matriu no té per què ser ortogonal, encara que les seves columnes siguin ortogonals, com mostra el següent contraexemple:
- .
En el cas de les matrius permutació, el determinant coincideix amb la paritat, que té un valor de +1 o −1 si la paritat de la permutació és, respectivament, parell o senar, ja que el determinant és una funció alternada de les seves files.
Addicionalment a la restricció del valor del determinant, una matriu ortogonal sempre és diagonalitzable sobre els nombres complexos, i els seus valors propis tenen tots mòdul 1.
Com a grup
La inversa d'una matriu ortogonal també és ortogonal, així com el producte de dues matrius ortogonals. De fet, el conjunt de totes les matrius ortogonals n × n satisfà tots els axiomes d'un grup. És un grup de Lie compacte de dimensió n(n − 1)/2, anomenat grup ortogonal, i denotat per O(n).
Les matrius ortogonals amb determinant +1 formen un subgrup normal arc-connex de O(n) d'índex 2, el grup ortogonal especial SO(n) de rotacions. El grup quocient O(n)/SO(n) és isomorf a O(1), on l'aplicació projecció és [+1] o [−1], segons el determinant, Les matrius ortogonals amb determinant -1 no inclouen la identitat, i per tant no formen un subgrup, sinó només una classe lateral; també és connex. Així, cada group ortogonal té dues components; i com que l'aplicació de projecció configura una successió exacta, O(n) és un producte semidirecte de SO(n) per O(1). A la pràctica, hom pot reformular aquests resultats dient que tota matriu ortogonal es pot generar prenent una matriu de rotació i possiblement canviant de signe una de les seves columnes. Si n és senar, llavors el producte semidirecte és, de fet, un producte directe, i qualsevol matriu ortogonal es pot formar a partir d'una matriu de rotació i possiblement canviant de signe totes les seves columnes. Això és una conseqüència de la propietat dels determinats: si es canvia de signe una columna, es canvia el signe del determinant, i si el canvia de signe un nombre senar de columnes, també es canvia de signe la totalitat del determinant.
Considerem ara les matrius ortogonals (n + 1) × (n + 1) on l'entrada inferior dreta és igual a 1. La resta de l'última columna (i de l'última fila) han de ser zeros, i el producte de dues matrius d'aquesta forma també compleix aquesta propietat. La resta de la matriu és una matriu ortogonal n × n; així, O(n) és un subgrup de O(n + 1) (i de tots els grups superiors).
Com que una reflexió elemental en forma de matriu de Householder pot reduir qualsevol matriu ortogonal a aquesta forma definida, una successió d'aquestes reflexions pot transformar una matriu ortogonal en la matriu identitat; per tant, un grup ortogonal és un grup de reflexions. Es pot fixar l'última columna que sigui un vector ubitat qualsevol, i cada elecció proporciona una còpia diferent de O(n) dins O(n + 1); així, O(n + 1) és un fibrat sobre l'esfera unitat Sn amb la fibra O(n).
Anàlogament, SO(n) és un subgrup de SO(n + 1); i qualsevol matriu ortogonal especial es pot generar mitjançant rotacions planes de Givens emprant un procediment similar. L'estructura del fibrat es conserva: SO(n) ↪ SO(n + 1) → Sn. Una rotació dona com a resultat un 0 en la primera fila de l'última columna, i una successió de n−1 rotacions fa 0 les entrades de l'última columna (excepte l'última fila) d'una matriu de rotació n × n. Com que els plans estan fixats, cada rotació només té un grau de llibertat, el seu angle. Per inducció, SO(n) té
graus de llibertat, i O(n) en té el mateix nombre.
Les matrius de permutacions són més simples; no formen un grup de Lie, sinó un grup finit, el grup simètric Sn d'ordre n!. Pel mateix argument, Sn és un subgrup de Sn+1. Les permutacions parelles configuren el subgrup de les matrius permutació amb determinant +1, el grup alternant d'ordre n!/2.
Més en general, l'efecte de qualsevol matriu ortogonal realitza dues accions separades sobre subespais ortogonals de dimensió 2. És a dir, si Q és ortogonal especial, llavors hom pot trobar una matriu ortogonal P, un canvi de base (rotacional), que transforma Q a una forma diagonal per blocs:
- (n parell), (n senar),
on les matrius R1, ..., Rk són matrius rotació 2 × 2, i on la resta d'entrades valen 0. Excepcionalment, un bloc de rotació pot ser diagonal, ±I. Així, canviant de signe una columna, si és necessari, i notant que una reflexió 2 × 2 diagonalitza a +1 i −1, tota matriu ortogonal es pot transformar en la forma
Les matrius R1, ..., Rk proporcionen parells conjugats de valors propis que pertanyen a la circumferència unitària en el pla complex; per tant, aquesta descomposició confirma que tots els valors propis tenen valor absolut 1. Si n és senar, hi ha almenys un valor propi real, +1 o −1; per a una rotació 3 × 3, el vector propi associat amb el valor propi +1 és l'eix de rotació.
Àlgebra de Lie
Suposem que les entrades de Q són funcions diferenciables de t, i que per a t = 0 tenim Q = I. Diferenciant la condició d'ortogonalitat tenim ( representa la diferenciació respecte t):
- .
Avaluant a t = 0 (Q = I) tenim:
- .
En termes de grups de Lie, això significa que l'àlgebra de Lie d'un grup de matrius ortogonals consisteix en matrius antisimètriques. En l'altre sentit, la matriu exponencial de qualsevol matriu antisimètrica és una matriu ortogonal (de fet, ortogonal especial).
Per exemple, l'objecte de la física tridimensional anomenat velocitat angular és una rotació diferencial, i per tant és un vector de l'àlgebra de Lie tangent a SO(3). Donat ω = (xθ, yθ, zθ), amb v = (x, y, z) un vector unitari, la forma matricial antisimètrica correcta de ω és:
L'exponencial d'aquesta expressió és la matriu ortogonal per a la rotació al voltant de l'eix v d'angle θ; si escrivim c = cos θ/2, s = sin θ/2,
Àlgebra lineal numèrica
Beneficis
L'anàlisi numèrica aprofita moltes de les propietats de les matrius ortogonals per al desenvolupament de l'àlgebra lineal numèrica. Per exemple, sovint és desitjable calcular una base ortonormal per a un espai, o un canvi de bases ortogonal; tots dos problemes prenen la forma de matrius ortogonals. El fet que les matrius ortogonals tinguin determinant ±1 i que tots els seus valors propis tinguin mòdul 1 és de gran ajuda pel que respecta a l'estabilitat numèrica. Una implicació és que el nombre de condició és 1 (que és el mínim possible), amb la qual cosa els errors de càlcul no es magnifiquen quan es multiplica per una matriu ortogonal. Per aquest motiu, molts algorismes utilitzen matrius ortogonals com és reflexions de Householder o les rotacions de Givens. També és de gran ajuda que una matriu ortogonal no només és invertible, sinó que el seu càlcul és extremadament senzill (només cal transposar-la).
Les permutacions són essencials per a l'èxit de molts algorismes, incloent la costosa eliminació gaussiana amb pivotatge parcial (on les permutacions realitzen el pivotatge). Tanmateix, rarament apareixen explícitament com a matrius; la seva forma especial permet representar-les d'una manera més eficient, com una llista d'n índexs.
Anàlogament, els algorismes que utilitzen matrius de Householder i de Givens acostumen a utilitzar mètodes específics per a la multiplicació i l'emmagatzematge. Per exemple, una rotació de Givens afecta només dues files de la matriu que multiplica, passant així d'una multiplicació completa d'ordre n3 a una multiplicació molt més eficient d'ordre n.
Descomposicions
Moltes descomposicions de matrius tenen a veure amb matrius ortogonals, entre elles:
- Descomposició QR
- M = QR, amb Q ortogonal, i R triangular superior.
- Descomposició en valors singulars
- M = UΣVT, on U i V són ortogonals, i Σ és diagonal no negativa.
- Descomposició en valors propis d'una matriu simètrica (descomposició segons el teorema espectral)
- S = QΛQT, amb S simètrica, Q ortogonal, i Λ diagonal.
- Descomposició polar
- M = QS, amb Q ortogonal, i S simètrica i definida no negativa.
Exemples
Considerem un sistema d'equacions lineals sobredeterminat, com per exemple en el cas de mesuraments repetits d'un fenomen físic, per tal de compensar els errors experimentals. Escrivim Ax = b, on A és m × n, m > n.
Una descomposició QR redueix A a una matriu triangular superior R. Per exemple, si A és 5 × 3, llavors R té la forma
El problema dels mínims quadrats consisteix a trobar x que minimitzi ‖Ax − b‖, la qual cosa és equivalent a projectar b al subespai generat per les columnes de A. Suposant que les columnes de A (i, per tant, també de R) són independents, la solució projecció es pot trobar resolent ATAx = ATb. Ara, ATA és quadrada (n × n) i invertible, i també és igual a RTR. Però els zeros de la part inferior de R no intervenen en el producte, que per tant també té una factorització en un component triangular inferior i un altre de triangular superior, com en l'eliminació gaussiana (factorització de Cholesky). Aquí, la propietat de ser ortogonal és important no només per reduir ATA = (RTQT)QR a RTR, sinó també per poder trobar una solució sense magnificar els errors numèrics.
En el cas que un sistema lineal sigui subdeterminat, o bé tinguem una matriu no invertible, també és útil la descomposició en valors singulars. Si factoritzem A com UΣVT, una solució adient utilitza la pseudoinversa de Moore-Penrose, VΣ+UT, on Σ+ substitueix cada entrada no nul·la de la diagonal amb el seu recíproc. Llavors x és igual a VΣ+UTb.
El cas d'una matriu quadrada invertible també té interès. Suposem, per exemple, que A és una matriu rotació 3 × 3 calculada mitjançant diverses rotacions. L'aritmètica en coma flotant introdueix erros numèrics en el procés de càlcul, així que A ha perdut gradualment la seva ortogonalitat. Una aplicació del procés de Gram-Schmidt podria ortogonalitzar les seves columnes, pèro no és el procediment més fiable, ni el més efiicent, ni el més invariant. La descomposició polar factoritza una matriu en dos factors, un dels quals és l'única matriu ortogonal més propera a la matriu donada, o una de les més properes si la matriu original és singular (hom pot donar una mesura de proximitat mitjançant qualsevol norma matricial invariant per un canvi ortogonal de bae, com la norma espectral o la norma de Frobenius). Per a una matriu quasiortogonal, hom pot aconseguir una convergència ràpida al factor ortogonal, aplicant un "mètode de Newton" creat per Higham (1986) (1990), que pren repetidament la mitjana de la matriu amb la seva inversa transposada. Dubrulle (1994) ha publicat un mètode d'acceleració amb un test de convergència.
Per exemple, considerem una matriu no ortogonal per al qual l'algorisme inicial requereix 7 passos:
i que l'acceleració el redueix a 2 passos (amb γ = 0,353553; 0,565685).
Gram-Schmidt proporciona una solució pitjor, ja que dona una distància de Frobenius de 8,28659 en comptes del mínim 8,12404.
Aleatorització
Algunes aplicacions numèriques, com els mètodes de Montecarlo i l'exploracio d'espais de dades de dimensions superiors, requereixen la generació de matrius ortogonals aleatòries amb distribució uniforme. En aquest context, es defineix "uniforme" en termes de la mesura de Haar, que essencialment requereix que la distribució no canviï si es multuplica per qualsevol matriu ortogonal escollida lliurement. El procés d'ortogonalització de matrius amb entrades aleatòries distribuïdes uniformement de manera independent no proporciona un conjunt de matrius ortogonals distribuïdes uniformement,[cal citació] però la descomposició QR d'entrades aleatòries normalment sí que ho fa, sempre que la diagonal de R contingui només entrades positives. Stewart (1980) va substituir aquesta idea amb una de més eficient que posteriorment Diaconis & Shahshahani (1987) va generalitzar com l'"algorisme de subgrups". Per generar una matriu ortogonal (n + 1) × (n + 1), hom pren una matriu ortogonal n × n i un vector unitari uniformement distribuït de dimensió n + 1. Es construeix una reflexió de Householder a partir del vector, i s'aplica a la matriu petita (submergida en la matriu gran amb una entrada 1 a la cantonada inferior dreta).
Matriu ortogonal més propera
El problema de trobar la matriu ortogonal més propera a una matriu donada està relacionat al problema de Procustes ortogonal. Existeixen diferents mètodes per tal d'arribar a l'única solució; el més simple és prendre la descomposició en valors singulars de i substituir els valors singulars amb valors 1. Un altre mètode expressa la solució de manera explícita, però necessita l'ús d'una arrel quadrada d'una matriu:[4]
Això es pot combinar amb el mètode babilònic per extraure l'arrel quadrada d'una matriu, per tal de donar una recurrència que convergeixi a una matriu ortogonal en temps quadràtic:
on . Aquestes iteracions són estables sempre que el nombre de condició de sigui més petit que 3.[5]
Matrius rectangulars
Si Q no és una matriu quadrada, llavors les condicions QTQ = I i QQT = I no són equivalents. La condició QTQ = I significa que les columnes de Q són ortonormals. Això només pot succeir si Q és una matriu m × n amb n ≤ m. Anàlogament, QQT = I significa que les files de Q són ortonormals, la qual cosa necessita que n ≥ m.
No existeix una terminologia homogènia per a aquest tipus de matrius. De vegades se les anomena "matrius ortonormals", de vegades "matrius ortogonals" i de vegades simplement "matrius amb files/columnes ortonormals".
Referències
- ↑ Vujičić, Milan. Jeffrey Sanderson (editor). Linear Algebra Thoroughly Explained. Springer-Verlag Berlin Heidelberg, 2008, p. 228. DOI 10.1007/978-3-540-74639-3. ISBN 978-3-642-09410-1.
- ↑ Seber, G. A. F.. A Matrix Handbook for Statisticians. Hoboken, N.J.: Wiley-Interscience, 2008, p. 149. ISBN 978-0-470-22678-0.
- ↑ Horn, Berthold K. P. «Finding the Nearest Orthonormal Matrix» (pdf). MIT. [Consulta: 26 juny 2016].
- ↑ Higham, Nicholas J. «Newton's Method for the Matrix Square Root». Mathematics of Computation, 46, 174, 1986.
Bibliografia
- Diaconis, Persi; Shahshahani, Mehrdad «The subgroup algorithm for generating uniform random variables». Prob. In Eng. And Info. Sci., 1, 1987, pàg. 15–32. DOI: 10.1017/S0269964800000255. ISSN: 0269-9648.
- Dubrulle, Augustin A. «An Optimum Iteration for the Matrix Polar Decomposition». Elect. Trans. Num. Anal., 8, 1999, pàg. 21–25.
- Golub, Gene H.; Van Loan, Charles F. Matrix Computations. 3/e. Baltimore: Johns Hopkins University Press, 1996. ISBN 978-0-8018-5414-9.
- Higham, Nicholas «Computing the Polar Decomposition—with Applications». SIAM Journal on Scientific and Statistical Computing, 7, 4, 1986, pàg. 1160–1174. DOI: 10.1137/0907079. ISSN: 0196-5204.
- Higham, Nicholas; Schreiber, Robert «Fast polar decomposition of an arbitrary matrix». SIAM Journal on Scientific and Statistical Computing, 11, 4, 7-1990, pàg. 648–655. DOI: 10.1137/0911038. ISSN: 0196-5204.
- Stewart, G. W. «The Economical Storage of Plane Rotations». Numerische Mathematik, 25, 2, 1976, pàg. 137–138. DOI: 10.1007/BF01462266. ISSN: 0029-599X.
- Stewart, G. W. «The Efficient Generation of Random Orthogonal Matrices with an Application to Condition Estimators». SIAM J. Numer. Anal., 17, 3, 1980, pàg. 403–409. DOI: 10.1137/0717034. ISSN: 0036-1429.
Vegeu també
Enllaços externs