Matrixexponential

In der Mathematik ist das Matrixexponential, auch als Matrixexponentialfunktion bezeichnet eine Matrixfunktion, welche analog zur gewöhnlichen (skalaren) Exponentialfunktion definiert ist. Das Matrixexponential stellt die Verbindung zwischen Lie-Algebra und der zugehörigen Lie-Gruppe her.

Definition

Sei eine reelle oder komplexe -Matrix. Das Exponential von , welches mit oder bezeichnet wird, ist die -Matrix, welche durch die folgende Potenzreihe definiert ist (Taylor-Entwicklung):

.

Diese Reihe konvergiert, genauso wie die der gewöhnlichen Exponentialfunktion, immer. Daher ist das Exponential von wohldefiniert. Wenn eine -Matrix ist, entspricht das Matrixexponential von der gewöhnlichen Exponentialfunktion. Eine Verallgemeinerung, welche auch für unendliche Matrizen sinnvoll ist, ist die Exponentialfunktion auf beliebigen Banachalgebren.

Eigenschaften

Das Matrixexponential teilt eine Reihe der Eigenschaften der gewöhnlichen Exponentialfunktion. Beispielsweise ist das Exponential der -Nullmatrix gleich der -Einheitsmatrix :

.

Für beliebige komplexe -Matrizen und beliebige komplexe Zahlen und gilt

.

Daraus folgt

,

das heißt

.

Dabei bezeichnet die zu inverse Matrix.

Die Exponentialfunktion erfüllt für alle Zahlen und . Dasselbe gilt für kommutierende Matrizen und , das heißt, aus

folgt

.

Für nichtkommutierende Matrizen stimmt diese Gleichung im Allgemeinen nicht. In diesem Fall kann man mit Hilfe der Baker-Campbell-Hausdorff-Formel berechnen.

Das Exponential der zu transponierten Matrix ist gleich der Transposition des Exponentials von :

Daraus folgt, dass die Matrixexponentialfunktion symmetrische Matrizen auf symmetrische Matrizen und schiefsymmetrische Matrizen auf orthogonale Matrizen abbildet. Analog gilt zwischen Adjunktion und Exponentiation die Beziehung

,

so dass die Matrixexponentialfunktion hermitesche Matrizen auf hermitesche Matrizen und schiefhermitesche Matrizen auf unitäre Matrizen abbildet.

Weiterhin gelten:

  • Wenn invertierbar ist, dann ist .
  • , hier bezeichnet die Spur der quadratischen Matrix .
  • .

Die Exponentialabbildung

Das Exponential einer Matrix ist immer eine invertierbare Matrix. Die Inverse von ist durch gegeben. Das (komplexe) Matrixexponential liefert somit eine Abbildung

aus dem Vektorraum aller (komplexen) -Matrizen in die allgemeine lineare Gruppe, die Gruppe aller (komplexen) invertierbaren Matrizen. Diese Abbildung ist kein Gruppenhomomorphismus auf der gesamten Gruppe , aber auf jeder Untergruppe, deren Matrizen multiplikativ miteinander kommutieren. Des Weiteren ist sie surjektiv, das heißt, jede (reelle oder komplexe) invertierbare Matrix kann als die Exponentialmatrix einer komplexen Matrix geschrieben werden. Urbilder (bzw. lokale Schnitte) lassen sich durch Matrixlogarithmen berechnen.

Für je zwei Matrizen und gilt

,

wobei eine beliebige Matrixnorm bezeichnet. Daraus folgt, dass die Exponentialabbildung stetig und auf kompakten Teilmengen von sogar lipschitzstetig ist. Für die Norm des Matrixexponentials selbst gibt es aber eine präzisere Schranke

mit der logarithmischen Matrixnorm und dem numerischen Wertebereich.

Die Zuordnung

definiert eine glatte Kurve in der allgemeinen linearen Gruppe, welche für die Einheitsmatrix liefert. Dies liefert eine Einparameter-Untergruppe der allgemeinen linearen Gruppe, da

gilt. Die Ableitung dieser Funktion im Punkt ist durch

gegeben. Die Ableitung für ist gerade die Matrix , das heißt, erzeugt diese Einparameter-Untergruppe.

Allgemeiner gilt:

Beispiele von Lie-Algebren und zugehörigen Lie-Gruppen

Lie-Gruppe Beispiel
Allgemeine lineare Gruppe

.

Orthogonale Gruppe

Unitäre Gruppe

Spezielle unitäre Gruppe
wird von surjektiv auf
abgebildet.
Spezielle orthogonale Gruppe
(schiefsymmetrische Matrizen)
wird von surjektiv auf abgebildet.
Spezielle lineare Gruppe
wird von nicht surjektiv auf abgebildet.
Notorisches Gegenbeispiel mit liegt nicht im Bild von .

Aus dem letzten Beispiel ist ersichtlich, dass die Exponentialabbildung für die Erzeugung von Lie-Gruppen (je nach Lie-Algebra) im Allgemeinen nicht surjektiv ist.

Lineare Differentialgleichungen

Einer der Vorzüge des Matrixexponentials ist, dass man es benutzen kann, um Systeme von linearen gewöhnlichen Differentialgleichungen zu lösen, die z. B. für das Zustandsraummodell von dynamischen Übertragungssystemen verwendet werden. Aus Gleichung (1) oben folgt zum Beispiel, dass die Lösung des Anfangswertproblems

mit einer quadratischen Matrix durch

gegeben ist.

Das Matrixexponential kann auch zur Lösung der inhomogenen Gleichung

,

verwendet werden. Beispiele findet man unten im Kapitel Anwendungen.

Für Differentialgleichungen der Form

mit nicht-konstantem gibt es im Allgemeinen keine geschlossenen Lösungen. Die Magnus-Reihe liefert jedoch eine allgemeine Lösung in Matrixschreibweise über die Matrix-Exponentialfunktion auch im Fall nicht-konstanter Koeffizienten (als unendliche Reihe des Exponenten).[1]

Berechnung des Matrixexponentials

Taylor-Reihe

Die Exponentialfunktion der Matrix und kann prinzipiell über ihre Taylor-Entwicklung berechnet werden:

Hierbei bezeichnet die Fakultät von . Bei ausreichender Genauigkeit (Reihe ist absolut konvergent) soll die Reihe bei einer endlichen Zahl an Berechnungsschritten abbrechen. Je größer die Einträge der Matrix sind, desto mehr Glieder der Reihe müssen aber berechnet werden (z. B. für die Lösung der linearen DGL für einen großen Zeitschritt). Um den Lösungsalgorithmus dahingehend zu verbessern, kann man die Einträge der Matrix mittels der Rechenregel elegant skalieren ("Scaling & Squaring"-Methode). Ist die (natürliche-) Matrixnorm nicht zu groß, kann die Berechnung der Reihe auch über die Padé-Approximation erfolgen. Die Scaling & Squaring-Methode hat einen Aufwand der Größenordnung (im Wesentlichen Matrizenmultiplikationen). Der Faktor von ist abhängig von den Skalierungsparametern sowie insbesondere von der Matrixnorm.

Nilpotenter Fall

Eine Matrix ist nilpotent, wenn für eine geeignete natürliche Zahl gilt. In diesem Fall bricht die Reihenentwicklung von nach einer endlichen Anzahl von Termen ab und das Matrixexponential kann als

berechnet werden.

Diagonalisierung der Matrix

Ist die Matrix eine Diagonalmatrix

,

dann kann man ihr Exponential ermitteln, indem man die gewöhnliche Exponentialfunktion auf jeden Eintrag der Hauptdiagonalen anwendet:

.

Damit kann man auch das Exponential einer diagonalisierbaren Matrix berechnen. Zur Diagonalisierung

mit einer Diagonalmatrix werden die zugehörige Eigenbasis sowie die Eigenwerte der Matrix bestimmt. Für die Matrix-Exponentialfunktion folgt daraus

mit der skalaren Exponentialfunktion . Der Beweis folgt direkt aus der Taylor-Entwicklung der Exponentialfunktion.

Die Diagonalisierung der Matrix gehört, wie auch der QR-Algorithmus oder die Jordansche Normalform, zu den Matrix-Zerlegungsmethoden zur Berechnung der Exponentialfunktion. Die Diagonalisierung und der QR-Algorithmus haben dabei jeweils einen Aufwand der Größenordnung und sind aber, im Vergleich zu Methoden auf Basis der Taylor-Entwicklung, unabhängig von . Der wesentliche Berechnungsaufwand (hier: Bestimmung der Eigenwerte und Eigenvektoren) ist zudem unabhängig von der Variablen . Zur Lösung beispielsweise von linearen Differentialgleichungen für mehrere Zeitschritte muss dieser Arbeitsaufwand also nur einmalig erbracht werden. Die Berechnung der weiteren Zeitschritte erfolgt bei der Methode Diagonalisierung durch einfache Matrizenmultiplikation und bei dem QR-Algorithmus liegt der Aufwand in der Größenordnung von nur noch .

Beispiel 1

Es soll das Matrixexponential für die folgende Matrix berechnet werden:

.

Hierzu wird die -Matrix zunächst mittels der Eigenwerte und den Eigenvektoren diagonalisiert. Mit der Diagonalmatrix und der Eigenbasis folgt:

.

Die Eigenwerte werden aus dem charakteristischen Polynom bestimmt zu

.

Für die beiden Eigenvektoren bzw. die Eigenbasis gilt:

sowie

Einsetzen für die Matrix-Exponentialfunktion liefert schließlich

als geschlossene analytische Lösung.[2]

Beispiel 2

Die Matrix-Exponentialfunktion

kann explizit berechnet werden, jedoch ist die Matrix selbst nicht diagonalisierbar. Die Matrix besitzt die beiden Eigenwerte . Obwohl also der Eigenwert die algebraische Vielfachheit 2 hat, existiert nur ein linear unabhängiger Eigenvektor. Die Basis aus den Eigenvektoren

ist nicht invertierbar. Die Diskriminante des charakteristischen Polynoms

wird dabei immer null. In diesem Fall, also wenn gleiche Eigenwerte bzw. Eigenvektoren vorkommen, kann formell die Jordansche Normalform zur Transformation verwendet werden.

Splitting-Methode

Zerfällt das Minimalpolynom (bzw. das charakteristische Polynom) der Matrix in Linearfaktoren (über ist das stets der Fall), dann kann eindeutig in eine Summe

zerlegt werden, wobei

  • diagonalisierbar ist,
  • nilpotent ist und
  • mit kommutiert (d. h. ).

Damit kann man das Exponential von berechnen, indem man es auf die vorgenannten Fälle reduziert: . Im letzten Schritt benötigt man die Kommutativität von und .

Verwendung der jordanschen Normalform

Eine weitere Methode ist die Verwendung der jordanschen Normalform von , wobei auch die Splitting-Methode zum Einsatz kommt. Sei die jordansche Normalform von mit der Basiswechselmatrix , dann gilt

Wegen

gilt

Daher muss man nur das Exponential eines Jordan-Blocks kennen. Nun ist jeder Jordan-Block von der Form

wobei eine spezielle nilpotente Matrix ist. Das Exponential des Jordan-Blocks ist also

Beispiel

Man betrachte die Matrix

,

welche die jordansche Normalform

mit der Übergangsmatrix

hat. Dann gelten

und

.

Somit ist

.

Das Exponential einer 1×1-Matrix ist trivial. Mit folgt

Die jordansche Normalform und daraus das Exponential zu berechnen, ist auf diesem Weg sehr mühsam. Meist reicht es, die Wirkung der Exponential-Matrix auf einige Vektoren zu berechnen.

Numerische Berechnung

Die Jordan-Normalform-Zerlegung ist numerisch instabil, da aufgrund der Gleitkommaarithmetik Rundungsfehler in die Eigenwerte eingeführt werden, die eine Gruppierung der Eigenwerte in Gruppen identischer Eigenwerte unmöglich macht. Daher werden in der Numerik andere Techniken zur Berechnung des Matrixexponentials verwendet. Zu den effektivsten verfügbaren Algorithmen gehören die Padé-Approximation mit Skalieren und Quadrieren (s. Berechnung mittels Taylorreihe) oder die Matrix-Zerlegungsmethoden wie die Diagonalisierung der Matrix. Bei großen Matrizen kann der Rechenaufwand auch reduziert werden, indem Krylowräume verwendet werden, deren Basisvektoren mit dem Arnoldi-Verfahren orthogonalisiert worden sind.

Explizite Formeln

Mittels der Diagonalisierung über die Eigenwerte und Eigenvektoren ist die Darstellung der Matrix-Exponentialfunktion einer -Matrix auch als explizite Formel möglich. Insbesondere der Umweg über die teils komplexen Eigenwerte ist damit nicht mehr notwendig:[3]

Für die Hilfsfunktion gilt in Abhängigkeit der reellen, komplexen, oder gleichen Eigenwerte (anhand der Diskriminante des charakteristischen Polynoms):

Putzer-Algorithmus

Eine weitere Möglichkeit, das Matrixexpontial zu berechnen, ist der Putzer-Algorithmus. Dabei definiert man bei gegebener Matrix und rekursiv stetig-differenzierbare Funktion und Matrizen , so dass gilt:

Die Lösung des Matrixexponentials einer -Matrix wird hierbei als Polynom erhalten. Die Berechnung hat dabei einen Aufwand der Größenordnung (Berechnung der Eigenwerte sowie insbesondere Matrizenmultiplikationen) und eignet sich daher eher nur für kleine Matrizen.

Anwendungen

Homogene lineare Differentialgleichungen

Das Matrixexponential kann für die Lösung eines Systems von linearen Differentialgleichungen verwendet werden. Eine Differentialgleichung der Form

hat die Lösung . Wenn man den Vektor

betrachtet, dann kann man ein System von gekoppelten linearen Differentialgleichungen betrachten als

.

Wenn man den Integrationsfaktor ansetzt und auf beiden Seiten multipliziert, erhält man

,

also

.

Wenn man berechnet, erhält man eine Lösung des Differentialgleichungssystems.

Beispiel (homogen)

Gegeben sei das folgende Differentialgleichungssystem

Es lässt sich schreiben als mit der Koeffizientenmatrix

.

Damit ergibt sich das zugehörige Matrixexponential zu

.

Als allgemeine Lösung des Differentialgleichungssystems erhält man somit

.

Inhomogener Fall – Variation der Konstanten

Für den inhomogenen Fall kann man die Methode der Variation der Konstanten benutzen. Es wird eine Lösung der Form gesucht:

Um die Lösung zu ermitteln, fordert man

,

also

und daher

.

Damit ergibt sich

,

wobei die Anfangsbedingung angenommen worden ist.

Beispiel (inhomogen)

Gegeben sei das Differentialgleichungssystem

Mit der Matrix von oben schreibt sich das System

mit

.

Die allgemeine Lösung der homogenen Gleichung wurde bereits oben berechnet. Die Summe aus homogenen und speziellen Lösungen ergibt die Lösung für das inhomogene Problem. Man muss jetzt nur noch eine spezielle Lösung finden (über die Variation der Konstanten). Von der Gleichung oben erhält man:

,

also

.

Siehe auch

Literatur

  • Roger A. Horn, Charles R. Johnson: Topics in Matrix Analysis. Cambridge University Press, 1991, ISBN 0-521-46713-6 (englisch).
  • Cleve Moler, Charles F. Van Loan: Nineteen Dubious Ways to Compute the Exponential of a Matrix, Twenty-Five Years Later. In: SIAM Review. Band 45, Nr. 1, 2003, ISSN 1095-7200, S. 1–49, doi:10.1137/S00361445024180 (cornell.edu [PDF]).
  • V. I. Arnolʹd: Gewöhnliche Differentialgleichungen. Springer-Verlag, Berlin / New York 1980, ISBN 3-540-09216-1.

Einzelnachweise

  1. S. Blanes, F. Casas, J. A. Oteo, J. Ros: The Magnus expansion and some of its applications. (= Physics Reports. Band 470). Cornell University Library, 2009, OCLC 635162561.
  2. T. Möller: Symbolic mathematics-based simulation of cylinder spaces for regenerative gas cycles. In: Int J Energy Environ Eng. Springer Berlin/ Heidelberg, Feb. 2015. http://link.springer.com/article/10.1007/s40095-015-0163-3
  3. T. Möller: Simulation und konstruktive Optimierung der Wärmeübertrager regenerativer Gaskreisprozesse. Shaker Verlag Düren, Aug. 2022. http://www.shaker.de/shop/978-3-8440-8706-2