Hesse-Matrix

Die nach Otto Hesse benannte Hesse-Matrix ist eine quadratische Matrix, die in der mehrdimensionalen reellen Analysis ein Analogon zur zweiten Ableitung einer Funktion ist.

Die Hesse-Matrix taucht bei der Approximation einer mehrdimensionalen Funktion in der Taylor-Entwicklung auf. Sie ist unter anderem in Zusammenhang mit der Optimierung von Systemen von Bedeutung, die durch mehrere Parameter beschrieben werden, wie sie beispielsweise in den Wirtschaftswissenschaften, in der Physik, theoretischen Chemie oder in den Ingenieurwissenschaften häufig auftreten.

Definition

Sei eine zweimal stetig differenzierbare Funktion. Dann ist die Hesse-Matrix von am Punkt definiert durch

Mit werden die zweiten partiellen Ableitungen bezeichnet. Die Hesse-Matrix entspricht der Transponierten der Jacobi-Matrix des Gradienten, ist aber bei stetigen zweiten Ableitungen wegen der Vertauschbarkeit der Differentiationsreihenfolge symmetrisch,[1] so dass das Transponieren der Matrix keine Änderung bewirkt.

Beispiele

  • Für , gilt
und ,
und für die zweiten Ableitungen dementsprechend:
und
, beziehungsweise
, sowie
.
Somit ergibt sich die Hessematrix zu:
.
  • Die Funktion , , die jedem Vektor im seine euklidische Norm zuordnet, ist für alle zweimal stetig differenzierbar und es gilt nach der Kettenregel
sowie weiter nach der Quotientenregel
,
wobei das Kronecker-Delta bezeichnet. In Matrixschreibweise folgt also
mit der -Einheitsmatrix .

Anwendungen

Taylor-Entwicklung

Die Taylor-Entwicklung einer zweimal stetig differenzierbaren Funktion mit um eine Entwicklungsstelle beginnt mit

Die Terme zweiter Ordnung dieser Entwicklung sind also durch die quadratische Form gegeben, deren Matrix die an der Entwicklungsstelle ausgewertete Hesse-Matrix ist.

Extremwerte

Mit Hilfe der Hesse-Matrix lässt sich der Charakter der kritischen Punkte einer Abbildung in bestimmen. Dazu bestimmt man für die zuvor ermittelten kritischen Punkte die Definitheit der Hesse-Matrix.

  • Ist die Matrix an einer Stelle positiv definit, so befindet sich an diesem Punkt ein lokales Minimum der Funktion.
  • Ist die Hesse-Matrix dort negativ definit, so handelt es sich um ein lokales Maximum.
  • Ist sie indefinit, dann handelt es sich um einen Sattelpunkt der Funktion.

Falls die Hesse-Matrix an der untersuchten Stelle nur semidefinit ist, so versagt dieses Kriterium und der Charakter des kritischen Punktes muss auf anderem Wege ermittelt werden. Welcher dieser Fälle vorliegt, kann – wie unter Definitheit beschrieben – zum Beispiel mit Hilfe der Vorzeichen der Eigenwerte der Matrix oder ihrer Hauptminoren entschieden werden.

Beispiel: Die Funktion hat in einen kritischen Punkt, aber ist weder positiv noch negativ definit und auch nicht semidefinit, sondern indefinit. Die Funktion hat in diesem Punkt kein Extremum, sondern einen Sattelpunkt, in dem sich zwei Höhenlinien schneiden.

Konvexität

Es besteht zudem ein Zusammenhang zwischen der positiven Definitheit der Hesse-Matrix und der Konvexität einer zweimal stetig differenzierbaren Funktion , die auf einer offenen, konvexen Menge definiert ist: Eine solche Funktion ist genau dann konvex, wenn ihre Hesse-Matrix überall in positiv semidefinit ist. Ist die Hesse-Matrix sogar positiv definit in , dann ist die Funktion auf strikt konvex.

Entsprechend gilt: Eine zweimal stetig differenzierbare Funktion ist auf ihrer konvexen Definitionsmenge genau dann konkav, wenn ihre Hesse-Matrix negativ semidefinit ist. Ist die Hessematrix sogar negativ definit auf , so ist auf strikt konkav.

Ist auf ihrer Definitionsmenge strikt konvex, so besitzt höchstens ein globales Minimum auf . Jedes lokale Minimum ist zugleich das (einzige) globale Minimum. Ist strikt konkav, so besitzt höchstens ein globales Maximum. Jedes lokale Maximum ist zugleich ihr (einziges) globales Maximum.[2]

Laplace-Operator

Der Laplace-Operator einer zweimal stetig differenzierbaren Funktion mit ist gleich der Spur ihrer Hesse-Matrix und daher unabhängig von der Wahl der Koordinaten:

Siehe auch

Einzelnachweise

  1. Otto Forster: Analysis 2. Differentialrechnung im Rn, gewöhnliche Differentialgleichungen. 8. Auflage. Vieweg+Teubner Verlag, Wiesbaden 2008, ISBN 978-3-8348-0575-1, S. 78.
  2. Konvexe Funktionen. S. 16, archiviert vom Original (nicht mehr online verfügbar) am 2. November 2013; abgerufen am 16. September 2012.

Literatur und Einzelnachweise