Gradient

Deux exemples de champs scalaires représentés en tons de gris plus foncés pour les valeurs les plus hautes, et les gradients représentés par des flèches bleues : chacune pointe dans la direction où le champ scalaire croît le plus vite.
La fonction de deux variables f(x, y) = xe−(x2 + y2) est représentée ici par une carte thermique montrant les valeurs les plus élevées avec des couleurs chaudes, avec son gradient représenté par les flèches bleues : chacune pointe dans la direction où la température croît le plus vite.

En mathématiques et en physique, le gradient d'une fonction de plusieurs variables est un champ de vecteurs qui combine en chaque point les différentes dérivées partielles et donne ainsi à la fois la direction de la variation la plus forte[1] localement et l’intensité de cette variation. Pour une fonction représentant l’altitude, il suit les lignes de plus grande pente (dans le sens de la montée), avec une norme égale à cette pente. Lorsque la fonction ne dépend que d’une seule variable réelle, le gradient se confond avec la dérivée usuelle, comme en météorologie où le gradient de température est assimilé au taux de variation de la température selon l'altitude[2].

Le gradient d’une fonction f est noté grad(f) ou avec l’opérateur nabla , parfois avec des flèches suscrites.

En chaque point où il est défini, le produit scalaire avec le gradient constitue la différentielle de la fonction, c’est-à-dire la partie linéaire de son développement limité à l’ordre 1. Par exemple, pour une fonction de trois variables admettant des dérivées partielles en un point a, pour une petite variation h = (h1, h2, h3), on trouve

Cette méthode permet d'approcher localement une fonction de plusieurs variables par une forme linéaire.

La notion s’étend aux fonctions réelles définies sur une variété riemannienne.

Le gradient est toujours orthogonal aux lignes de niveau ou aux isosurfaces. Il permet aussi d’exprimer des conditions d’optimisation sous contrainte et intervient dans des méthodes d’analyse numérique pour obtenir des suites minimisantes.

Motivation

En physique et en analyse vectorielle, le gradient est un vecteur indiquant comment une grandeur physique varie dans l'espace[a]. Le gradient est d'une importance capitale en physique, qui l'employa avant les autres disciplines. En théorie des variations, il est aussi fondamental dans le domaine de l'optimisation ou de la résolution d'équations aux dérivées partielles.

En sciences de la Terre, le gradient est utilisé pour la variation dans toutes les directions d'un paramètre de la lithosphère, de l'hydrosphère, de l'atmosphère, ou de la biosphère. Cependant, le terme est souvent employé pour la composante dans une seule direction, comme dans le cas de la dérivée verticale d'une grandeur physique, c.-à-d. sa dérivée par rapport à la coordonnée (altitude ou profondeur). Par exemple, le gradient géothermique est la dérivée fois , où est la température et un vecteur unitaire vertical.

Définition

Le champ scalaire f(x,y) = −(cos2x + cos2y)2 est représenté par la nappe orange. Le gradient de f est un champ vectoriel, représenté par les flèches bleues ; chacune pointe dans la direction où f croît le plus vite.

Dans un système de coordonnées cartésiennes euclidien, le gradient d'une fonction f différentiable au point est le vecteur noté de composantes les (où i = 1, 2, ..., n)[3], c.-à-d. les dérivées partielles de f par rapport aux coordonnées[4],[5], au point a :

Dans un repère orthonormé, si le vecteur gradient n'est pas nul, alors il pointe dans la direction où la fonction croît le plus rapidement, et sa norme est égale au taux de croissance dans cette direction.

Les composantes du gradient de f sont les coefficients des variables dans l'équation réduite de l'espace tangent au point a au graphe de f. Cette propriété lui permet d'être défini indépendamment du choix du système de coordonnées, en tant que champ de vecteurs dont les composantes se transforment lors du passage d'un système de coordonnées à un autre.

La généralisation du gradient aux fonctions différentiables de plusieurs variables et à valeurs vectorielles (et aux applications différentiables entre espaces euclidiens) est la matrice jacobienne. La généralisation aux fonctions entre espaces de Banach est la dérivée de Fréchet.

Notations

Notation vectorielle

  • La dérivée ou différentielle d'une fonction f en un point a est généralement notée :
f'(a) ou Df(a) ou ou ou
ou, abusivement puisqu'elle n'est pas infinitésimale :
df(a) ou ou
  • Le gradient d'une fonction f en un point a est généralement noté :
ou ou ou .
Le symbole ∇ est appelé nabla. Dans la littérature en anglais, ou parfois en français par commodité typographique, on préfère mettre en gras le symbole du gradient pour signifier son caractère vectoriel :
ou f.

Notation tensorielle

En notation tensorielle, le vecteur position , contravariant, s'écrit (indice en position supérieure[b], variant de 1 au nombre de dimensions de l'espace). Le gradient d'un champ scalaire , écrit en notation tensorielle, est covariant et s'écrit donc (indice en position inférieure). La définition du gradient s'écrit alors[6] :

.

Avec la convention de sommation d'Einstein, la variation infinitésimale de s'écrit :

.

Exemple : le gradient de température

Le gradient de température, ou gradient thermique, est le gradient de la température en tant que fonction scalaire des coordonnées spatiales (lui est une fonction vectorielle de ces coordonnées).

Gradient dans une seule direction (dérivée)

Supposons que l'on place une poutre rectiligne entre deux murs qui n'ont pas la même température, le mur de gauche étant le plus froid. On observe que, sur la poutre, la température varie dans le temps, et dans l'espace : elle augmente de la gauche vers la droite. À ce phénomène thermodynamique, on associe un phénomène de flux de chaleur, lui-même lié à un gradient de température, c.-à-d. à une variation de la température le long de la poutre (cf. Conduction thermique, Loi de Fourier).

À un instant fixé, à chaque point M de la poutre, on attribue une abscisse x ; par exemple, à l'extrémité gauche, l'abscisse x = 0, et à l'extrémité droite, l'abscisse x = L (longueur de la poutre). En chaque point M(x) de la poutre, on considère la température T(x) ; autrement dit, T est fonction de x.

Entre deux points distants d'une très petite longueur δx, on mesure un écart de température δT. Au sens usuel, le gradient (de température) est le rapport entre ces deux grandeurs :

Au sens analytique (mathématique), on parle de gradient si ce rapport admet une limite quand δx tend vers 0, limite notée :

On écrit la variation le long de x comme l'approximation (dite du premier ordre) :

signifie que le terme qui reste est négligeable par rapport à

Propriétés

  • Le rapport a un signe, qui correspond à un sens. Dans notre poutre, la température augmente de gauche à droite, donc le gradient est orienté vers la droite ; l'axe des x aussi est orienté de gauche à droite, donc
  • En dimension 1, les notions de gradient et de dérivée sont équivalentes.
  • En physique, la norme de ce gradient est homogène à une température divisée par une distance (mesurée en K·m−1, ou plus usuellement en °C·m−1).

Gradient de température dans l'espace à trois dimensions usuel

En réalité, la température d'un point de la poutre varie en fonction d'un déplacement dans l'espace. On caractérise un point M de l'espace par ses coordonnées cartésiennes : M(x , y , z). « Comme » précédemment, la température est fonction des coordonnées de M : T(x , y , z).

Pour chacune de ces directions, on peut écrire une variation, dite partielle. Si, tout en étant en 3D, on ne se déplace que selon un axe, par exemple selon les ordonnées y, alors on peut réécrire la même formule que précédemment sur l'accroissement de température. Cependant, pour noter la variation, on passe par l'écriture en dérivée partielle (dite ronde) plutôt que par la dérivée unidimensionnelle (dite droite). On écrit la variation le long de y comme l'approximation (dite du premier ordre) :

signifie que le terme qui reste est négligeable par rapport à

Plus généralement, on se déplace dans l'espace d'un point M(x , y , z) à un point M'(x + δx , y + δy , z + δz), et la température passe de T(x , y , z) à T(x + δx , y + δy , z + δz). En première approximation, cette variation est une fonction linéaire de , et s'exprime donc comme somme algébrique des variations liées à chacune des composantes de

signifie que le terme qui reste est négligeable par rapport à

Soit le vecteur gradient de température. On peut alors réécrire la relation précédente sous la forme :

désigne le produit scalaire usuel sur

Propriétés

  • Le gradient est un vecteur de même dimension que l'espace sur lequel porte la température (ici ℝ3), alors que la température est à valeurs scalaires (c.-à-d. que la température en un point est un nombre, pas un vecteur).
  • La direction du (vecteur) gradient définit de nouveau la direction du plus froid au plus chaud, mais cette fois en 3D.
  • La norme du gradient de température est toujours homogène à K m−1.

Introduction par les éléments différentiels

Comme pour la différentielle dont il est une variante, le gradient peut être introduit avec le vocabulaire des éléments différentiels. À titre d'exemple, examinons le problème de la variation de l'aire d'un rectangle.

Surface du rectangle agrandie.

Dans le plan (xOy), considérons un rectangle de côtés x et y. Sa surface S est égale à xy ; elle dépend donc des coordonnées du point M(x,y). En suivant une démarche intuitive, on convient de noter par dx (resp. dy) une variation infinitésimale de la variable x (resp. y). Lorsque le point M fait un déplacement infinitésimal, la surface varie de façon infinitésimale, et on peut écrire que :

On en déduit facilement que :

Une simple application numérique où x et y seraient des mètres et dx et dy des centimètres illustre que dx dy est négligeable par rapport aux autres grandeurs.

On peut donner un statut mathématique précis aux notations dx et dy (qui sont des formes différentielles), et à la quantité dx dy (qui est alors du second ordre). Le calcul précédent est en fait un calcul de développement limité à l'ordre 1, faisant intervenir les dérivées premières de la fonction xy par rapport à ses deux variables. En négligeant dx dy, on obtient donc :

Bien sûr, on peut utiliser des notations un peu différentes :

Lignes de niveaux 1 et 2 de la fonction , avec les tangentes et les gradients en (2;1/2) et (1;2). Les directions des tangentes sont celles de variation nulle ; les directions des gradients sont celles de variation maximale.

L'intérêt d'introduire ces vecteurs pour exprimer la variation d'une fonction de plusieurs variables est de montrer que :

  • la fonction varie le plus si le point se déplace dans la direction du vecteur gradient ;
  • elle ne varie presque pas s'il se déplace dans toute direction perpendiculaire au gradient.

En effet : « c.-à-d. »

En électrostatique, ceci donne les courbes de même potentiel : les « équipotentielles ».

En mathématiques pures

Gradient dans un espace euclidien

Contexte

Soient E un espace vectoriel euclidien, U un ouvert de E, et une fonction , différentiable en un point a de U. On note la différentielle en a de f ; c'est une forme linéaire sur E. On note l'image par cette différentielle d'un vecteur h de E.

Existence et unicité

Il existe un unique vecteur A tel que pour tout vecteur h de E, , où désigne le produit scalaire sur E.

Le vecteur A est appelé le gradient de f en a, et il est noté . Il vérifie donc :

Développement limité

Si une application est différentiable en un point a, alors on peut écrire le développement limité de f du premier ordre au voisinage de a (avec la notation de Landau)[7]:

Expression canonique : avec dérivées partielles

Puisque le gradient est lui-même un vecteur de E, il est naturel qu'on cherche à l'exprimer dans une base orthonormée de cet espace vectoriel. On démontre qu'il s'exprime à l'aide des dérivées partielles sous la forme :

Par exemple, en dimension 3, on obtient :

Une propriété fondamentale

Le gradient de f désigne la direction où la pente de f est la plus grande. Précisément[4] :

Soit un point tel que f est différentiable en a et que pour tout vecteur tel que il existe tel que :

Gradient et dérivée directionnelle

Changement de paramètres

Soit une fonction de classe C1. Un changement de paramètres consiste à introduire un difféomorphisme , où n est la dimension de E. On exprime alors le gradient de f dans une base de E, dite locale, formée des vecteurs , les dérivées partielles étant celle de la fonction composée par rapport aux . Si la base locale est orthogonale, on préfère généralement utiliser la base orthonormée associée, obtenue en divisant chaque vecteur de la base locale par sa norme euclidienne.

C'est ainsi que le passage dans le plan en coordonnées polaires permet d'exprimer le gradient en fonction des dérivées partielles de la fonction composée f(r,θ) par rapport à l'abscisse polaire (r) et à l'argument (θ), la base utilisée étant constituée du vecteur radial unitaire et de son orthogonal.

En dimension 3, on obtient ainsi les formules suivantes :

qu'on peut aussi noter :
tout dépend des notations utilisées. Voir :

les vecteurs de type sont utilisés en coordonnées polaires.

Gradient dans un espace de Hilbert

Soient un espace de Hilbert (de dimension finie ou non), U un ouvert de H, et une application , différentiable en un point a de U. La différentielle Df(a) étant, par définition, une forme linéaire continue sur H, il résulte du théorème de représentation de Riesz qu'il existe un unique vecteur, noté , de H tel que :

Le vecteur est appelé le gradient de f en a.

Une propriété fondamentale

On montre que si , alors f croît strictement dans la direction de en passant par a, c.-à-d. :

Il existe tel que pour tous s et t de

Gradient dans une variété riemannienne

On peut encore étendre cette définition à une fonction définie et différentiable sur une variété riemannienne (M,g). Le gradient de f en a est alors un vecteur tangent à la variété en a, défini par :

Enfin, si f est un champ scalaire indépendant du système de coordonnées, c'est un tenseur d'ordre 0, et sa dérivée partielle est égale à sa dérivée covariante :

En coordonnées contravariantes, on calcule le champ de vecteurs appelé gradient de f :

Cette formule permet, une fois établi le tenseur métrique, de calculer facilement le gradient dans tout système de coordonnées.

Propriétés géométriques en dimension 2 ou 3

Classiquement, le gradient permet de définir la « normale aux courbes de niveau », ce qui se traduit en 2D et en 3D par des propriétés géométriques intéressantes. La propriété de tangence étant liée à la convexité/concavité, il est aussi intéressant de voir le lien qui existe entre gradient et convexité, toujours en 2D ou 3D.

En dimension 2 : gradient normal à une courbe en un point, droite tangente

Soient une application continûment différentiable, et une courbe définie par l'équation f(u) = k, où k est une constante. En un point v donné de cette courbe, si le gradient existe et s'il n'est pas nul, alors il donne la direction de la normale en v à la courbe ; la droite tangente en v à la courbe est alors orthogonale au gradient.

Application au traitement d'image

Une image est en fait une fonction de deux variables, notée p(x,y) ; chaque couple de valeurs entières de (x,y) constitue un pixel de l'image, et pour une image en noir et blanc, la valeur prise p(x,y) est appelée "niveau de gris" du pixel. En pratique, il est indispensable d'estimer "la droite tangente à la courbe", même si la fonction p n'est pas analytique (p est en général inconnue) et n'est pas différentiable au point (pixel) d’intérêt. On calcule numériquement les deux gradients notés gx et gy suivant x et y, par exemple avec les formules du 2e ordre, qui font appel à seulement 2 pixels chacun pour le calcul et ne force [?donc pas?] à supposer alors qu'il n'y a pas de bruit dans l'image.

La fonction p n'étant pas analytique et ses valeurs numériques étant connues uniquement en des points discrets (les pixels voisins), on peut utiliser diverses formules pour estimer le mieux possible ces gradients de l'image. Par exemple, le filtre de Prewitt permet, en utilisant la proximité des autres pixels de l'image (3 par 3, soit 9 pixels en tout), d'évaluer les gradients gx et gy du pixel d’intérêt, situé au centre par convention du filtre.[réf. souhaitée]

Ayant repéré dans une image donnée les pixels de forts gradients, on peut s'en servir d'amers, c.-à-d. de points particuliers reconnaissables (notés dans une carte, par exemple) permettant de se situer dans l'espace, donc de recaler sa navigation. Les gradients gx et gy sont les composantes du vecteur gradient ; on peut calculer l'angle entre l'axe (Ox) et ce vecteur. Il est alors possible de recaler des angles de prise de vue ; c'est très utile pour le pilotage/guidage des drones aériens, par exemple.

En dimension 3 : gradient normal à une surface en un point, plan tangent

Soient une application continûment différentiable, et une surface définie par l'équation f(u) = k, où k est une constante. En un point v donné de cette surface, si le gradient existe et s'il n'est pas nul, alors il donne la direction de la normale en v à la surface ; le plan tangent en v à la surface est alors orthogonal au gradient.

Gradient et convexité

Soient (par exemple, n = 2 ou n = 3), et une application continûment différentiable. Si l'application est monotone (resp. strictement monotone), alors f est convexe (resp. strictement convexe), c.-à-d., en utilisant la caractérisation par les cordes :

Cette propriété est intéressante parce qu'elle reste valable même si f n'est pas deux fois différentiable.

Si f est deux fois différentiable, le hessien est positif si et seulement si le gradient est monotone.

Cas de la dimension 1

La monotonie telle que définie ci-dessus permet de définir une fonction dérivée croissante ou décroissante au sens usuel. Dans le premier cas, on parle de fonction convexe ; dans le second, de fonction concave.

Si la fonction est deux fois dérivable, la croissance de la dérivée (donc du gradient) est assurée par la positivité de la dérivée seconde (équivalent du hessien).

Relations vectorielles

En analyse vectorielle, le gradient peut être combiné à d'autres opérateurs : divergence (div), rotationnel (rot), laplacien (Δ). Soit f une fonction décrivant un champ scalaire, que l'on suppose de classe C2 par rapport à chaque paramètre ; alors :

Notes et références

Notes

  1. Autrement dit, quand une grandeur physique dépend aussi de variables non spatiales (par exemple, le temps), on ne tient compte dans le calcul du gradient que des variables spatiales.
  2. Malgré cette position supérieure, il s'agit bien d'un indice et non d'un exposant. Il n'y a généralement pas de confusion possible mais, en cas de besoin, toute expression élevée à une puissance est mise entre parenthèses.

Références

  1. « Gradient », sur www.cnil.fr (consulté le )
  2. « Gradient », sur larousse.fr
  3. Nathalie Mayer, « Définition | Gradient | Futura Sciences », sur Futura (consulté le )
  4. a et b « Gradient », sur www.bibmath.net (consulté le )
  5. (en) « Gradient | Definition & Facts | Britannica », sur www.britannica.com, (consulté le )
  6. (en) Leonard Susskind et André Cabannes, General Relativity. The Theoretical Minimum, New York, Basic Books, , 373 p. (ISBN 9781541601772 et 9781541601796), p. 43-44.
  7. Jacqueline Lelong-Ferrand et Jean-Marie Arnaudiès, Cours de mathématiques : Analyse, t. 2, Dunod, , p. 181

Voir aussi

Sur les autres projets Wikimedia :

Bibliographie

  • (en) Serge Lang, Fundamentals of Differential Geometry, Springer
  • (en) Barrett O'Neill, Elementary Differential Geometry, 2e éd. révisée (ISBN 9780120887354)

Articles connexes