Si vous disposez d'ouvrages ou d'articles de référence ou si vous connaissez des sites web de qualité traitant du thème abordé ici, merci de compléter l'article en donnant les références utiles à sa vérifiabilité et en les liant à la section « Notes et références ».
En mathématiques et en physique, le gradient d'une fonction de plusieurs variables est un champ de vecteurs qui combine en chaque point les différentes dérivées partielles et donne ainsi à la fois la direction de la variation la plus forte[1] localement et l’intensité de cette variation. Pour une fonction représentant l’altitude, il suit les lignes de plus grande pente (dans le sens de la montée), avec une norme égale à cette pente. Lorsque la fonction ne dépend que d’une seule variable réelle, le gradient se confond avec la dérivée usuelle, comme en météorologie où le gradient de température est assimilé au taux de variation de la température selon l'altitude[2].
Le gradient d’une fonction f est noté grad(f) ou avec l’opérateur nabla, parfois avec des flèches suscrites.
En chaque point où il est défini, le produit scalaire avec le gradient constitue la différentielle de la fonction, c’est-à-dire la partie linéaire de son développement limité à l’ordre 1. Par exemple, pour une fonction de trois variables admettant des dérivées partielles en un point a, pour une petite variation h = (h1, h2, h3), on trouve
Cette méthode permet d'approcher localement une fonction de plusieurs variables par une forme linéaire.
En physique et en analyse vectorielle, le gradient est un vecteur indiquant comment une grandeur physique varie dans l'espace[a]. Le gradient est d'une importance capitale en physique, qui l'employa avant les autres disciplines. En théorie des variations, il est aussi fondamental dans le domaine de l'optimisation ou de la résolution d'équations aux dérivées partielles.
En sciences de la Terre, le gradient est utilisé pour la variation dans toutes les directions d'un paramètre de la lithosphère, de l'hydrosphère, de l'atmosphère, ou de la biosphère. Cependant, le terme est souvent employé pour la composante dans une seule direction, comme dans le cas de la dérivée verticale d'une grandeur physique, c.-à-d. sa dérivée par rapport à la coordonnée (altitude ou profondeur). Par exemple, le gradient géothermique est la dérivée fois , où est la température et un vecteur unitaire vertical.
Définition
Dans un système de coordonnées cartésienneseuclidien, le gradient d'une fonction f différentiable au point est le vecteur noté de composantes les (où i = 1, 2, ..., n)[3], c.-à-d. les dérivées partielles de f par rapport aux coordonnées[4],[5], au point a :
Dans un repère orthonormé, si le vecteur gradient n'est pas nul, alors il pointe dans la direction où la fonction croît le plus rapidement, et sa norme est égale au taux de croissance dans cette direction.
Les composantes du gradient de f sont les coefficients des variables dans l'équation réduite de l'espace tangent au point a au graphe de f. Cette propriété lui permet d'être défini indépendamment du choix du système de coordonnées, en tant que champ de vecteurs dont les composantes se transforment lors du passage d'un système de coordonnées à un autre.
La généralisation du gradient aux fonctions différentiables de plusieurs variables et à valeurs vectorielles (et aux applications différentiables entre espaces euclidiens) est la matrice jacobienne. La généralisation aux fonctions entre espaces de Banach est la dérivée de Fréchet.
Notations
Notation vectorielle
La dérivée ou différentielle d'une fonction f en un point a est généralement notée :
Le gradient d'une fonction f en un point a est généralement noté :
ou ou ou .
Le symbole ∇ est appelé nabla. Dans la littérature en anglais, ou parfois en français par commodité typographique, on préfère mettre en gras le symbole du gradient pour signifier son caractère vectoriel :
Le gradient de température, ou gradient thermique, est le gradient de la température en tant que fonction scalaire des coordonnées spatiales (lui est une fonction vectorielle de ces coordonnées).
Gradient dans une seule direction (dérivée)
Supposons que l'on place une poutre rectiligne entre deux murs qui n'ont pas la même température, le mur de gauche étant le plus froid. On observe que, sur la poutre, la température varie dans le temps, et dans l'espace : elle augmente de la gauche vers la droite. À ce phénomène thermodynamique, on associe un phénomène de flux de chaleur, lui-même lié à un gradient de température, c.-à-d. à une variation de la température le long de la poutre (cf. Conduction thermique, Loi de Fourier).
À un instant fixé, à chaque point M de la poutre, on attribue une abscisse x ; par exemple, à l'extrémité gauche, l'abscisse x = 0, et à l'extrémité droite, l'abscisse x = L (longueur de la poutre). En chaque point M(x) de la poutre, on considère la température T(x) ; autrement dit, T est fonction de x.
Entre deux points distants d'une très petite longueur δx, on mesure un écart de température δT. Au sens usuel, le gradient (de température) est le rapport entre ces deux grandeurs :
Au sens analytique (mathématique), on parle de gradient si ce rapport admet une limite quand δx tend vers 0, limite notée :
On écrit la variation le long de x comme l'approximation (dite du premier ordre) :
où signifie que le terme qui reste est négligeable par rapport à
Propriétés
Le rapport a un signe, qui correspond à un sens. Dans notre poutre, la température augmente de gauche à droite, donc le gradient est orienté vers la droite ; l'axe des x aussi est orienté de gauche à droite, donc
En dimension 1, les notions de gradient et de dérivée sont équivalentes.
En physique, la norme de ce gradient est homogène à une température divisée par une distance (mesurée en K·m−1, ou plus usuellement en °C·m−1).
Gradient de température dans l'espace à trois dimensions usuel
En réalité, la température d'un point de la poutre varie en fonction d'un déplacement dans l'espace. On caractérise un point M de l'espace par ses coordonnées cartésiennes : M(x , y , z). « Comme » précédemment, la température est fonction des coordonnées de M : T(x , y , z).
Pour chacune de ces directions, on peut écrire une variation, dite partielle. Si, tout en étant en 3D, on ne se déplace que selon un axe, par exemple selon les ordonnées y, alors on peut réécrire la même formule que précédemment sur l'accroissement de température. Cependant, pour noter la variation, on passe par l'écriture en dérivée partielle (dite ronde) plutôt que par la dérivée unidimensionnelle (dite droite). On écrit la variation le long de y comme l'approximation (dite du premier ordre) :
où signifie que le terme qui reste est négligeable par rapport à
Plus généralement, on se déplace dans l'espace d'un point M(x , y , z) à un point M'(x + δx , y + δy , z + δz), et la température passe de T(x , y , z) à T(x + δx , y + δy , z + δz). En première approximation, cette variation est une fonction linéaire de , et s'exprime donc comme somme algébrique des variations liées à chacune des composantes de
où signifie que le terme qui reste est négligeable par rapport à
Soit le vecteur gradient de température. On peut alors réécrire la relation précédente sous la forme :
où désigne le produit scalaire usuel sur
Propriétés
Le gradient est un vecteur de même dimension que l'espace sur lequel porte la température (ici ℝ3), alors que la température est à valeurs scalaires (c.-à-d. que la température en un point est un nombre, pas un vecteur).
La direction du (vecteur) gradient définit de nouveau la direction du plus froid au plus chaud, mais cette fois en 3D.
La norme du gradient de température est toujours homogène à K m−1.
Introduction par les éléments différentiels
Comme pour la différentielle dont il est une variante, le gradient peut être introduit avec le vocabulaire des éléments différentiels. À titre d'exemple, examinons le problème de la variation de l'aire d'un rectangle.
Dans le plan (xOy), considérons un rectangle de côtés x et y. Sa surface S est égale à xy ; elle dépend donc des coordonnées du point M(x,y). En suivant une démarche intuitive, on convient de noter par dx (resp. dy) une variation infinitésimale de la variable x (resp. y). Lorsque le point M fait un déplacement infinitésimal, la surface varie de façon infinitésimale, et on peut écrire que :
On en déduit facilement que :
Une simple application numérique où x et y seraient des mètres et dx et dy des centimètres illustre que dx dy est négligeable par rapport aux autres grandeurs.
On peut donner un statut mathématique précis aux notations dx et dy (qui sont des formes différentielles), et à la quantité dx dy (qui est alors du second ordre). Le calcul précédent est en fait un calcul de développement limité à l'ordre 1, faisant intervenir les dérivées premières de la fonction xy par rapport à ses deux variables. En négligeant dx dy, on obtient donc :
où
Bien sûr, on peut utiliser des notations un peu différentes :
où
L'intérêt d'introduire ces vecteurs pour exprimer la variation d'une fonction de plusieurs variables est de montrer que :
la fonction varie le plus si le point se déplace dans la direction du vecteur gradient ;
elle ne varie presque pas s'il se déplace dans toute direction perpendiculaire au gradient.
En effet : « c.-à-d. »
En électrostatique, ceci donne les courbes de même potentiel : les « équipotentielles ».
En mathématiques pures
Gradient dans un espace euclidien
Contexte
Soient E un espace vectoriel euclidien, U un ouvert de E, et une fonction , différentiable en un point a de U. On note la différentielle en a de f ; c'est une forme linéaire sur E. On note l'image par cette différentielle d'un vecteur h de E.
Existence et unicité
Il existe un unique vecteur A tel que pour tout vecteur h de E, , où désigne le produit scalaire sur E.
Le vecteur A est appelé le gradient de f en a, et il est noté . Il vérifie donc :
Développement limité
Si une application est différentiable en un point a, alors on peut écrire le développement limité de f du premier ordre au voisinage de a (avec la notation de Landau)[7]:
Expression canonique : avec dérivées partielles
Puisque le gradient est lui-même un vecteur de E, il est naturel qu'on cherche à l'exprimer dans une base orthonormée de cet espace vectoriel. On démontre qu'il s'exprime à l'aide des dérivées partielles sous la forme :
Par exemple, en dimension 3, on obtient :
Une propriété fondamentale
Le gradient de f désigne la direction où la pente de f est la plus grande. Précisément[4] :
Soit un point tel que f est différentiable en a et que pour tout vecteur tel que il existe tel que :
Soit une fonction de classe C1. Un changement de paramètres consiste à introduire un difféomorphisme, où n est la dimension de E. On exprime alors le gradient de f dans une base de E, dite locale, formée des vecteurs , les dérivées partielles étant celle de la fonction composée par rapport aux .
Si la base locale est orthogonale, on préfère généralement utiliser la base orthonormée associée, obtenue en divisant chaque vecteur de la base locale par sa norme euclidienne.
C'est ainsi que le passage dans le plan en coordonnées polaires permet d'exprimer le gradient en fonction des dérivées partielles de la fonction composée f(r,θ) par rapport à l'abscisse polaire (r) et à l'argument (θ), la base utilisée étant constituée du vecteur radial unitaire et de son orthogonal.
En dimension 3, on obtient ainsi les formules suivantes :
En coordonnées cylindriques (pour les coordonnées polaires, ne pas considérer la composante en z) :
Soient un espace de Hilbert (de dimension finie ou non), U un ouvert de H, et une application , différentiable en un point a de U. La différentielle Df(a) étant, par définition, une forme linéaire continue sur H, il résulte du théorème de représentation de Riesz qu'il existe un unique vecteur, noté , de H tel que :
Le vecteur est appelé le gradient de f en a.
Une propriété fondamentale
On montre que si , alors f croît strictement dans la direction de en passant par a, c.-à-d. :
Il existe tel que pour tous s et t de
Gradient dans une variété riemannienne
On peut encore étendre cette définition à une fonction définie et différentiable sur une variété riemannienne(M,g). Le gradient de f en a est alors un vecteur tangent à la variété en a, défini par :
Enfin, si f est un champ scalaire indépendant du système de coordonnées, c'est un tenseur d'ordre 0, et sa dérivée partielle est égale à sa dérivée covariante :
En coordonnées contravariantes, on calcule le champ de vecteurs appelé gradient de f :
Cette formule permet, une fois établi le tenseur métrique, de calculer facilement le gradient dans tout système de coordonnées.
Propriétés géométriques en dimension 2 ou 3
Classiquement, le gradient permet de définir la « normale aux courbes de niveau », ce qui se traduit en 2D et en 3D par des propriétés géométriques intéressantes. La propriété de tangence étant liée à la convexité/concavité, il est aussi intéressant de voir le lien qui existe entre gradient et convexité, toujours en 2D ou 3D.
En dimension 2 : gradient normal à une courbe en un point, droite tangente
Soient une application continûment différentiable, et une courbe définie par l'équation f(u) = k, où k est une constante. En un point v donné de cette courbe, si le gradient existe et s'il n'est pas nul, alors il donne la direction de la normale en v à la courbe ; la droite tangente en v à la courbe est alors orthogonale au gradient.
Application au traitement d'image
Une image est en fait une fonction de deux variables, notée p(x,y) ; chaque couple de valeurs entières de (x,y) constitue un pixel de l'image, et pour une image en noir et blanc, la valeur prise p(x,y) est appelée "niveau de gris" du pixel. En pratique, il est indispensable d'estimer "la droite tangente à la courbe", même si la fonction p n'est pas analytique (p est en général inconnue) et n'est pas différentiable au point (pixel) d’intérêt. On calcule numériquement les deux gradients notés gx et gy suivant x et y, par exemple avec les formules du 2e ordre, qui font appel à seulement 2 pixels chacun pour le calcul et ne force [?donc pas?] à supposer alors qu'il n'y a pas de bruit dans l'image.
La fonction p n'étant pas analytique et ses valeurs numériques étant connues uniquement en des points discrets (les pixels voisins), on peut utiliser diverses formules pour estimer le mieux possible ces gradients de l'image. Par exemple, le filtre de Prewitt permet, en utilisant la proximité des autres pixels de l'image (3 par 3, soit 9 pixels en tout), d'évaluer les gradients gx et gy du pixel d’intérêt, situé au centre par convention du filtre.[réf. souhaitée]
Ayant repéré dans une image donnée les pixels de forts gradients, on peut s'en servir d'amers, c.-à-d. de points particuliers reconnaissables (notés dans une carte, par exemple) permettant de se situer dans l'espace, donc de recaler sa navigation. Les gradients gx et gy sont les composantes du vecteur gradient ; on peut calculer l'angle entre l'axe (Ox) et ce vecteur. Il est alors possible de recaler des angles de prise de vue ; c'est très utile pour le pilotage/guidage des drones aériens, par exemple.
En dimension 3 : gradient normal à une surface en un point, plan tangent
Soient une application continûment différentiable, et une surface définie par l'équation f(u) = k, où k est une constante. En un point v donné de cette surface, si le gradient existe et s'il n'est pas nul, alors il donne la direction de la normale en v à la surface ; le plan tangent en v à la surface est alors orthogonal au gradient.
Gradient et convexité
Soient (par exemple, n = 2 ou n = 3), et une application continûment différentiable. Si l'application est monotone (resp. strictement monotone), alors f est convexe (resp. strictement convexe), c.-à-d., en utilisant la caractérisation par les cordes :
Cette propriété est intéressante parce qu'elle reste valable même si f n'est pas deux fois différentiable.
Si f est deux fois différentiable, le hessien est positif si et seulement si le gradient est monotone.
Cas de la dimension 1
La monotonie telle que définie ci-dessus permet de définir une fonction dérivée croissante ou décroissante au sens usuel. Dans le premier cas, on parle de fonction convexe ; dans le second, de fonction concave.
Si la fonction est deux fois dérivable, la croissance de la dérivée (donc du gradient) est assurée par la positivité de la dérivée seconde (équivalent du hessien).
En analyse vectorielle, le gradient peut être combiné à d'autres opérateurs : divergence (div), rotationnel (rot), laplacien (Δ). Soit f une fonction décrivant un champ scalaire, que l'on suppose de classe C2 par rapport à chaque paramètre ; alors :
Notes et références
Notes
↑Autrement dit, quand une grandeur physique dépend aussi de variables non spatiales (par exemple, le temps), on ne tient compte dans le calcul du gradient que des variables spatiales.
↑Malgré cette position supérieure, il s'agit bien d'un indice et non d'un exposant. Il n'y a généralement pas de confusion possible mais, en cas de besoin, toute expression élevée à une puissance est mise entre parenthèses.