En mathématiques, la dérivée d'une fonction d'une variable réelle mesure l'ampleur du changement de la valeur de la fonction (valeur de sortie) par rapport à un petit changement de son argument (valeur d'entrée). Les calculs de dérivées sont un outil fondamental du calcul infinitésimal. Par exemple, la dérivée de la position d'un objet en mouvement par rapport au temps est la vitesse (instantanée) de l'objet.
La dérivée d'une fonction est une fonction qui, à tout nombre pour lequel admet un nombre dérivé, associe ce nombre dérivé. La dérivée en un point d'une fonction de plusieurs variables réelles, ou à valeurs vectorielles, est plus couramment appelée différentielle de la fonction en ce point et n'est pas traitée ici.
La dérivée d'une fonction en est usuellement notée ou .
On utilise aussi des notations spécifiques, en particulier en physique, pour désigner la dérivée par rapport au temps qui s'écrit avec un point surmontant la lettre (), la dérivée seconde s'écrivant alors grâce à un tréma surmontant la lettre. Cette notation est appelée « notation de Newton ». On utilise dans le même esprit les notations prime () et seconde () pour noter les dérivées par rapport à l'espace.
En analyse, le nombre dérivé en un « point » (réel) d'une fonction à variable et valeurs réelles est la pente de la tangente au graphe de au point . C'est le coefficient directeur de l'approximation affine de en ; ce nombre n'est donc défini que si cette tangente — ou cette approximation — existe. La notion de dérivée est une notion fondamentale en analyse permettant d'étudier les variations d'une fonction, de construire des tangentes à une courbe et de résoudre des problèmes d'optimisation.
En sciences, lorsqu'une grandeur est fonction du temps, la dérivée de cette grandeur donne la vitesse instantanée de variation de cette grandeur, et la dérivée de la dérivée donne l'accélération. Par exemple, la vitesse instantanée d'un mobile est la valeur à cet instant de la dérivée de sa position par rapport au temps, et son accélération est la valeur à cet instant de la dérivée, par rapport au temps, de sa vitesse.
On généralise la notion de dérivée en étendant celle-ci au champ complexe et on parle alors de dérivée complexe. Pour une fonction de plusieurs variables réelles, on parle de la dérivée partielle par rapport à l'une de ses variables.
Il existe aussi une définition purement algébrique de la dérivée. On en trouve un exemple dans l'article polynôme formel.
La notion de nombre dérivé a vu le jour au XVIIe siècle dans les écrits de Leibniz et ceux de Newton, qui le nomme fluxion et qui le définit comme « le quotient ultime de deux accroissements évanescents ». C'est à Lagrange (fin du XVIIIe siècle) que l'on doit la notation , aujourd'hui usuelle, pour désigner le nombre dérivé de en . C'est aussi à lui qu'on doit le nom de « dérivée » pour désigner ce concept mathématique.
Approche à partir de la pente de la tangente
Pour approcher cette notion de manière graphique, commençons par nous donner une courbe représentative d'une fonctioncontinue dans un repère cartésien, c'est-à-dire tracée d'un seul trait de crayon, et bien « lisse » ; on dira là que la fonction associée est dérivable.
Quel que soit le point que l'on choisit sur la courbe, on pourra alors tracer ce qu'on appelle une tangente, c'est-à-dire une droite qui épouse localement la direction de cette courbe. Si l'on trace la courbe et sa tangente et que l'on s'approche en zoomant suffisamment, on aura de plus en plus de mal à distinguer la courbe de sa tangente. Si la courbe « monte » (c'est-à-dire si la fonction associée est croissante), la tangente sera également montante ; inversement, si la fonction est décroissante, la tangente sera descendante.
Si on se donne une abscisse pour laquelle la fonction est dérivable, on appelle nombre dérivé de en le coefficient directeur de la tangente à la courbe au point d'abscisse . Ce réel donne de précieuses informations sur le comportement local d'une fonction : c'est la mesure algébrique de la vitesse à laquelle cette fonction change lorsque sa variable change.
Ainsi, si le nombre dérivé d'une fonction est positif sur un intervalle, cette fonction sera croissante sur ce même intervalle. Inversement, s'il est négatif, elle sera décroissante. Lorsque le nombre dérivé est nul en un point, la courbe admet une tangente horizontale en ce point (pour plus de détails, voir Fonction monotone#Monotonie et signe de la dérivée). Si de plus le nombre dérivé change de signe en ce point, alors la fonction admet un extremum local (minimum ou maximum) ; sinon, on obtient ce qu'on appelle un point d'inflexion et ainsi la courbe change de concavité.
Définition formelle
Soit une fonctionréelle à valeurs réelles définie sur une réunion quelconque d'intervalles non triviaux (c'est-à-dire non vides et non réduits à un point), et appartenant à l'intérieur de l'ensemble de définition .
Pour tout tel que , on appelle taux d'accroissement de en et avec un pas de la quantité :
Il s'agit du coefficient directeur de la droite reliant les points de coordonnées et .
Si admet une limite finie lorsque tend vers 0, on dit que est dérivable en , auquel cas le nombre dérivé de en est égal à la limite de ce taux d'accroissement. On note alors :
ou, de manière équivalente :
Une fonction pour laquelle le taux d'accroissement en un point admet une limite finie (qui est le nombre dérivé) est dite dérivable en ce point.
Ce calcul de limite revient graphiquement à rechercher la pente de la tangente à la courbe en ce point. Ainsi, le nombre dérivé d'une fonction en un point, s'il existe, est égal à la pente de la tangente à la courbe représentative de la fonction en ce point :
La dérivation peut aussi être définie pour des fonctions d'une variable réelle à valeurs dans d'autres ensembles que .
Par exemple, une fonction d'une variable réelle, à valeurs dans , est dérivable en si et seulement si toutes ses coordonnées sont dérivables en ; et sa dérivée est la fonction dont les coordonnées sont les dérivées des coordonnées de . C'est un cas particulier de fonctions d'une variable vectorielle et à valeurs dans un espace vectoriel normé ou métrique.
Typiquement, une fonction est dérivable si elle ne présente pas « d'aspérité », de rupture de pente ni de partie « verticale ».
Une fonction qui n'est pas continue en un point n'y est pas dérivable. Prenons l'exemple d'une fonction qui fait un saut. On ne peut pas définir de tangente, la limite du taux de variation est infinie (la pente de la courbe est verticale). C'est le cas par exemple de la fonction signe en 0 :
à gauche de 0, i.e. , ;
en 0 : ;
à droite de 0, i.e. , ;
le taux de variation pour une largeur , vaut donc
et tend vers quand tend vers 0. Par contre, on peut définir une dérivée à gauche — dérivée partout nulle (tangente horizontale) sur — et une dérivée à droite — dérivée également nulle sur .
Si une fonction est dérivable en un point alors elle est continue en ce point, mais la réciproque est fausse.
Il y a une tangente à gauche et une tangente à droite différentes, la pente en 0 n'est pas définie ; le taux de variation n'a pas de limite définie. C'est le cas général pour les courbes présentant un point anguleux.
Il en est de même de la fonction racine cubique, qui a une tangente verticale en : le taux de variation a une limite infinie.
De plus, une fonction continue en un ensemble ne garantit pas que la fonction soit dérivable en cet ensemble (ouvert), comme contre-exemple la fonction de Weierstrass est continue sur mais dérivable nulle part.
Fonction dérivée
La dérivabilité est a priori une notion locale (dérivabilité en un point), mais à toute fonction on peut associer sa fonction dérivée (prononcée « prime »), donnée par
où est le domaine de dérivabilité de (le sous-ensemble de constitué des points en lesquels est dérivable).
La seule fonction (à une constante multiplicative près) égale à sa dérivée — c'est-à-dire solution de l'équation différentielle — est la fonction exponentielle de base . Certains ouvrages[Lesquels ?] prennent cette propriété, avec la condition , comme définition de l'exponentielle.
Notations
Il existe différentes notations pour exprimer la valeur de la dérivée d'une fonction en un point . On distingue :
la notation de Leibniz : ou . En physique, on note parfois . Cette dernière notation n'est pas rigoureuse car est un nombre constant, qui peut être vu comme une fonction constante : rigoureusement, on a donc ;
la notation de Newton[2] : qui est plutôt utilisée en physique pour désigner une dérivée par rapport au temps (on parle alors de calcul des fluxions) ;
Ces notations permettent également d'écrire des dérivées itérées, cela se fait en multipliant le prime ou le point dans la notation (par exemple une dérivée seconde peut s'écrire ou ).
peut souvent se calculer directement à partir d'une expression de , lorsqu'il s'agit d'une fonction « simple », en utilisant la table des dérivées usuelles. Pour des fonctions qui s'expriment comme combinaison linéaire de fonctions simples, comme produit, quotient ou composée, on utilise un petit nombre de règles algébriques déduites de la définition donnée plus haut. Les règles les plus couramment utilisées sont les suivantes :
Quelles que soient les fonctions dérivables (et composables) et
Réciproque
Quelle que soit la fonction bijective de réciproque , dérivable de dérivée ne s'annulant en aucun point
En particulier, voici les règles courantes se déduisant de la dérivée de composées :
Nom
Règle
Conditions
Puissance
Quel que soit , et même quel que soit si
Racine
Quelle que soit la fonction dérivable strictement positive
(cas particulier de la ligne précédente)
Exponentielle
Quelle que soit dérivable
Logarithme
Quelle que soit la fonction dérivable strictement positive
Logarithme népérien
Quelle que soit la fonction dérivable strictement positive (cas de la ligne précédente)
Dérivation numérique
Principe
Dans le cas d'une courbe expérimentale, on ne possède pas de fonction explicite pour la décrire, mais une série de valeurs . On a donc recours à une dérivation numérique, qui consiste simplement à approcher la valeur de la dérivée en un point par le taux de variation entre les points précédent et suivant :
Graphiquement, cela revient à remplacer la tangente par la corde. Ceci peut se justifier par le théorème des accroissements finis : on sait qu'il existe un point de l'intervalle pour lequel la dérivée est la pente de la corde, et si l'intervalle est petit, alors ce point est proche du milieu . Cette méthode est automatisable sur les calculatrices programmables et les ordinateurs.
Il faut cependant se poser la question de la précision des résultats. Une mise en informatique « naïve » de la méthode de calcul peut mener à des résultats de précision médiocre dans certains cas.
Dans un ordinateur, la précision des nombres est limitée par le mode de représentation. Si l'on utilise la double précision selon la norme IEEE 754, les nombres ont environ 16 chiffres significatifs. On a donc une précision relative de l'ordre de 10−16 (2−52 exactement). Notons cette valeur. Les calculatrices de poche admettent typiquement 10 chiffres significatifs, soit = 10−10.
Supposons que la différence soit inférieure à , alors le calculateur fera une erreur grossière sur le calcul et le résultat sera médiocre ; voire, si la différence est très faible, il ne « verra pas » de différence entre les deux valeurs, et le résultat sera 0. Si par exemple on veut avoir la dérivée autour de 2 de la fonction , en prenant un écart de 10−13 entre les points :
= 1,999 999 999 999 9
= 2
= 2,000 000 000 000 1
≈ 8 × 10−13
On voit que la différence entre les nombres, 8 × 10−13, est proche de . On va donc avoir une erreur d'arrondi. De fait, le calcul nous donne sur un ordinateur
≈ 3,997
alors que le résultat exact est
= 2 × 21 = 4
soit une erreur de 0,3 %. Sur une calculatrice, le résultat est ≈ 0…
Le point critique est le choix de l'écart entre les valeurs de . Une valeur de l'ordre de convient dans de nombreux cas. Il nous manque encore quelques éléments pour cette étude ; le problème est abordé dans la section Précision de la dérivée numérique ci-dessous.
Donc :
pour un ordinateur calculant en double précision, on peut prendre un écart de 10−8 entre les points ;
pour une calculatrice avec 10 chiffres significatifs, on peut prendre un écart de 10−5 entre les points.
Il en vient une approximation de la dérivée à l'ordre 2 :
.
Ce faisant, on commet une erreur de troncature du second ordre
.
Par ailleurs, l'ordinateur commet une erreur d'arrondi : la précision relative étant , la précision absolue sur est , et donc l'erreur induite sur la dérivée
.
L'erreur totale vaut donc
.
Cette fonction est convexe, et admet un minimum en
.
Cela dépend donc du rapport entre la valeur de et la courbure. Pour les zones où la fonction est « modérée » — c'est-à-dire que est de l'ordre de l'unité —, on peut retenir
.
L'erreur commise sur le premier terme (« erreur de méthode ») est en fait bien plus petite, puisque la méthode du paragraphe précédent revient à approximer par ; le même développement limité (pris cette fois à l'ordre 3) montre qu'on commet alors une erreur de l'ordre de . Il en résulte que le principal défaut de ces méthodes d'approximation numérique vient des erreurs d'arrondi.
Des formules plus complexes donnent de meilleures approximations ; voir à ce sujet l’article Dérivation numérique.
Dérivation graphique
On peut également effectuer une dérivation graphique, sans utiliser de calcul. On approche les tangentes par les cordes comme pour la méthode numérique. Puis, on tire des parallèles à ces droites passant par un point nommé pôle P. On considère l'intersection de ces droites avec la verticale passant par O, le segment [OP] étant horizontal. La hauteur des segments ainsi délimités est proportionnelle à la pente :
on peut donc reporter cette hauteur sur le graphique et obtenir une approximation de la courbe dérivée. L'échelle de l'axe des est donc de OP:1.
Si une fonction est continue sur , avec , et dérivable sur , alors il existe un point de tel que le nombre dérivé de en ce point soit le taux de variation entre et
.
En particulier, si , on retrouve le théorème de Rolle, qui sert aussi à démontrer le résultat plus général (voir l'article détaillé), c'est pourquoi on le rencontre souvent sous le nom de lemme de Rolle.
Une partie d'un intervalle réel est l'ensemble des points de continuité de la dérivée d'une fonction dérivable de dans si et seulement si[4] est un ensemble Gδdense dans .
L'ensemble des points de discontinuité d'une dérivée est donc un ensemble Fσ d'intérieur vide quelconque.
Si est dérivable, sa fonction dérivée n'est donc pas nécessairement continue. Cependant, possède la propriété des valeurs intermédiaires. Ceci constitue le théorème de Darboux, qui peut se formuler de deux façons équivalentes :
si dérivable est définie sur un intervalle réel , alors est un intervalle ;
si alors, pour tout de , il existe tel que .
Dérivées de fonctions liées
Beaucoup de problèmes font intervenir plusieurs variables qui sont liées entre elles et qui varient en fonction du temps.
La variation de l'une de ces variables donnera une variation correspondante des autres variables.
Le lien entre ces variations dépendra des relations qui existent entre les variables.
Exemple :
Un homme s'éloigne d'une tour de 60 m de hauteur à raison de 8 km/h soit environ 2,2 m/s.
À quelle vitesse s'éloigne-t-il du sommet de cette tour lorsqu'il est à 80 m du pied de la tour ?
On sait par relation de Pythagore que la distance entre le piéton et le sommet est alors de 100 m.
Avec et , distances du piéton au sommet de la tour et au pied de celle-ci sont des fonctions du temps liées par la relation de Pythagore :
implique
En dérivant les deux membres de cette égalité, nous obtenons :
implique :
la vitesse par rapport au sommet de la tour vaut le rapport entre la distance au sol entre le piéton et le pied de la tour et la distance entre le piéton et le sommet de la tour multiplié par la vitesse du piéton.
Lorsque le piéton est à 80 m du pied de la tour :
,
ce qui revient à dire que la vitesse par rapport au sommet de la tour vaut .
L'expression précédente permet en outre d'exprimer en fonction du temps la vitesse mesurée du sommet de la tour : si l'on note celle-ci et la vitesse constante de déplacement horizontal exprimées en m/s, on a les égalités
.
Analyse d'une fonction dérivée
En trouvant les valeurs de pour lesquelles la dérivée vaut 0 ou n'existe pas, on trouve les nombres critiques de la fonction. Les nombres critiques de permettent de trouver implicitement ses maxima et ses minima. En effectuant le test de la dérivée première, on construit un tableau de variation ; si le signe de la fonction dérivée passe du plus au moins devant un nombre critique, on a un maximum et si le signe de la fonction dérivée passe du moins au plus devant le nombre critique, on a un minimum.
De plus, lorsque le signe de la dérivée première est positif, la fonction est croissante ; s'il est négatif, elle est décroissante. On ne conclut rien, si au point critique la fonction dérivée ne change pas de signe. En dérivant la dérivée première, on a la dérivée seconde. En effectuant le test de la dérivée seconde, on trouve les nombres critiques de la dérivée première pour les placer dans le même tableau ; lorsqu'on observe un changement de signe de la dérivée seconde devant ce ou ces nombres critiques, on dit qu'on a un (ou des) point(s) d'inflexion. Les points d'inflexion marquent un changement de la concavité de la fonction. Un signe positif de la dérivée seconde signifie que la fonction est convexe et un signe négatif de la dérivée seconde signifie que la fonction est concave. Connaissant les changements de concavité et les extrema de la fonction, on peut alors tracer une esquisse de sa représentation graphique.
Dérivée et optimisation
Méthode pour optimiser un rendement à l'aide du calcul différentiel :
Mathématisation
Définitions et dessin : on définit les variables inconnues et on les représente sur un schéma.
Écrire la fonction objectif à deux variables et préciser si on recherche un maximum ou un minimum dans la situation donnée.
Trouver la relation entre les deux variables.
Écrire la fonction objectif à une variable et préciser le domaine de la fonction.
Analyse
Dériver la fonction pour obtenir la dérivée première.
Trouver les nombres critiques de la fonction, où la dérivée première vaut zéro ou n'existe pas dans les intervalles du domaine.
Les algébristes donnent un sens un peu différent au terme dérivée. Ils l'appliquent à une structure appelée A-algèbre associative unitaire et commutative. Une application , de dans est appelée une dérivation si :
Une autre généralisation part de la notion de dérivée n-ème pour construire, à l'aide de la transformation de Laplace, une nouvelle fonction, la dérivée t-ème, où t est un réel quelconque, et qui coïncide avec la dérivée itérée si t est entier et si la fonction de départ est suffisamment régulière.
La dérivation en tant qu'endomorphisme de l'espace n'admet pas de racine carrée[6],[7], c'est-à-dire que si l'on note l'opérateur de dérivation, alors il n'existe pas[8] d'application linéaire telle que .
↑Serge Francinou, Hervé Gianella et Serge Nicolas, Oraux X-ENS : Exercices de mathématiques Algèbre 1, t. 1, Paris, Cassini, , 372 p. (ISBN978-2-84225-132-1), p. 311.
↑Il est cependant possible, en un sens étendu, de définir une notion de dérivée fractionnaire ; pour cette définition, la dérivation d'ordre 1/2 est effectivement une racine carrée de la dérivation usuelle.
↑En effet, la droite et le plan étant alors stables par , on aurait et , or les deux équations et sont incompatibles.