7. Formules de Taylor - Maxima et minima

Laurent Schwartz

Analyse II 1997

Chapitre d’ouvrage

7. Formules de Taylor - Maxima et minima

Par Laurent Schwartz

Pages 155 à 174

SCHWARTZ, Laurent,

1997. 7. Formules de Taylor - Maxima et minima. In : Analyse II Calcul différentiel et équations différentielles. Paris : Hermann. Enseignement des sciences, p.155-174. URL : https://stm.cairn.info/analyse-2--9782705661625-page-155?lang=fr.

Schwartz, Laurent.

« 7. Formules de Taylor - Maxima et minima ». Analyse II Calcul différentiel et équations différentielles, Hermann, 1997. p.155-174. CAIRN.INFO, stm.cairn.info/analyse-2--9782705661625-page-155?lang=fr.

Schwartz, L.

(1997). 7. Formules de Taylor - Maxima et minima. Analyse II : Calcul différentiel et équations différentielles (p. 155-174). Hermann. https://stm.cairn.info/analyse-2--9782705661625-page-155?lang=fr.

Notes

[1]
Dans (3.6.27), on avait des vecteurs X₁, X₂, . . . , X_n quelconques ici, ils sont tous égaux à h
[2]
On peut aussi faire appel au développement de\(\begin{equation} f(x)=\left(x_1+x_2+\ldots+x_n\right)^k \end{equation}\)
[3]
Voir plus de renseignements sur les polynômes au théorème 3.7.20.
[4]
Ceci a été démontré dans le premier cycle, par récurrence sur le nombre de variables X₁, X₂, . . . , X_n que pour un polynôme à coefficients scalaires, mais le résultat subsiste pour les coefficients vectoriels, et la démonstration est la même.
[5]
La relation d’ordre β ≤ α dans Nⁿ est partielle et non totale, et β ≰ α n’est pas synonyme de β > α. Ainsi, pour n = 2, (1,1) ≰ (0,2) mais on n’a pas (1,1) > (0,2).
[6]
Au lieu de dire que f admet en a un maximum, ou maximum relatif, etc . . . , on dit aussi que a est pour f un maximum, ou maximum relatif, etc . . . . C’est assez incorrect, car le maximum est f(a) et non a.
[7]
Nous avons dit au début du §2, que la plupart des théorèmes énoncés pour un ouvert Ω de \(\mathcal{E}\) s’appliquent aussi à d’autres ensembles, notamment à des intervalles non ouverts de R; Le théorème 3.7.12 est un de ceux qui ne s’appliquent pas. Sa démonstration est basée sur celle qui a été donnée au théorème de Rolle (théorème 3.2.8): elle suppose essentiellement l’extremum réalisé en un point intérieur à l’intervalle.
[8]
Le point a s’appelle alors un col pour la fonction f. L’exemple typique est celui de la fonction réelle des deux variables réelles f(x, y) = xy. Son graphe dans R³ est le paraboloide hyperbolique z = xy. L’origine est un col pour f. La restriction de f à la droite y = mx est X ↦ mx², qui admet un maximum absolu à l’origine si m < 0 et un minimum strict absolu à l’origine si m > 0. On pourra aussi parler d’un col si m est impair.

Citer ce chapitre

Schwartz, L.

(1997). 7. Formules de Taylor - Maxima et minima. Analyse II : Calcul différentiel et équations différentielles (p. 155-174). Hermann. https://stm.cairn.info/analyse-2--9782705661625-page-155?lang=fr.

Schwartz, Laurent.

« 7. Formules de Taylor - Maxima et minima ». Analyse II Calcul différentiel et équations différentielles, Hermann, 1997. p.155-174. CAIRN.INFO, stm.cairn.info/analyse-2--9782705661625-page-155?lang=fr.

SCHWARTZ, Laurent,

1997. 7. Formules de Taylor - Maxima et minima. In : Analyse II Calcul différentiel et équations différentielles. Paris : Hermann. Enseignement des sciences, p.155-174. URL : https://stm.cairn.info/analyse-2--9782705661625-page-155?lang=fr.

Notes

[1]
Dans (3.6.27), on avait des vecteurs X₁, X₂, . . . , X_n quelconques ici, ils sont tous égaux à h
[2]
On peut aussi faire appel au développement de\(\begin{equation} f(x)=\left(x_1+x_2+\ldots+x_n\right)^k \end{equation}\)
[3]
Voir plus de renseignements sur les polynômes au théorème 3.7.20.
[4]
Ceci a été démontré dans le premier cycle, par récurrence sur le nombre de variables X₁, X₂, . . . , X_n que pour un polynôme à coefficients scalaires, mais le résultat subsiste pour les coefficients vectoriels, et la démonstration est la même.
[5]
La relation d’ordre β ≤ α dans Nⁿ est partielle et non totale, et β ≰ α n’est pas synonyme de β > α. Ainsi, pour n = 2, (1,1) ≰ (0,2) mais on n’a pas (1,1) > (0,2).
[6]
Au lieu de dire que f admet en a un maximum, ou maximum relatif, etc . . . , on dit aussi que a est pour f un maximum, ou maximum relatif, etc . . . . C’est assez incorrect, car le maximum est f(a) et non a.
[7]
Nous avons dit au début du §2, que la plupart des théorèmes énoncés pour un ouvert Ω de \(\mathcal{E}\) s’appliquent aussi à d’autres ensembles, notamment à des intervalles non ouverts de R; Le théorème 3.7.12 est un de ceux qui ne s’appliquent pas. Sa démonstration est basée sur celle qui a été donnée au théorème de Rolle (théorème 3.2.8): elle suppose essentiellement l’extremum réalisé en un point intérieur à l’intervalle.
[8]
Le point a s’appelle alors un col pour la fonction f. L’exemple typique est celui de la fonction réelle des deux variables réelles f(x, y) = xy. Son graphe dans R³ est le paraboloide hyperbolique z = xy. L’origine est un col pour f. La restriction de f à la droite y = mx est X ↦ mx², qui admet un maximum absolu à l’origine si m < 0 et un minimum strict absolu à l’origine si m > 0. On pourra aussi parler d’un col si m est impair.

Formules de Taylor

1 Du moment que la dérivée d’ordre m, f^(m)(a), est une application m-linéaire, il est possible de calculer sa valeur sur le système (X, X, . . . , X) ∈ E^m, défini à partir d’un même vecteur X de E. Il sera commode de représenter l’expression f^(m)(a).(X, X, . . . , X) par le symbole abrégé :

\[\begin{equation} f^{(m)}(a) \cdot X^m=f^{(m)}(a) \cdot(X, X, \ldots, X) \end{equation} \quad(3.7.1)\]

2 Il y a alors autant de formules de Taylor qu’il y a de formules des accroissements finis.

3 Au théorème 3.5.1, correspond une formule de Taylor qui étend le théorème 3.2.9 :

4 Théorème 3.7.1. Soit f une fonction réelle m fois dérivable sur l’ouvert Ω ⊂ \(\mathcal{E}\). Supposons que le segment fermé [x, x + h] soit tout entier dans Ω, et que f admette une dérivée d’ordre m + 1 en tout point du segment ouvert ]x, x + h[. Alors on a la formule :

\[\begin{equation} \begin{aligned} f(x+h) & =f(x)+\frac{f^{\prime}(x)}{1!} \cdot h+\frac{f^{\prime \prime}(x)}{2!} \cdot h^2+\ldots \\ & \ldots+\frac{f^{(m)}(x)}{m!} \cdot h^m+\frac{f^{(m+1)}(x+\theta h)}{(m+1)!} \cdot h^{(m+1)} \end{aligned} \end{equation} \quad(3.7.2)\]

5 où θ est un nombre réel, 0 < θ < 1.

6 Démonstration : - Appelons φ la fonction réelle sur [0 , 1], φ : t ↦ f(x + th). On voit aussitôt par récurrence sur k, que sa dérivée d’ordre k ≤ m existe sur [0, 1], et sa dérivée d’ordre m + 1 sur ]0, 1[, avec

\[\begin{equation} \varphi^{(k)}(t)=f^{(k)}(x+t h) \cdot h^k \end{equation} \quad(3.7.3)\]

7 Il suffit alors de lui appliquer la théorème 3.2.9 (formule de Taylor pour une fonction réelle d’une variable réelle) pour l’intervalle [0, 1], et l’on obtient le résultat.

8 Ensuite, au théorème 3.5.2 correspond la formule de Taylor suivante

9 Théorème 3.7.2. Soit f une application m fois dérivable de l’ouvert Ω ⊂ \(\mathcal{E}\). Supposons que le segment fermé [x, x + h] soit tout entier dans Ω, et que f admette une dérivée d’ordre m + len tout point du segment ouvert ]x, x + h[. majorée en norme par M. Alors on a la formule :

\[\begin{equation} \begin{aligned} & \|A\|=\| f(x+h)-f(x)-\frac{f^{\prime}(x)}{1!} \cdot h-\frac{f^{\prime \prime}(x)}{2!} \cdot h^2-\ldots \\ & -\frac{f^{(m)}(x)}{m!} \cdot h^m \| \leq M \frac{h^{m+1}}{(m+1)!} \end{aligned} \end{equation} \quad(3.7.4)\]

10 Démonstration : Le théorème a déjà été démontré pour m = 0 au théorème 3.5.2, nous allons donc faire une récurrence. Supposons-le démontré pour la formule de Taylor d’ordre m – 1, et démontrons-le pour la formule de Taylor d’ordre m ≥ 1.

11 Considérons la fonction g définie par

\[\begin{equation} g(t)=f(x+t h)-f(x)-f^{\prime}(x) \cdot t h-\ldots-f^{(m)}(x) \cdot(t h)^m \end{equation} \quad(3.7.5)\]

12 C’est une application du segment fermé [0, 1] de R dans F, et A = g(1)– g(0). Elle est continue sur ce segment, et en outre elle admet une dérivée première continue sur tout ce segment, donnée par

\[\begin{equation} g^{\prime}(t)=f^{\prime}(x+t h) \cdot h-f^{\prime}(x) \cdot h-\ldots-\frac{t^{m-1}}{(m-1)!} f^{(m)}(x) \cdot h^m \end{equation} \quad(3.7.6)\]

13 Mais d’après la 2èmè formule (3.6.20) :

\[\begin{equation} f^{(k)}(x) \cdot h^k=\left(\left(f^{\prime}\right)^{(k-1)}(x) \cdot h^{k-1}\right) \cdot h \end{equation} \quad(3.7.7)\]

14 (3.7.6) peut donc s’écrire

\[\begin{equation} g^{\prime}(t)=\left[f^{\prime}(x+t h)-f^{\prime}(x)-\ldots-\frac{\left(f^{\prime}\right)^{(m-1)}(x)}{(m-1)!} \cdot(t h)^{m-1}\right] \cdot h \in F \end{equation} \quad(3.7.8)\]

15 où le crochet est un élément de \(\mathcal{L}\)(E; F) ; appliqué à h ∈ E, il donne bien un élément de F. Cherchons une majoration de cette dérivée. Nous voyons que le crochet n’est pas autre chose que l’expression de Taylor analogue à A, mais relative à l’accroissement th et à l’ordre m – 1, et appliquée à la fonction f′, définie sur Ω à valeurs dans \(\mathcal{L}\)(E; F). Grâce à l’hypothèse de récurrence, et compte tenu de ce que (f′)^(m) = f^(m+1), nous pouvons donc écrire la majoration valable pout tout 0 ≤ t ≤ 1

\[\begin{equation} \left\|g^{\prime}(t)\right\| \leq M \frac{\|t h\|^m}{m!}\|h\|=M\|h\|^{m+1} \frac{t^m}{m!} \end{equation} \quad(3.7.9)\]

16 Utilisons alors le lemme 3.5.4 (en y remplaçant f(x) par g(x) et

\[\begin{equation} g(x) \quad \text { par } \quad M\|h\|^{m+1} \frac{x^{m+1}}{(m+1)!} \end{equation}\]

17 nous voyons que la fonction g, dans l’intervalle [0, 1] vérifie la majoration

\[\begin{equation} \|g(1)-g(0)\| \leq M \frac{\|h\|^{m+1}}{(m+1)!} \end{equation} \quad(3.7.10)\]

18 et par conséquent nous avons bien la formule 3.7.2.

19 Au corollaire 3.5.5, correspond ici le suivant

20 Corollaire 3.7.3. Si, dans les conditions de l’énoncé du théorème 3.7.2, L est une application (m + 1)-linéaire continue de E^m+1 dans F on a la formule :

\[\begin{equation} \begin{aligned} & \| f(x+h)-f(x)-\frac{f^{\prime}(x)}{1!} \cdot h-\frac{f^{\prime \prime}(x)}{2!} \cdot h^2-\ldots \\ & \ldots-\frac{f^{(m)}(x)}{m!} \cdot h^m-\frac{L}{(m+1)!} \cdot h^{m+1} \| \leq \omega \frac{h^{m+1}}{(m+1)!} \end{aligned} \end{equation} \quad(3.7.11)\]

21 où ω est la borne supérieure de ||f^(m+1)(ξ) – L|| lorsque ξ parcourt le segment ]x, x + h[.

22 Démonstration : - On se ramène au cas où L est une forme (m + 1) linéaire symétrique, qui est d’ailleurs le seul cas intéressant. On applique alors le théorème à la fonction

\[\begin{equation} \xi \mapsto f(\xi)-\frac{L}{(m+1)!} \cdot(\xi-x)^{m+1} \end{equation}\]

23 dont les dérivées se calculent par (3.6.24).

24 Pour terminer, remarquons qu’il existe une formule de Taylor qui correspond à la définition de la dérivée (3.3.14) et qui peut s’appeler formule de Taylor pour des accroissements infiniments petits. Il est plus commode de remplacer m + 1 par m.

25 Théorème 3.7.4. Si f a des dérivées d’ordre ≤ m – 1 dans Ω et une dérivée d’ordre m en a, on a :

\[\begin{equation} f(a+h)=f(a)+\frac{f^{\prime}(a)}{1!} \cdot h+\frac{f^{\prime \prime}(a)}{2!} \cdot h^2+\ldots+\frac{f^{(m)}(a)}{m!} \cdot h^m+\alpha\|h\|^m \end{equation} \quad(3.7.12)\]

26 où α tend vers 0 avec h

27 Démonstration : Démontrons ce résultat par récurrence sur m; il est vrai pour m = 1, supposons-le vrai pour m – 1, et démontrons-le pour l’entier m ≥ 2. Alors la fonction de ξ

\[\begin{equation} g(\xi)=f(a+\xi)-f(a)-f^{\prime}(a) \cdot \xi-\ldots-\frac{f^{(m)}(a)}{m!} \cdot \xi^m \end{equation} \quad(3.7.13)\]

28 est définie au voisinage de 0 dans E, à valeurs dans F, et dérivable. Sa dérivée est, d’après (3.6.24),

\[\begin{equation} g^{\prime}(\xi)=f^{\prime}(a+\xi)-f^{\prime}(a)-\ldots-\frac{\left(f^{\prime}\right)^{(m-1)}(a)}{(m-1)!} \cdot \xi^{m-1} \in \mathcal{L}(E ; F) \end{equation} \quad(3.7.14)\]

29 Appliquons à f′ la formule (3.7.12) pour l’entier m – 1 :

\[\begin{equation} g^{\prime}(\xi)=\beta(\xi)\|\xi\|^{m-1} \end{equation} \quad(3.7.15)\]

30 Alors la formule des accroissements finis (théorème 3.5.2) donne

\[\begin{equation} \begin{aligned} \|g(h)\| & =\|g(h)-g(0)\| \leq\|h\| \sup _{\xi \in] 0, h[ } \| g^{\prime}(\xi \| \\ & \leq\|h\| \sup _{\xi \in] 0, h[ }\|\beta(\xi)\|\|\xi\|^{m-1} \leq \epsilon\|h\|^m \end{aligned} \end{equation}\]

31 où ϵ tend vers 0 avec ||h||, ce qui donne le résultat voulu pour l’entier m.

Applications de la formule de Taylor au calcul des dérivées de fonctions.

32 Il arrive qu’il soit plus facile de trouver un développement de Taylor que de calculer les dérivées successives ; alors c’est ce développement qui donne les dérivées, autrement dit on a la réciproque du théorème 3.7.4.

33 Théorème 3.7.5. Si f est une application m fois dérivable de l’ouvert Ω de \(\mathcal{E}\) dans \(\mathcal{F}\), et si on a trouvé des applications L_k, k-linéaires continues symétriques de E^k dans F, k = 1, 2, . . . , m et un élément L₀ ∈ F, tel que l’on ait

\[\begin{equation} f(a+h)=L_0+L_1 \cdot h+\frac{L_2}{2!} \cdot h^2+\ldots+\frac{L_m}{m!} \cdot h^m+\alpha \cdot\|h\|^m \end{equation} \quad(3.7.16)\]

34 où α = α(h) tend vers 0 avec h, alors on a nécessairement :

\[\begin{equation} L_0=f(a) \quad, \quad L_k=f^{(k)}(a) \quad \text { pour } \quad k=1,2, \ldots, m \end{equation} \quad(3.7.17)\]

35 Démonstration : Il résulte du théorème 3.7.4 que si nous posons

\[\begin{equation} A_k=f^{(k)}(a)-L_k \in \mathcal{L}_k\left(E^k ; F\right) \quad, \quad A_0=f(a)-L_0 \in F \end{equation} \quad(3.7.18)\]

36 on a

\[\begin{equation} \sum_{k=0}^m \frac{A_k}{k!} \cdot h^k=\beta\|h\|^m \end{equation} \quad(3.7.19)\]

37 où β tend vers 0 avec h.

38 A₀ est nul, comme on le voit en faisant tendre h vers 0. Supposons démontré que A₀, A₁, . . . , A_k–1 sont nuls, k ≤ m, montrons que A_k est nul; il en résultera que tous les A_k, k = 0, 1, . . . , m, seront nuls et le théorème sera démontré. Posons h = tX, X fixé dans E, t scalaire qu’on fera tendre vers 0. Alors

\[\begin{equation} t^k\left(\frac{A_k}{k!} \cdot X^k+t \sum_{l=k+1}^m \frac{A_l}{l!} \cdot t^{l-k-1} X^l\right) \end{equation} \quad(3.7.20)\]

39 est un infiniment devant t^m donc devant t^k quand t tend vers 0: donc son quotient par t^k tend vers 0, donc A_k.X^k = 0, quelque soit X ∈ F. Alors, la démonstration par récurrence sera achevée, et le théorème démontré quand nous aurons démontré le lemme 3.7.6

40 Lemme 3.7.6. Soit A une application k-linéaire symétriquede E^k dans F. Si, pour tout X de E, on a :

\[\begin{equation} A \cdot X^k=0 \in F \end{equation} \quad(3.7.21)\]

41 Alors A est nulle

42 Démonstration : Ce lemme est bien connu pour k = 2, car alors on a (à cause de la symétrie de A), pour X ∈ E, Y ∈ E :

\[\begin{equation} A \cdot(X+Y, X+Y)-A(X, X)-A(Y, Y)=2 A(X, Y) \end{equation}\]

43 et l’hypothèse (3.7.21) entraîne la nullité du premier membre, donc du deuxième, donc de A. Etendons cette démonstration au cas général.

44 Considérons, pour X₁, X₂, . . . , X_k fixés, la fonction h de t = (t₁, t₂, . . . , t_k) ∈ R^k

\[\begin{equation} h(t)=A \cdot\left(t_1 X_1+t_2 X_2+\ldots+t_k X_k\right)^k \end{equation} \quad(3.7.22)\]

45 Par hypothèse, elle est identiquement nulle. Or c’est un polynôme en t₁, t₂, . . . , t_k ; donc chacun des coefficients de ce polynôme est nul. Mais d’après la symétrie de A, le coefficient de t₁t₂ . . . t_k n’est autre que k! A(X₁, X₂, . . . , X_k), ce qui démontre le lemme.

46 Remarque 1 - Nous avons dû supposer f dérivable jusqu’à l’ordre m; c’est essentiel. Le fait que f admette au voisinage de a, un développement du type (3.7.16) n’entraîne absolument pas qu’elle ait des dérivées d’ordre > 1.

47 Par exemple la fonction réelle de la variable réelle f définie par

\[\begin{equation} f(0)=0, \quad f(x)=x^{m+1} \sin \frac{1}{x^{m+1}} \text { pour } x \neq 0 \end{equation}\]

48 admet un tel développement à l’origine avec L_k = 0. Elle admet des dérivées de tout ordre dans le complémentaire de l’origine; elle admet une dérivée première nulle à l’origine, puisque

\[\begin{equation} |f(x)-f(0)|=|f(x)| \leq\left|x^{m+1}\right| \end{equation}\]

49 Mais sa dérivée première en x ≠ 0, égale à

\[\begin{equation} (m+1) x^m \sin \frac{1}{x^{m+1}}-\frac{(m+1)}{x} \cos \frac{1}{x^{m+1}} \end{equation}\]

50 prend des valeurs arbitrairement grandes dans tout voisinage de 0. Donc la dérivée première est discontinue à l’origine, et il n’y a sûrement pas de dérivée seconde.

51 Voici une application du théorème 3.7.5 au calcul des dérivées successives d’une fonction composée.

52 Théorème 3.7.7. Si g et f sont des fonctions scalaires d’une variable scalaire, m fois dérivables, la dérivée d’ordre m de la fonction composée h = g o f au point a est donnée par la formule suivante, où f^(p) veut dire f^(p)(a) et g^(p) veut dire g^(p)(f(a)) :

\[\begin{equation} \begin{aligned} & h^{(m)}(a)=\sum_{k_1+\ldots+m k_m=m} \\ & \frac{m!}{k_{1}!\ldots k_{m}!(1!)^{k_1} \ldots(m!)^{k_m}} g^{\left(k_1+\ldots+k_m\right)}\left(f^{\prime}\right)^{k_1} \ldots\left(f^{(m)}\right)^{k_m} \end{aligned} \end{equation} \quad(3.7.23)\]

53 Démonstration : Utilisons le développement de Taylor. On a

\[\begin{equation} h(x)=g(f(x))=\sum_{0 \leq I \leq m} \frac{(f(x)-f(a))^l}{l!} g^{(l)}+R_m \end{equation} \quad(3.7.24)\]

54 Mais

\[\begin{equation} f(x)-f(a)=\sum_{1 \leq k \leq m} \frac{(x-a)^k}{k!}+f_m \end{equation} \quad(3.7.25)\]

55 On a donc, à des termes prés qui sont des infiniments petits devant (x – a)^m quand x tend vers a :

\[\begin{equation} (f(x)-f(a))^l \#\left(\sum_{1 \leq k \leq m} \frac{(x-a)^k}{k!} f^{(k)}\right)^l \end{equation} \quad(3.7.25)\]

56 La formule du développement de la puissance l-ième d’une somme est parfois donnée dans le premier cycle ; elle généralise le développement du binôme de Newton. De toute façon elle sera donnée à la formule (3.7.38). On a donc :

\[\begin{equation} \begin{aligned} & (f(x)-f(a))^l=\sum_{k_1+\ldots+k_m=l} \\ & \frac{l!}{k_{1}!\ldots k_{m}!} \frac{(x-a)^{k_1+\ldots+m k_m}}{(1!)^{k_1} \ldots(m!)^{k_m}}\left(f^{\prime}\right)^{k_1} \ldots\left(f^{(m)}\right)^{k_m} \end{aligned} \end{equation} \quad(3.7.26)\]

57 On en déduit

\[\begin{equation} \frac{(f(x)-f(a))^l}{l!} \end{equation}\]

58 d’où l’expression de h(x), à des infiniments petits prés devant (x – a)^m quand x tend vers a :

\[\begin{equation} h(x) \# \sum_{\substack{0 \leq l \leq m \\ k_1+\ldots+k_m=l}} \frac{(x-a)^{k_1+\ldots+m k_m}}{k_{1}!\ldots k_{m}!(1!)^{k_1} \ldots(m!)^{k_m}}\left(f^{\prime}\right)^{k_1} \ldots\left(f^{(m)}\right)^{k_m} g^{(l)} \end{equation} \quad(3.7.27)\]

59 Comme on sait que h est m fois dérivable (théorème 3.6.9), la quantité h^(m)(a) ne peut être que le produit par m! du coefficient de (x – a)^m dans le développement précédent, d’où le résultat. On voit sur cet exemple, le grand rôle que peut jouer le développement de Taylor pour calculer des dérivées d’ordre > 1, à condition d’avoir démontré, par une autre méthode, l’existence des dérivées à calculer.

Formule de Taylor par rapport à un système de coordonnées.

60 Théorème 3.7.8. L’expression

\[\begin{equation} \sum_{k=0}^m \frac{f^{(k)}(x)}{k!} \cdot h^k \end{equation}\]

61 qui intervient dans ¡es formules de Taylor s’écrit, si \(\mathcal{E}\) est de dimension finie et qu’on y a choisi un référentiel, si h a les coordonnées h₁, h₂, . . . , h_n et si on utilise la notation (3.6.29) et (3.6.30)

\[\begin{equation} \sum_{k=0}^m \frac{f^{(k)}(x)}{k!} \cdot h^k=\sum_{|\alpha| \leq m} \frac{D^\alpha f(x)}{\alpha!} h^\alpha \end{equation}\]

62 Démonstration : - Nous avons vu à la formule (3.6.27) que l’on a [1]

\[\begin{equation} \frac{f^{(k)}(x)}{k!} \cdot h^k=\sum_{j_1, j_2, \ldots, j_k} \frac{\partial^k f}{\partial x_{j_1} \partial x_{j_2} \ldots \partial x_{j_k}}(x) h_{j_1} h_{j_2} \ldots h_{j_k} \in F \end{equation} \quad(3.7.28)\]

63 Dans cette formule, j₁, j₂, . . . , j_k sont des indices qui prennent, indépendamment les uns des autres, toutes les valeurs possibles, parmi les entiers 1, 2, . . . , n. Réunissons entre elles toutes les suites finies j₁, j₂, . . . , j_k pour lesquelles ai des indices sont égaux à 1, α₂ des indices égaux à 2, . . . , α_n des indices égaux à n. Elles donnent dans la somme (3.7.28), le même élément qui s’écrit, avec la notation (3.6.29-30) :

\[\begin{equation} \frac{D^\alpha f(x) \cdot h^\alpha}{k!}=\left(\frac{\partial}{\partial x_1}\right)^{\alpha_1}\left(\frac{\partial}{\partial x_2}\right)^{\alpha_2} \ldots\left(\frac{\partial}{\partial x_n}\right)^{\alpha_n} f(x) \frac{h_1^{\alpha_1} h_2^{\alpha_2} \ldots h_n^{\alpha_n}}{k!} \end{equation} \quad(3.7.29)\]

64 Combien y-t-il de termes de ce type ? autant qu’il y a d’applications j de {1, 2, . . . , k] dans {1, 2, . . . , n}, où { 1 } a une image réciproque à α₁ éléments, {2 } a une image réciproque à α₂ éléments, . . . , {n} une image réciproque à a„;; éléments, |α| = α₁ + α₂ + . . . + α_n = k. Ce nombre

\[\begin{equation} \gamma_{\alpha_1, \alpha_2, \ldots, \alpha_n}=\gamma_\alpha \end{equation}\]

65 s’appelle aussi le nombre des “permutations avec répétition” des n objets {1, 2, . . . . . . , n}, où l’objet 1 est pris ai fois, l’objet 2, α₂ fois, . . . , l’objet n, α_n fois. Il y a bien des manières de le calculer [2].

66 Pour déterminer une application j qui nous intéresse, nous devrions d’abord choisir une partie de {1, 2, . . . , k} à ai éléments, qui sera j^–1({1}): il y a un nombre de choix possibles qui est le nombre de parties à ai éléments de {1, 2, . . . , k} soit

\[\begin{equation} \frac{k!}{\alpha_{1}!\left(k-\alpha_1\right)!} \end{equation}\]

67 Ceci choisi, nous devons choisir dans le complément {1, 2, . . . , k}\j^–1({1}), ensemble à k – α₁ éléments, une partie arbitraire ayant α₂ éléments, qui sera j^–1({2}); le nombre de choix possibles est

\[\begin{equation} \frac{\left(k-\alpha_1\right)!}{\alpha_{2}!\left(k-\alpha_1-\alpha_2\right)!} \end{equation}\]

68 Et ainsi de suite. Le nombre des ces applications j est donc

\[\begin{equation} \begin{aligned} \frac{k!}{\alpha_{1}!\left(k-\alpha_1\right)!} & \frac{\left(k-\alpha_1\right)!}{\alpha_{2}!\left(k-\alpha_1-\alpha_2\right)!} \cdots \frac{\left(k-\alpha_1-\alpha_2-\ldots-\alpha_{n-1}\right)!}{\alpha_{n}!\left(k-\alpha_1-\alpha_2-\ldots-\alpha_n\right)!} \\ & =\frac{k!}{p_{1}!p_{2}!\ldots p_{n}!}=\frac{k!}{\alpha!} \end{aligned} \end{equation} \quad(3.7.30)\]

69 donc

\[\begin{equation} \frac{\gamma_\alpha}{k!}=\frac{1}{\alpha!} \end{equation}\]

70 et le théorème est démontré.

71 Il est remarquable qu’avec les notations employées, la formule soit identique à celle qui correspond aux fonctions d’une variable.

72 Dans le premier membre, f(x + h) est dans l’espace affine \(\mathcal{F}\); dans le 2ème membre, tous les termes sont dans l’espace vectoriel F, sauf le premier, correspondant à p = 0, soit f(x), qui est dans l’espace affine \(\mathcal{F}\).

73 Corollaire 3.7.9. Dans les conditions du théorème, si on a trouvé des éléments c_α (c_α ∈ F pour p ≠ 0, c₀ ∈ \(\mathcal{F}\)) tels que

\[\begin{equation} f(a+h)=\sum_\alpha c_\alpha \frac{h^\alpha}{\alpha!}+\epsilon\|h\|^m \end{equation} \quad(3.7.31)\]

74 où ϵ ∈ F tend vers 0 avec h, et si l’on sait que f est m fois dérivable en a, on a nécéssairement :

\[\begin{equation} c_\alpha=D^\alpha f(a) \end{equation}\]

75 Démonstration : - Par différence, si on pose

\[\begin{equation} a_\alpha=D^\alpha f(a)-c_\alpha \quad\left(\text { ici } a_0 \in F \quad \text { aussi }\right) \end{equation}\]

76 on voit que le “polynôme” [3] (à coefficients vectoriels) en h₁, h₂, . . . h_k :

\[\begin{equation} \sum_{|\alpha| \leq m} a_\alpha h^\alpha=\sum_{|\alpha| \leq m} a_{\alpha_1, \alpha_2, \ldots, \alpha_n} h_1^{\alpha_1} h_2^{\alpha_2} \ldots h_n^{\alpha_n} \end{equation} \quad(3.7.32)\]

77 a une norme infiniment petite devant ||h||^m quand h tend vers 0. En posant h = tX, et en faisant tendre t vers 0, on voit par une récurrence analogue à celle qui est utilisée dans la démonstration du théorème 3.7.5 (mais sans utiliser le lemme), que les parties homogènes de degrés successifs 0, 1, 2, . . . , m, du polynôme (3.7.32) sont identiquement nulles. Mais un polynôme identiquement nul a tous ses coefficients nuls [4], ce qui démontre le corollaire.

78 Exercice 1 - Appliquer le corollaire pour démontrer de nouveau la formule de Leibniz (3.6.33) dans l’esprit du théorème 3.7.7.

79 Théorème 3.7.10. Pour qu’une application f d’un ouvert connexe Ω de \(\mathcal{E}\) dans \(\mathcal{F}\) ait une dérivée d’ordre m + 1 nulle dans Ω, il faut et il suffit que f soit un polynôme de degré ≤ m.

80 Démonstration : - Soit d’abord m = 0. On a vu, même si Ω n’est pas connexe, une constante a une dérivée nulle. Nous devons montrer que, si Ω est connexe, une application f de Ω ⊂ E dans \(\mathcal{F}\), de dérivée partout nulle, est une constante.

81 Soit x un point quelconque de Ω. IL existe un nombre ρ_x > 0 tel que la boule ouverte B_x de centre x et de rayon ρ_x soit dans Ω. Alors pour ||h|| < ρ_x, on peut appliquer la formule des accroissements finis au segment [x, x + h], tout entier dans fi, et on trouve :

\[\begin{equation} \|f(x+h)-f(x)\| \leq \sup _{\xi \in] x, x+h[ }\left\|f^{\prime}(\xi)\right\|=0 \end{equation} \quad(3.7.33)\]

82 Donc f est égale à la constante f(x) dans B_x.

83 Soit alors un point a quelconque fixé de Ω. Appelons A l’ensemble des points ξ de Ω tels que f(ξ) = f(a). A est évidemment fermé, car il est l’image réciproque de {f(a)} ∈ F par l’application continue f. Il est aussi ouvert, car si x ∈ A, toute la boule B_x définie ci-dessus appartient aussi à A, A est Ω tout entier, ce qui démontre le théorème pour m = 0.

84 Soit maintenant m ≥ 1. Il faudrait donner d’abord la définition d’un polynôme sur ∈ à valeurs dans \(\mathcal{F}\). Nous nous bornerons au cas particulier où \(\mathcal{E}\) est de dimension finie n.

85 Si on choisit un référentiel { o, e₁, e₂, . . . , e_n}, on sait ce qu’est un polynôme en x₁, x₂, . . . , x_n, de degré n à valeurs dans \(\mathcal{F}\): c’est une fonction de la forme :

\[\begin{equation} f(x)=\sum_{|\alpha| \leq m} a_\alpha x^\alpha=\sum_{\alpha_1+\alpha_2+\ldots+\alpha_n \leq m} a_{\alpha_1, \alpha_2, \ldots, \alpha_n} x_1^{\alpha_1} x_2^{\alpha_2} \ldots x_n^{\alpha_n} \end{equation} \quad(3.7.34)\]

86 où les a_α sont dans F, sauf u₀ qui est dans \(\mathcal{F}\).

87 Une telle fonction garde la même forme dans tout autre référentiel et s’appelle polynôme sur E à valeurs dans \(\mathcal{F}\), de degré ≤ m. Sa dérivée d’ordre m + 1 est nulle, que Ω soit connexe ou non, puisque, d’après (3.7.34) ses dérivées partielles d’ordre m + 1 sont nulles.

88 Réciproquement, soit Ω connexe, et soit f une application de Ω dans \(\mathcal{F}\), dérivée d’ordre m + 1 nulle. Soit a ∈ Ω. La formule de Taylor d’ordre m, par rapport à un référentiel quelconque, n’a pas de terme complémentaire R_m, et montre que f est, dans la boule B_a signalée plus haut, un polynôme P de degré ≤ m. Appelons k un entier tel que (f – P)^(k) = 0 dans Ω; de tels entiers existent, par exemple k = m + 1.

89 Alors, si k ≥ 1, (f – P)^(k–1) est une fonction dont la dérivée première est nulle dans fi connexe, donc elle est constante dans Ω; mais elle est nulle dans B_a, donc elle est nulle dans Ω, et k – 1 a la même propriété que ib. Alors, de proche en proche, on descend jusqu’à k = 0, et f ≡ P dans Ω, ce qui démontre le théorème.

90 Remarque 2 - Bien entendu cette conclusion serait complètement fausse si Ω n’était pas connexe. Il suffit de prendre pour Ω le complémentaire de l’origine sur la droite réelle R, et de prendre m = 0; une fonction définie dans fi à valeurs réelles et à dérivée partout nulle, n’est pas nécessairement une constante dans Ω; elle peut être égale à une certaine constante dans la demi-droite ] –∞, 0[, et à une constante différente dans la demi-droite ]0, +∞ [.

91 Remarque 3 - Supposons que nous n’ayons pas, à la formule (3.7.30), déterminé γ_a. On peut le faire maintenant très facilement comme suit.

92 Ecrivons la formule de Mac Laurin pour un polynôme de degré m, γ_a n’étant pas supposé connu :

\[\begin{equation} \left\{\begin{array}{l} f(x)=\sum_{|\alpha| \leq m} \gamma_\alpha \frac{D^\alpha f(0)}{k!} x^\alpha=\sum_{|\alpha| \leq m} c_\alpha \frac{D^\alpha f(0)}{k!} x^\alpha \\ \text { avec } \quad c_\alpha=\gamma_\alpha \frac{\alpha!}{k!} \end{array}\right. \end{equation} \quad(3.7.35)\]

93 et nous voulons prouver que c_α = 1.

94 Soit β ∈ Nⁿ, β ≤ α [5]. On a immédiatement :

\[\begin{equation} \begin{aligned} & D^\beta \frac{x^\alpha}{\alpha!}=\left(\left(\frac{\partial}{\partial x_1}\right)^{\beta_1} \frac{x_1^{\alpha_1}}{\alpha_{1}!}\right)\left(\left(\frac{\partial}{\partial x_2}\right)^{\beta_2} \frac{x_2^{\alpha_2}}{\alpha_{2}!}\right) \ldots\left(\left(\frac{\partial}{\partial x_n}\right)^{\beta_n} \frac{x_n^{\alpha_n}}{\alpha_{n}!}\right) \\ & =\left\{\begin{array}{lll} \left.\frac{x^{\alpha-\beta}}{(\alpha-\beta}\right)! & \text { si } & \beta \leq \alpha \\ 0 & \text { si } & \beta \not \alpha \end{array}\right. \end{aligned} \end{equation} \quad(3.7.36)\]

95 Alors la dérivation D^β de (3.7.35), pour |β| ≤ m, donne

\[\begin{equation} D^\beta f(x)=\sum_{\substack{|\alpha| \leq m \\ \alpha \geq \beta}} c_\alpha \frac{D^\alpha f(0)}{(\alpha-\beta)} x^{\alpha-\beta} \end{equation} \quad(3.7.37)\]

96 Faisons x = 0. Alors x^α–β = 0 pour α ≠ β, = 1 pour α = β. On obtient donc

\[\begin{equation} D^\beta f(0)=c_\beta D^\beta f(0) \end{equation}\]

97 d’où c_β = 1, comme nous voulions le montrer.

98 Prenons en particulier f(x) = (x₁ + x₂ + . . . + x_n)^k.

99 Le théorème des fonctions composées montre que toute dérivée partielle d’ordre l est

\[\begin{equation} k(k-1) \ldots(k-l+1)\left(x_1+x_2+\ldots+x_n\right)^{k-l} \end{equation}\]

100 Une telle dérivée est toujours nulle pour x₁ = x₂ = . . . = x_n = 0, sauf si l = k, auquel cas elle vaut k !. Alors la formule de Mac Laurin donne

\[\begin{equation} \left(x_1+x_2+\ldots+x_n\right)^k=\sum_{|\alpha|=k} \gamma_\alpha x^\alpha=\sum_{|\alpha|=k} \frac{k!}{\alpha!} x^\alpha \end{equation} \quad(3.7.38)\]

101 Ainsi

\[\begin{equation} \gamma_{\alpha_1, \alpha_2, \ldots, \alpha_n}=\frac{\left(\alpha_1+\alpha_2+\ldots+\alpha_n\right)!}{\alpha_{1}!\alpha_{2}!\ldots \alpha_{n}!} \end{equation}\]

102 est le coefficient de \(x_1^{\alpha_1} x_2^{\alpha_2} \ldots x_n^{\alpha_n}\) dans le développement de

\[\begin{equation} \left(x_1+x_2+\ldots+x_n\right)^{\alpha_1+\alpha_2+\ldots+\alpha_n} \end{equation}\]

103 Ce qui généralise la formule du binôme. C’était d’ailleurs évident, d’après la définition combinatoire de γ_α donnée après (3.7.29-30).

104 Les coefficients du binôme sont très simples, ce qui permet d’écrire immédiatement la formule de Mac Laurin pour une fonction de 2 variables scalaires x, y. Si on pose :

\[\begin{equation} \begin{aligned} & p=\frac{\partial f}{\partial x}(0,0) \quad, \quad q=\frac{\partial f}{\partial y}(0,0) \\ & r=\frac{\partial^2 f}{\partial x^2}(0,0) \quad, \quad s=\frac{\partial^2 f}{\partial x \partial y}(0,0) \quad, \quad t=\frac{\partial^2 f}{\partial y^2}(0,0) \\ & \alpha=\frac{\partial^3 f}{\partial x^3}(0,0) \quad, \quad \beta=\frac{\partial^3 f}{\partial x^2 \partial y}(0,0) \\ & \gamma=\frac{\partial^3 f}{\partial x \partial y^2}(0,0) \quad, \quad \delta=\frac{\partial^3 f}{\partial y^3}(0,0) \end{aligned} \end{equation}\]

105 On aura :

\[\begin{equation} \begin{aligned} f(x, y) & =f(0,0)+p x+q y+\frac{1}{2}\left(r x^2+2 s x y+t y^2\right) \\ & +\frac{1}{6}\left(\alpha x^3+3 \beta x^2 y+3 \gamma x y^2+\delta y^3\right)+\ldots \end{aligned} \end{equation} \quad(3.7.40)\]

Application à l’étude des maxima et des minima.

106 Définition 3.7.11. Soit f une fonction définie sur un espace topologique \(\mathcal{E}\) et à valeurs réelles. On dit que f admet, en un point a de \(\mathcal{E}\) un maximum relatif [6], s’il existe un voisinage V de a tel que la restriction de f à ce voisinage admette au point a un maximum, c’est-à-dire si, pour tout x de V, on a l’inégalité : f(x) ≤ f(a).

107 On dit qu ’il s’agit d’un maximum relatif strict, si l’on peut choisir V de manière que l’on ait, pour tout x ≠ a dans V, l’inégalité stricte f(x) < f(a)

108 Définition analogue pour un minimum relatif et un minimum relatif strict

109 On dit que f présente en a un extremum si elle présente un maximum ou un minimum relatif

110 Bien entendu un maximum de f, c’est-à-dire un maximum absolu, est nécessairement a fortiori un maximum relatif, alors que le contraire n’est pas nécessairement vrai.

Condition nécessaire pour un extremum.

111 Théorème 3.7.12. Soit f une fonction réelle définie sur un ouvert Ω d’un espace affine normé \(\mathcal{E}\) et dérivable. Une condition nécessaire pour qu’elle admette en un point a de Si un maximum ou un minimum relatif est que l’application dérivée f′(a) ∈ \(\mathcal{L}\)(E; R) = E′ soit nulle

112 Démonstration : - Remarquons d’abord que si \(\mathcal{E}\) est de dimension finie, et si l’on a choisi un référentiel { o, (e_i)_i∈I }, la condition s’exprime sous la forme bien connue : Il est nécessaire, pour que a soit un maximum ou un minimum relatif pour f que les dérivées partielles \(\frac{\partial f}{\partial x_i}\) soient toutes nulles au point a, ou encore que la différentielle au point a:

\[\begin{equation} \sum_{i \in I} \frac{\partial f}{\partial x_i}(a) d x_i \end{equation}\]

113 soit identiquement nulle

114 Démontrons maintenant le théorème dans le cas général.

115 Si f admet un maximum ou un minimum relatif en a, la fonction t ↦ f(a+tU), U fixé dans E, est définie pour t ∈ R, |t| assez petit (parce que Ω est ouvert), et admet pour t = 0 un maximum ou un minimum relatif. Alors la même démonstration que celle qui a été donnée pour le théorème de Rolle ( Théorème 3.2.8) montre que sa dérivée en t est nulle pour t = 0; or c’est f′(a).U. Donc f′(a).U = 0 quelque soit le vecteur U ∈ E, donc f′(a) = 0.

116 Remarque 4 - Le théorème 3.7.12, pour beaucoup de raisons, ne règle pas le problème de la recherche des extremas de f

117 1°/ Généralement, f sera une fonction réelle définie, non sur un ouvert, mais sur un fermé (par exemple sur un segment [a, b] de R ou dans une boule fermée de E); elle peut n’avoir aucun extremum, si son ensemble de définition n’est pas compact (par exemple f(x) = x n’a pas d’extremum sur R); si elle a des extrema, ceux-ci peuvent échapper au théorème, qui ne s’applique qu’aux extrema dans un ouvert : naturellement si f est dérivable sur Ω = F de F, tout extremum a situé dans Ω sera obtenu en écrivant f′(a) = 0, mais justement les extrema seront souvent sur la frontière de F (par exemple, si f est la fonction x² sur l’intervalle fermé

118 [-1, +1], le minimum x = 0, est obtenu par annulation de la dérivée, parce que 0 est intérieur à [-1,-1-1]; mais les maxima x = ±1 échappent, parce qu’ils sont réalisés aux extrémités de l’intervalle et que la dérivée ne s’y annule pas [7]

119 2° Inversement, l’équation f′(a) = 0 donne des points qui ne seront nécessairement des extrema, autrement dit la condition nécessaire f′(a) = 0 est loin d’être suffisante. Il faut encore étudier le développement de Taylor de f au voisinage du point a.

120 Nous étudierons maintenant ce problème. Mais il est certain que, bien souvent, le fait que f′(a) soit nul est plus important que la propriété d’extremum elle-même. Par exemple, si on considère l’hypersurface d’équation y = f(x) dans Ω × R, f′(a) = 0 signifie que l’hyperplan tangent au point (a, f(a)) est horizontal; c’est une condition nécessaire d’extremum de l’ordonnée y, mais géométriquement plus importante que la propriété d’extremum.

121 Qu’il y ait ou non extremum, nous dirons que f est stationnaire en a,ou que a est un point critique pour f.

Recherche de conditions nécessaires et suffisantes pour un extremum.

122 Théorème 3.7.13. Soit f une fonction à valeurs réelles définie sur un ouvert Ω d’un espace affinenormé \(\mathcal{E}\) et m fois dérivables. Si les dérivées de f d’ordre 1, 2, . . . , m – 1 sont toutes nulles en a ∈ Ω, si f^(m)(a) ≠ 0, et si f admet un maximum relatif, alors m est pair, et l’on a

\[\begin{equation} f^{(m)}(a) \cdot U^m \leq 0 \text { pour tout } U \in E \end{equation} \quad(3.7.41)\]

123 Inversement, si f est m fois dérivable dans Ω si les dérivées de f d’ordre 1, 2, . . . , m – 1 sont toutes nulles en a ∈ Ω, et si f^(m)(a).U est borné supérieurement par un nombre δ < 0 lorsque U parcourt la sphère unité ||U|| = 1 de E, alors f admet en a un maximum relatif strict.

124 Démonstration : 1°/ Démontrons d’abord la première partie du théorème, et supposons donc que f ait en a ∈ Ω un maximum relatif. Alors la fonction g : t ↦ f(a + tU), définie au voisinage de t = 0 sur la droite réelle R, a un maximum relatif pour t = 0. Sa dérivée d’ordre k pour t = 0 est. f^(k)(a).U^k.

125 Ses dérivées d’ordre ≤ m – 1 sont donc toutes nulles, pour t = 0, sa dérivée d’ordre m est f(^(m)(a).U^m. On a donc, pour t voisin de 0 :

\[\begin{equation} g(t)-g(0)=\left(f^{(m)}(a) \cdot U^m\right) \frac{t^m}{m!}+\epsilon_t t^m \end{equation} \quad(3.7.42)\]

126 où ϵ_t tend vers 0 avec |t|. Donc ou bien f^(m)(a).U^m = 0, ou bien g(t) – g(0) est du signe de f^(m)(a).U^m t^m. On a donc finalement, quels que soient U ∈ E et t réel :

\[\begin{equation} \left(f^{(m)}(a) \cdot U^m\right) t^m \leq 0 \end{equation} \quad(3.7.43)\]

127 Si m est pair, c’est équivalent à (3.7.41). Pour démontrer la première partie, il reste à montrer que m ne saurait être impair. Or, si m était impair, (3.7.43) équivaudrait (en prenant successivement t = +1 et t = -1)

\[\begin{equation} f^{(m)}(a) \cdot U^m=0 \end{equation} \quad(3.7.44)\]

128 pour tout U ∈ E. Cela entraînerait, d’après le lemme 3.7.6

\[\begin{equation} f^{(m)}(a) \cdot\left(U_1, U_2, \ldots, U_m\right)=0 \quad, \quad \forall\left(U_1, U_2, \ldots, U_m\right) \in E^m \end{equation} \quad(3.7.45)\]

129 ou f^(m)(a) = 0, ce qui serait contraire à l’hypothèse.

130 Remarque 5 - Avant de passer à la deuxième partie, remarquons ceci. On pourrait croire que, si f admet en a un maximum relatif strict, alors la forme de degré m : f^(m)(a) soit définie négative, autrement dit :

\[\begin{equation} f^{(m)}(a) \cdot U^m<0 \quad, \quad \text { pour tout } \mathrm{U} \neq 0 \end{equation} \quad(3.7.46)\]

131 Il n’en est rien (sauf évidemment si \(\mathcal{E}\) a la dimension 1). Considérons en effet la fonction réelle f de deux variables réelles x et y :

\[\begin{equation} f(x, y)=-\left(x^2+y^4\right) \end{equation} \quad(3.7.47)\]

132 Elle admet à l’origine un maximum absolu strict. Comme c’est un polynôme, son développement suivant les puissances de x et y est son développement de Mac Laurin, de sorte que, ici, si on appelle (X, Y) un vecteur de E = R², on a :

\[\begin{equation} \frac{1}{2} f^{\prime \prime}(0,0) \cdot(X, Y)=-X^2 \end{equation} \quad(3.7.48)\]

133 est bien toujours ≤ 0, mais non défini négatif (c’est nul pour le vecteur (0, Y) ≠ (0,0)).

134 2°) Démontrons maintenant la 2ème partie. Remarquons toutefois d’abord que les hypothèses de cette deuxième partie sont plus fortes que les conclusions de la première. Il n’en peut être autrement. Supposer que f^(k)(a) = 0 pour k = 1, 2, . . . , m – 1, que f^(m)(a) ≠ 0 et que l’on a (3.7.41) n’est pas suffisant pour affirmer que f ait en a un maximum relatif.

135 Considérons en effet la fonction de deux variables réelles x, y :

\[\begin{equation} f(x, y)=-x^2+y^4 \end{equation} \quad(3.7.49)\]

136 Comme nous l’avons vu pour (3.7.47), on a (3.7.48) c’est-à-dire (3.7.41); cependant f(0, 0) = 0, et f(0, y) > 0 pour y ≠ , donc f n’a pas à l’origine un maximum relatif. C’est pourquoi nous supposons les hypothèses plus fortes indiquées dans l’énoncé : f^(m)(a).U^m est majoré, sur la sphère unité, par –δ < 0. Cela entraîne par homogénéité:

\[\begin{equation} f^{(m)}(a) \cdot U^m \leq-\delta\|U\|^m \end{equation} \quad(3.7.50)\]

137 Cela entraîne donc (3.7.46) : f^(m)(a) est définie négative . C’est équivalent à (3.7.46) si \(\mathcal{E}\) est de dimension finie; car la sphère unité est alors compacte, la fonction

\[\begin{equation} U \mapsto f^{(m)}(a) \cdot U^m \end{equation}\]

138 est continue : elle est partout strictement négative sur la sphère unité, comme il résulte de (3.7.46), elle y admet un maximum, et celui-ci est un nombre –\(\mathcal{E}\) < 0. Mais c’est une hypothèse plus forte que (3.7.46) si \(\mathcal{E}\) est de dimension infinie.

139 Ecrivons le développement de Taylor d’ordre m sous la forme (3.7.12) :

\[\begin{equation} f(a+h)=f(a)+\frac{f^{(m)}(a)}{m!} \cdot h^m+\alpha(h)\|h\|^m \end{equation} \quad(3.7.51)\]

140 où α(h) tend vers 0 avec h. Alors (3.7.50) donne

\[\begin{equation} f(a+h) \leq f(a)-\delta\|h\|^m+\alpha(h)\|h\|^m \end{equation} \quad(3.7.52)\]

141 En vertu de la propriété de α, f(a + h) – f(a) est ≤ 0 pour h de norme assez petite, et f admet bien en a un maximum relatif strict.

142 Naturellement on a un théorème analogue pour le minimum. D’où la règle, permettant de reconnaitre si f admet en a un maximum ou un minimum relatif :

143 Règle 1 - On doit d’abord avoir f′(a = 0. On cherche alors le premier entier m tel que f^(m)(a) ≠ 0.

144 Si m est impair, on a ni un maximum ni un minimum relatif. Si m est pair, on regarde le signe de la forme de degré m : U ↦ f^(m)(a).U^m

145 Si elle peut prendre des valeurs des deux signes, a n’est ni un maximum ni un minimum relatif [8]. Si elle est toujours ≤ 0 (resp. ≥ 0, sans être définie négative (resp. définie positive) on ne peut pas , conclure sans étudier les dérivées d’ordre strictement supérieur à m.

146 Si elle est définie négative (resp. définie positive) et si \(\mathcal{E}\) est de dimension finie, ou si l’on a la condition plus forte

\[\begin{equation} \sup _{\|U\|=1}\left(f^{(m)}(a) \cdot U^m\right)<0 \quad\left(\text { resp. } \quad \inf _{\|U\|=1}\left(f^{(m)}(a) \cdot U^m\right)>0\right. \end{equation} \quad(3.7.53)\]

147 pour \(\mathcal{E}\) de dimension infinie, alors a est un maximum (resp. un minimum) relatif strict.

148 Il résulte de cette étude qu’il n’existe pas de conditions à la fois nécessaire et suffisante simple pour qu’une fonction réelle f, définie sur Ω ⊂ \(\mathcal{E}\), admette, en un point a, un maximum ou un minimum relatif.

149 Remarque 6 - Si une fonction f admet toutes ses dérivées successives nulles au point a, sans être identiquement nulle, l’étude du developement de Taylor ne permet absolument plus de voir si elle admet un maximum ou un minimum relatif.

150 Remarque 7 - Supposons que f ait un col en a. On pourra chercher dans quelle région de Ω, au voisinage de a, on a f(x) ≥ f(a), et dans quelle région on a f(x) ≤ f(a). On appliquera les mêmes règles. Si sur l’ensemble B de la sphère unité ||U|| = 1, la quantité f^(m)(a).U^m est majorée par –δ < 0, alors dans le tout le cône {a + λU : U ∈ B , λ réel > 0}, on a, au voisinage de a, f(x) < f(a).

Cas particulier d’une fonction de deux variables réelles x et y.

151 On cherchera d’abord les points où les dérivées partielles

\[\begin{equation} p=\frac{\partial f}{\partial x} \quad, \quad q=\frac{\partial f}{\partial y} \end{equation}\]

152 sont nulles. Soit (a, b) un tel point. On formera alors le développement de Taylor de f suivant les puisances de (x – a) = X et (y – b) = Y. Ce développement commencera par

\[\begin{equation} \frac{1}{2}\left(r X^2+2 s X Y+t Y^2\right) \end{equation} \quad(3.7.54)\]

153 1er cas : rt – s²> 0, r ( et t) < 0

154 Alors la forme quadratique (3.7.54) est définie négative, f admet un maximum relatif strict.

155 2ème cas : rt – s² > 0, r ( et t) > 0

156 f admet en (a, b) un minimum relatif strict.

157 3ème cas : rt – s² < 0.

158 La forme quadratique (3.7.54) prend à la fois des valeurs des deux signes, on est en présence d’un col. L’équation

\[\begin{equation} r X^2+2 s X Y+t Y^2=0 \end{equation}\]

159 représente deux droites D, D′, de R², qui définissent 4 angles, 2 à 2 opposés par le sommet, soient (1), (2), (3), (4), dans l’ordre de parcours. Par exemple supposons la forme ≥ 0 dans (1) et (3), ≤ 0 dans (2) et (4).

160 Supposons l’angle (1) défini, en coordonnées polaires, par ρ ≥ 0, α ≤ φ ≤ β. Alors tout angle α′ ≤ φ ≤ β′, où α′ > α et β′ < β, coupe la “sphère unité” de R², c’est-à-dire le cercle trigonométrique, suivant un compact, sur lequel la forme quadratique admet un minimum δ > 0.

161 Alors il existera un ϵ > 0 tel que, si l’on pose x = a + ρ cos φ, y = a + φ sin φ, ρ ≥ 0, α′ ≤ φ ≤ β′, on ait f(x, y) > f(a, b) pour 0 < ρ ≤ ϵ

162 Mais cet ϵ depend de α′ et β′; on ne rien affirmer lorsque ρ tend vers 0, si en même temps φ tend vers α ou β, sans l’examen des dérivées d’ordre > 2 de f en (a, b). Mêmes conclusions dans l’angle (3); dans les angles (2) et (4), conclusions analogues avec remplacement de f(x, y) > f(a, b) par f(x, y) < f(a, b).

163 Les régions de R² où f(x, y) > f(a, b) et f(x, y) < f(a, b) sont séparés par la courbe f(x, y) = f(a, b). Celle-ci a, au point (a, b), 2 branches, respectivement tangentes à D et à D′. Mais on ne peut pas dire dans quels angles sont ces deux branches, sans examen des dérivées d’ordre > 2 de f en (a, b).

164 4ème cas : rt – s² = 0, r ou t < 0

165 La forme quadratique est l’opposée du carré d’une forme linéaire ≠ 0. Elle s’annule sur une droite D et elle est < 0 ailleurs. Soit φ = φ₀ + kπ l’angle polaire de cette droite. Si

\[\begin{equation} x=a+\rho \cos \varphi, \quad y=a+\rho \sin \varphi, \quad \rho \geq 0, \quad \alpha^{\prime} \leq \varphi \leq \beta^{\prime} \end{equation}\]

166 où α′ et β′ sont fixés , α′ > φ₀ et β′ < φ₀ + π, il existe ϵ > 0 tel que l’on ait f(x, y) < f(a, b) pour 0 < ρ < ϵ. Résultat analogue pour α′ > φ₀ + π et β′ < φ₀ + 2 π.

167 Mais on ne peut rien dire de plus, et en particulier on ne peut pas dire si (a, b) est un maximum relatif sans examen des dérivées d’ordre > 2 de f en (a, b).

168 5ème cas : rt – s² = 0, r ou t > 0

169 Résultat analogue, en remplaçant f(x, y) < f(a, b) par f(x, y) > f(a, b).

170 6ème cas : r = s = t = 0.

171 On ne peut rien conclure sans l’examen des dérivées d’ordre > 2 de f en (a, b).

172 Conclusion - Cette étude montre que, pour une fonction de plus d’une variable réelle, les circonstances sont très différentes de celles qui ont étés vues dans le premier cycle pour les fonctions d’une variable réelle.

Application de la formule de Taylor à l’étude de la position d’une by-persurface par rapport à son plan tangent.

173 Soit f une fonction réelle dérivable définie sur Ω ⊂ \(\mathcal{E}\). Alors y = f(x) est l’équation d’une variété différentiable de \(\mathcal{E}\) × R; pour des raisons de dimension, on dit que c’est une hypersurface différentiable. L’équation de son hyperplan tangent en A = (a, f(a)) est donnée par (3.3.27). La position de l’hypersurface par rapport à son hyperplan tangent, au voisinage de A, est donnée par le signe de

\[\begin{equation} f(x)-f(a)-f^{\prime}(a) \cdot(x-a) \end{equation} \quad(3.7.55)\]

174 pour x voisin de a.

175 Or x ↦ f(x) – f(a) – f′(a).(x – a) est une fonction réelle, dérivable, de dérivée nulle en a. Tout revient à voir si a est un extremum pour f et quel type d’extremum, ou un col. nous sommes donc ramenés au théorème 3.7.13. Conformément à la conclusion de ce qui précède, le col est une situation courante et non exceptionnelle, et par conséquent, sauf si ∈ a la dimension 1, Phypersurface peut normalement traverser son hyperplan tangent même si f″(a) ≠ 0. Dans le cas particulier d’une fonction f réelle de 2 variables x, y, la surface sera localement d’un même côté du plan tangent si rt – s² > 0, et le traversera si rt – s² < 0.

Fonctions de classe C^m dans une partie fermée au sens de Whitney.

176 Définition 3.7.14. - Soit m un entier ≥ 1, Ω un ouvert de Rⁿ, A une partie fermée de Ω. On suppose que pour tout multi-indice α ∈ Nⁿ, tel que |α| ≤ m, il existe une fonction f_α continue sur A. On dit que f = f₀ est de classe C^m au sens de Whitney dans A si on a :

\[\begin{equation} (\forall \alpha)(|\alpha| \leq m)\left(f_\alpha(x)=\sum_{|\beta|+|\alpha| \leq m} \frac{1}{\beta!} f_{\alpha+\beta}(y)(x-y)^\beta+o\left(|x-y|^{m-|\alpha|}\right)\right. \end{equation} \quad(3.7.56)\]

177 uniformément sur tout compact de A lorsque |x – y| tend vers 0.

178 Théorème 3.7.15. (Whitney) - Avec les notations de la définition 3.7.16, f = f₀ est de classe C^m au sens de Whitney dans l’ensemble fermé A si et seulement si qu’il existe une fonction \(\tilde{f}\) de classe C^m sur Ω, telle que pour tout multi-indice α, |α| ≤ m, la restriction de \(D^\alpha \tilde{f}\) à A soit égale à f_α.

179 Définition 3.7.16. - Soit Ω un ouvert de Rⁿ, A une partie fermée de Ω, \(\left(f_\alpha\right)_{\alpha \in \mathbf{N}^n}\) une famille de fonctions continues sur A. On dit f = f₀ est de classe C^∞ dans A au sens de Whitney si :

\[\begin{equation} (\forall m \in \mathbf{N})(\forall K \subset A) f_\alpha(x)=\sum_{|\beta| \leq m} \frac{1}{\beta!} f_{\alpha+\beta}(y)(x-y)^\beta+o\left(|x-y|^m\right) \end{equation} \quad(3.7.57)\]

180 uniformément sur le compact K de A lorsque |x – y| tend vers 0.

181 Théorème 3.7.17. (Whitney) - Avec les notations de la définition 3.7.16, f = f₀ est de classe C^∞ au sens de Whitney si et seulement si il existe une fonction \(\tilde{f}\) de classe C^∞ sur Ω, telle que, pour tout multi-indice α, la restriction de \(D^\alpha \tilde{f}\) à A soit égale à f_α.

182 Nous ne démontrerons pas ici ces deux théorèmes. Le lecteur trouvera une excellente démonstration dans B. Malgrange [17].

183 Corollaire 3.7.18. (Borei) Soit \(\left(c_\alpha\right)_{\alpha \in \mathbf{N}^n}\) une famille de nombres réels. Il existe une fonction de classe C^∞ sur Rⁿ telle que

\[\begin{equation} \left(\forall \alpha \in \mathrm{N}^n\right) \quad\left(c_\alpha=\frac{D^\alpha f(x)}{\alpha!}\right) \end{equation}\]

184 Démonstration : - Il suffit d’appliquer le théorème 3.7.17 avec A = {0}.

Date de mise en ligne : 31/10/2024

Compte personnel

7. Formules de Taylor - Maxima et minima

Notes

Citer ce chapitre

Notes

Formules de Taylor

Applications de la formule de Taylor au calcul des dérivées de fonctions.

Formule de Taylor par rapport à un système de coordonnées.

Application à l’étude des maxima et des minima.

Condition nécessaire pour un extremum.

Recherche de conditions nécessaires et suffisantes pour un extremum.

Cas particulier d’une fonction de deux variables réelles x et y.

Application de la formule de Taylor à l’étude de la position d’une by-persurface par rapport à son plan tangent.

Fonctions de classe C^m dans une partie fermée au sens de Whitney.

Accès institutions

Toutes les institutions

7. Formules de Taylor - Maxima et minima

Citer ce chapitre

Notes

Citer ce chapitre

Notes

Formules de Taylor

Applications de la formule de Taylor au calcul des dérivées de fonctions.

Formule de Taylor par rapport à un système de coordonnées.

Application à l’étude des maxima et des minima.

Condition nécessaire pour un extremum.

Recherche de conditions nécessaires et suffisantes pour un extremum.

Cas particulier d’une fonction de deux variables réelles x et y.

Application de la formule de Taylor à l’étude de la position d’une by-persurface par rapport à son plan tangent.

Fonctions de classe Cm dans une partie fermée au sens de Whitney.

Accès institutions

Toutes les institutions

Fonctions de classe C^m dans une partie fermée au sens de Whitney.