9.7 Důsledky pro konvexnost/konkávnost

Zjistili jsme, že první derivace funkce $f$ souvisí s monotonií funkce $f$. Nyní ukážeme, že druhá derivace funkce $f$ dále souvisí s tvarem grafu funkce $f$. Nejprve zaveďme potřebné pojmy.

9.7.1 Konvexita a konkavita funkce

Definice 9.7 (Konvexnost a konkávnost funkce v bodě)

Nechť funkce $f$ je diferencovatelná v bodě $a\in D_f$. Pokud existuje okolí $U_a$ bodu $a$ takové, že pro všechna $x\in U_a\smallsetminus\{a\}$ leží body $(x, f(x))$ nad (resp. pod) tečnou funkce $f$ v bodě $a$, tj.

\begin{equation*} f(x) > f(a) + f^{\prime}(a) (x-a), \ \text{(resp.} \ f(x) < f(a) + f^{\prime}(a) (x-a) \text{)}, \end{equation*}

pak $f$ nazveme ryze konvexní (resp. konkávní) v bodě $a$.

Pokud pro body $(x,f(x))$ výše připustíme možnost ležet na tečně (tj. připustíme neostré nerovnosti), pak $f$ nazveme konvexní (resp. konkávní) v bodě $a$.

Vybaveni pojmem konvexity/konkavity v bodě zavádíme i konvexitu/konkavitu na intervalu. Podobně jsme postupovali i v případě spojitosti (viz Definici 7.1 a Definici 7.2).

Definice 9.8 (Konvexnost a konkávnost funkce)

Funkci $f$ nazveme (ryze) konvexní (resp. konkávní) na intervalu $J$, právě když je na tomto intervalu spojitá a je (ryze) konvexní (resp. konkávní) v každém bodě intervalu $J^\circ$.

Očividně, $f$ je konkávní na intervalu $J$, právě když $-f$ je konvexní na intervalu $J$. Stačí se tedy soustředit například na konvexní funkce.

K osvětlení terminologie uveďme etymologický význam obou pojmů. Convexum má v latině význam údolí a concavum význam výdutě. Ukázka konvexní a konkávní funkce je dále uvedena na Obrázku 9.10.

Obrázek 9.10: Konvexní a konkávní funkce.

9.7.2 Kritérium konvexnosti a konkávnosti

V předchozí podkapitole jsme se zabývali vztahem první derivace a různými typy monotonie funkce. Nyní si ukážeme jak konvexita a konkavita souvisí s druhou derivací funkce.

Věta 9.8 (Kritérium pro konvexnost)

Buď $f$ funkce spojitá na intervalu $J$, která má druhou derivaci v každém bodě intervalu $J^\circ$. Potom platí dvě následující tvrzení:

  • $f^{\prime\prime}(x) \geq 0$ pro každé $x\in J^\circ$, právě když $f$ je konvexní na intervalu $J$.

  • Je-li $f^{\prime\prime}(x) > 0$ v každém bodě $x\in J^\circ$, pak je $f$ ryze konvexní na $J$.

Stejná tvrzení platí pro konkávnost pokud otočíme znaménka nerovností (tj. v prvním tvrzení bude derivace nekladná v druhém záporná).

Poznámka 9.2

Funkce $f(x) = x^4$ je ryze konvexní na $\R$, ale $f''(0) = 0$. Implikaci v druhém bodě předchozí věty proto nelze obrátit.

Zobrazit důkaz

Nejprve proveďme důkaz implikací $\Rightarrow$ v obou bodech (konkrétně pro $\geq$, nerovnost $>$ stejně).

Z předpokladu $f''(x) \geq 0$, $x\in J^\circ$ plyne, že $f'$ je rostoucí na $J^\circ$. Mějme $a \in J^\circ$ a $x \in J^\circ$ takové, že $x > a$. Potom dle Lagrangeovy věty existuje $c \in (a,x)$ takové, že

\begin{equation*} f(x) = f(a) + f'(c)(x-a) \geq f(a) + f'(a)(x-a). \end{equation*}

Skutečně: $a < c$ a proto $f'(a) \leq f'(c)$ a $x - a > 0$.

Máme-li teď $x \in J^\circ$ takové, že $x < a$, pak existuje $c \in (x,a)$ takové, že

\begin{equation*} f(x) = f(a) + f'(c) (x - a). \end{equation*}

Skutečně: $c < a$ a proto $f'(c) \leq f'(a)$ a $f'(c) (x-a) \geq f'(a) (x-a)$, neboť nyní $x - a < 0$.

Nyní proveďme důkaz implikace $\Leftarrow$ v prvním bodě. Postupujme sporem. Předpokládejme, že $f$ je konvexní na $J$ a současně existuje bod $a \in J^\circ$ splňující

\begin{equation*} f''(a) = \lim_{x\to a} \frac{f'(x) - f'(a)}{x-a} < 0. \end{equation*}

Existuje tedy $U_a(\delta) \subset J$ takové, že

\begin{equation*} \frac{f'(x) - f'(a)}{x-a} < 0 \quad \text{kdykoliv} \ x\in U_a(\delta) \smallsetminus \{a\}. \end{equation*}

Celkem tedy $f'(a) > f'(x)$ kdykoliv $x \in (a,a + \delta)$. Z Lagrangeovy věty aplikované na interval $\langle a, x\rangle$ a funkci $f$ plyne existence $c$ takového, že

\begin{equation*} f(x) = f(a) + f'(c)(x-a) < f(a) + f'(a)(x-a) \end{equation*}

pro libovolné $x \in (a,a+\delta)$, což je ve sporu s konvexitou $f$ v bodě $a$.

$\square$

9.7.3 Poznámka k zobecnění konvexity a konkavity

Pojem konvexity a konkavity lze zavést i obecněji bez potřeby využívat pojem tečny a tedy diferencovatelnosti. Například v pojetí předchozího textu funkce $|x|$ není konvexní (na $\R$), v nule nemá derivaci. Tento problém odstraňuje následující definice, na které v různých zdrojích také můžete narazit.

Definice 9.9

Funkci $f$ definovanou na intervalu $J$ nazveme konvexní na intervalu (resp. konkávní na intervalu) $J$, právě když pro každé $x_1,x_2,x_3\in J$ splňující $x_1 < x_2 < x_3$, leží bod $(x_2,f(x_2))$ buďto pod (resp. nad) přímkou spojující body $(x_1,f(x_1))$ a $(x_3,f(x_3))$, nebo na ní.

Definice 9.10

Funkci $f$ definovanou na intervalu $J$ nazveme ryze konvexní na intervalu (resp. ryze konkávní na intervalu) $J$, právě když pro každé $x_1,x_2,x_3\in J$ splňující $x_1 < x_2 < x_3$, leží bod $(x_2,f(x_2))$ pod (resp. nad) přímkou spojující body $(x_1,f(x_1))$ a $(x_3,f(x_3))$.

Obrázek 9.11: Ilustrace k Definici 9.9.