9.2 Lokální extrémy funkce

Řada praktických problémů může být formulována jako optimalizační (minimalizační či maximalizační) úloha. Ve své nejjednodušší podobě zní následovně: různé „případy“ jsou očíslovány parametrem $x$ a hledáme takové řešení, které minimalizuje/maximalizuje jistou funkci $f(x)$ (např. zisk). Uveďme několik jednoduchých příkladů (několik jednoduchých konkrétních ukázek uvádíme v podkapitole 9.11).

  • Jak distribuovat objednané zboží mezi zákazníky co nejefektivněji, tj. s co nejmenšími náklady na dopravu?

  • Jak sestavit jídelníček splňující zadané dietologické podmínky a minimalizovat při tom náklady?

  • Jak efektivně distribuovat pohonné hmoty a materiál na frontu a současně maximalizovat protivníkovy ztráty?

Na optimalizační úlohy často narazíte ve strojovém učení. V řadě metod z této oblasti (např. trénování neuronové sítě) pod termínem „učení“ nenajdeme nic jiného než hledání maxima/minima jisté komplikované funkce.

Zde v  BI-MA1 se při hledání maxim a minim omezíme na reálné funkce reálné proměnné. Samozřejmě v realitě je často zapotřebí uvažovat ne jen jednu proměnnou $x$, ale dvě a nebo více. Řešením těchto otázek se zabývá teorie funkce více proměnných, resp. teorie optimalizace. Řada zde zaváděných konceptů se ovšem dále používá i v případě funkcí více proměnných a pro čtenáře je snazší se s nimi v tomto snadno představitelném světě funkcí jedné proměnné seznámit. Funkcím více proměnných a jejich extrémům se budeme věnovat v  BI-MA2

Započněme výklad této problematiky přesným zavedením pojmů lokálního minima a maxima funkce.

Definice 9.4 (Lokální extrém funkce)

Řekneme, že funkce $f$ má v bodě $a\in D_f$

  1. lokální maximum,

  2. lokální minimum,

  3. ostré lokální maximum,

  4. ostré lokální minimum,

právě když existuje okolí (v případném krajním bodě definičního oboru jednostranné) $U_a \subset D_f$ bodu $a$ tak, že (popořadě)

  1. pro všechna $x\in U_a$ platí $f(x) \leq f(a)$,

  2. pro všechna $x\in U_a$ platí $f(x) \geq f(a)$,

  3. pro všechna $x\in U_a\smallsetminus\{a\}$ platí $f(x) < f(a)$,

  4. pro všechna $x\in U_a\smallsetminus\{a\}$ platí $f(x) > f(a)$.

Lokální maximum a lokální minimum společně nazýváme lokální extrém. Následující věta dává nutnou podmínku pro existenci lokálního extrému. Pro lepší představu a orientaci mezi těmito typy extrémů uvádíme Obrázek 9.2.

Obrázek 9.2: K definici různých typů extrémů.

Nyní se můžeme snažit odpovědět na otázku, jak extrémy funkcí hledat. První výsledek je negativního charakteru, říká nám kde zcela jistě extrémy funkce nenastávají. Můžeme se pak soustředit na prozkoumávání bodů, kde extrémy být mohou.

Věta 9.2 (Nutná podmínka existence lokálního extrému)

Nechť funkce $f$ má v bodě $a$ lokální extrém. Potom buď $f^{\prime}(a) = 0$, nebo derivace v bodě $a$ neexistuje.

Zobrazit důkaz

Kdyby např. $f'(a) = \displaystyle \lim_{x\to a} \frac{f(x) - f(a)}{x-a} > 0$, potom lze nalézt $\veps > 0$ tak, že pro všechna $x\in(a-\veps, \ a+\veps) \smallsetminus \{a\}$ platí

\begin{equation*} \frac{f(x) - f(a)}{x-a} > 0. \end{equation*}

Potom ale platí $f(x) > f(a)$ pro $x\in(a,\ a+\veps)$ a $f(x) < f(a)$ pro $x\in(a-\veps,a)$. Funkce $f$ tedy v bodě $a$ nemá lokální extrém (spor). Podobně lze postupovat v případě $f'(a) < 0$.

$\square$

Varování 9.1

Tato věta udává pouze nutnou podmínku pro existenci lokálního extrému.

Zdůrazněme tento fakt pomocí následujícího příkladu.

Příklad 9.2 (Bod nulové derivace bez extrému)

Funkce $f(x) \ceq x^3$ má v bodě $0$ nulovou derivaci, $f'(0) = 0$, avšak nenabývá v něm lokálního extrému (opět viz definici: pro kladné reálné $x$ platí $x^3 > 0$ a pro záporné reálné $x$ platí $x^3 < 0$). Je dokonce rostoucí na celém $\R$. Jinak řečeno, k tomu aby funkce v bodě $a$ měla extrém nestačí aby $f'(a) = 0$. Tento omyl je častým zdrojem chyb.

Extrém skutečně snadno může nastat i v bodě, kde derivace neexistuje. Uvažte následující jednoduchý příklad.

Příklad 9.3 (Extrém v bodě s neexistující derivací)

Uvažme funkci $f(x) \ceq |x|$. Funkce $f$ má jistě ostré lokální minimum v bodě $0$ (to vidíme přímo z definice ostrého lokálního minima: pro všechna nenulová reálná $x$ platí $|x| > 0$ a $0 = 0$), ale její derivace v bodě $0$ neexistuje (vypočteno v předchozí části textu).

Grafy funkcí z předchozích dvou příkladů jsou uvedeny na Obrázku 9.3.

Obrázek 9.3: Graf absolutní hodnoty (v bodě $0$, kde neexistuje derivace, nabývá minima) a funkce $x^3$ (v bodě $0$ sice má nulovou derivaci, ale v tomto bodě nenabývá extrému).