Řada praktických problémů může být formulována jako optimalizační (minimalizační či maximalizační) úloha. Ve své nejjednodušší podobě zní následovně: různé „případy“ jsou očíslovány parametrem $x$ a hledáme takové řešení, které minimalizuje/maximalizuje jistou funkci $f(x)$ (např. zisk). Uveďme několik jednoduchých příkladů (několik jednoduchých konkrétních ukázek uvádíme v podkapitole 9.11).
Jak distribuovat objednané zboží mezi zákazníky co nejefektivněji, tj. s co nejmenšími náklady na dopravu?
Jak sestavit jídelníček splňující zadané dietologické podmínky a minimalizovat při tom náklady?
Jak efektivně distribuovat pohonné hmoty a materiál na frontu a současně maximalizovat protivníkovy ztráty?
Na optimalizační úlohy často narazíte ve strojovém učení. V řadě metod z této oblasti (např. trénování neuronové sítě) pod termínem „učení“ nenajdeme nic jiného než hledání maxima/minima jisté komplikované funkce.
Zde v BI-MA1 se při hledání maxim a minim omezíme na reálné funkce reálné proměnné. Samozřejmě v realitě je často zapotřebí uvažovat ne jen jednu proměnnou $x$, ale dvě a nebo více. Řešením těchto otázek se zabývá teorie funkce více proměnných, resp. teorie optimalizace. Řada zde zaváděných konceptů se ovšem dále používá i v případě funkcí více proměnných a pro čtenáře je snazší se s nimi v tomto snadno představitelném světě funkcí jedné proměnné seznámit. Funkcím více proměnných a jejich extrémům se budeme věnovat v BI-MA2
Započněme výklad této problematiky přesným zavedením pojmů lokálního minima a maxima funkce.
Řekneme, že funkce $f$ má v bodě $a\in D_f$
lokální maximum,
lokální minimum,
ostré lokální maximum,
ostré lokální minimum,
právě když existuje okolí (v případném krajním bodě definičního oboru jednostranné) $U_a \subset D_f$ bodu $a$ tak, že (popořadě)
pro všechna $x\in U_a$ platí $f(x) \leq f(a)$,
pro všechna $x\in U_a$ platí $f(x) \geq f(a)$,
pro všechna $x\in U_a\smallsetminus\{a\}$ platí $f(x) < f(a)$,
pro všechna $x\in U_a\smallsetminus\{a\}$ platí $f(x) > f(a)$.
Lokální maximum a lokální minimum společně nazýváme lokální extrém. Následující věta dává nutnou podmínku pro existenci lokálního extrému. Pro lepší představu a orientaci mezi těmito typy extrémů uvádíme Obrázek 9.2.
Nyní se můžeme snažit odpovědět na otázku, jak extrémy funkcí hledat. První výsledek je negativního charakteru, říká nám kde zcela jistě extrémy funkce nenastávají. Můžeme se pak soustředit na prozkoumávání bodů, kde extrémy být mohou.
Nechť funkce $f$ má v bodě $a$ lokální extrém. Potom buď $f^{\prime}(a) = 0$, nebo derivace v bodě $a$ neexistuje.
Kdyby např. $f'(a) = \displaystyle \lim_{x\to a} \frac{f(x) - f(a)}{x-a} > 0$, potom lze nalézt $\veps > 0$ tak, že pro všechna $x\in(a-\veps, \ a+\veps) \smallsetminus \{a\}$ platí
Potom ale platí $f(x) > f(a)$ pro $x\in(a,\ a+\veps)$ a $f(x) < f(a)$ pro $x\in(a-\veps,a)$. Funkce $f$ tedy v bodě $a$ nemá lokální extrém (spor). Podobně lze postupovat v případě $f'(a) < 0$.
$\square$
Tato věta udává pouze nutnou podmínku pro existenci lokálního extrému.
Zdůrazněme tento fakt pomocí následujícího příkladu.
Funkce $f(x) \ceq x^3$ má v bodě $0$ nulovou derivaci, $f'(0) = 0$, avšak nenabývá v něm lokálního extrému (opět viz definici: pro kladné reálné $x$ platí $x^3 > 0$ a pro záporné reálné $x$ platí $x^3 < 0$). Je dokonce rostoucí na celém $\R$. Jinak řečeno, k tomu aby funkce v bodě $a$ měla extrém nestačí aby $f'(a) = 0$. Tento omyl je častým zdrojem chyb.
Extrém skutečně snadno může nastat i v bodě, kde derivace neexistuje. Uvažte následující jednoduchý příklad.
Uvažme funkci $f(x) \ceq |x|$. Funkce $f$ má jistě ostré lokální minimum v bodě $0$ (to vidíme přímo z definice ostrého lokálního minima: pro všechna nenulová reálná $x$ platí $|x| > 0$ a $0 = 0$), ale její derivace v bodě $0$ neexistuje (vypočteno v předchozí části textu).
Grafy funkcí z předchozích dvou příkladů jsou uvedeny na Obrázku 9.3.
Zobrazení $f\colon D_f \to \R$, kde $D_f \subset \R$ je neprázdná množina reálných čísel, nazýváme reálnou funkcí reálné proměnné.
Pod okolím bodu $a\in\eR$, ozn. $U_a$, máme na mysli buď okolí $U_a(\veps)$ pro nějaké $a\in\R$ a $\veps > 0$, nebo okolí $U_{\pm\infty}(c)$ pro nějaké $c\in\R$.
Zobrazení $f\colon D_f \to \R$, kde $D_f \subset \R$ je neprázdná množina reálných čísel, nazýváme reálnou funkcí reálné proměnné.
Řekneme, že funkce $f$ má v bodě $a\in D_f$
lokální maximum,
lokální minimum,
ostré lokální maximum,
ostré lokální minimum,
právě když existuje okolí (v případném krajním bodě definičního oboru jednostranné) $U_a \subset D_f$ bodu $a$ tak, že (popořadě)
pro všechna $x\in U_a$ platí $f(x) \leq f(a)$,
pro všechna $x\in U_a$ platí $f(x) \geq f(a)$,
pro všechna $x\in U_a\smallsetminus\{a\}$ platí $f(x) < f(a)$,
pro všechna $x\in U_a\smallsetminus\{a\}$ platí $f(x) > f(a)$.
Nechť $f$ je funkce definovaná na okolí bodu $a\in\R$. Pokud existuje limita
nazveme její hodnotu derivací funkce $f$ v bodě $a$ a označíme $f^\prime(a)$. Pokud je tato limita konečná (tj. $f^\prime(a) \in \R$) řekneme, že funkce $f$ je diferencovatelná v bodě $a$.