8.2 Určování definitností forem

Začněme nejprve jednoduchými kritérii pro indefinitnost (stačí nalézt dva vektory, pro které dostaneme hodnoty různých znamének).

Pokud máme kvadratickou formu

\begin{equation*} q(\vx) = \vx^T \mM \vx, \end{equation*}

pak dosazením $j$-tého standardního bazického $\ve_j$ vektoru dostaneme $j$-tý prvek na diagonále matice $\mM$: $q(\ve_j) = \mM_{jj}$. Tudíž jsme dokázali:

Tvrzení 8.1

Pokud má symetrická matice $\mM$ na diagonále prvky s různým znaménkem (jedno kladné, jedno záporné), potom je kvadratická forma $q(\vx) = \vx^T \mM \vx$ indefinitní.

Poznámka 8.1

Toto pozorování dává pouze postačující podmínku pro indefinitnost. Kvadratická forma $q(\vx) = (x_1,x_2) \begin{pmatrix}1 & 2 \\ 2 & 1 \end{pmatrix} \begin{pmatrix}x_1 \\ x_2\end{pmatrix} = x_1^2 + 4x_1x_2 + x_2^2$ je indefinitní (ukážeme později) i když má na diagonále pouze kladná čísla!

Bez důkazu uvedeme následující klíčové tvrzení z Lineární algebry (studenti z  BI-LA2 znají, pro ostatní stačí bez důkazu jako fakt).

Věta 8.1 (Diagonalizace symetrické reálné matice)

Symetrická reálná matice je diagonalizovatelná a všechna její vlastní čísla jsou reálná. Vlastní vektory příslušející různým vlastním číslům jsou vzájemně ortogonální.

Připomeňme explicitněji smysl předchozího tvrzení: máme-li symetrickou reálnou matici $\mM \in \R^{n,n}$, pak existuje diagonální matice $\mD \in \R^{n,n}$ a regulární matice $\mP \in \R^{n,n}$ splňující

\begin{equation*} \mD = \mP^{-1} \mM \mP, \quad \text{resp.} \quad \mM = \mP \mD \mP^{-1}. \end{equation*}

O matici $\mD$ dále víme, že má na diagonále (nutně reálná) vlastní čísla matice $\mM$ a v matici $\mP$ jsou ve sloupcích vlastní vektory příslušející vlastním číslům v pořadí na diagonále $\mD$. Matici $\mP$ lze volit tak, aby $\mP^{-1} = \mP^T$.

Vztah mezi vlastními čísly matice $\mM$ a definitností příslušné kvadratické formy je velmi úzký a názorný:

Důsledek 8.1 (Vztah definitností a vlastních čísel)

Kvadratická forma $q(\vx) = \vx^T \mM \vx$ je

  • PD, právě když všechna vlastní čísla matice $\mM$ jsou kladná.

  • PSD, právě když všechna vlastní čísla matice $\mM$ jsou nezáporná.

  • ID, právě když má matice $\mM$ kladné i záporné vlastní číslo.

  • NSD, právě když všechna vlastní čísla matice $\mM$ jsou nekladná.

  • ND, právě když všechna vlastní čísla matice $\mM$ jsou záporná.

Zobrazit důkaz

Dle předchozí Věty 8.1 pro reálnou symetrickou matici $\mM \in \R^{n,n}$ existuje diagonální matice $\mD = \mathrm{diag}(\lambda_1,\ldots,\lambda_n)$ a ortogonální21 matice $\mP \in \R^{n,n}$ splňující $\mM = \mP \mD \mP^{T}$. Potom pro naší formu platí

\begin{equation}\label{eq_formy_cisla}\tag{8.2} q(\vx) = \vx^T \mM \vx = \vx^T \mP \mD \mP^{T} \vx = \big(\mP^T \vx\big)^T \mD \big(\mP^T \vx \big) = \sum_{j=1}^n \lambda_j \big( \mP^T \vx \big)_j^{2}. \end{equation}

Nyní si postupně rozmyslíme různé situace.

PSD: Pokud $\lambda_j \geq 0$ pro každé $j\in\hat n$, pak z (8.2) plyne $q(\vx) \geq 0$ pro každý $\vx \in \R^n$. Naopak, pokud $q(\vx) \geq 0$ pro každý $\vx \in \R^n$, pak pro $j\in\hat n$ zvolme $\vx = \mP \ve_j$ (vlastní vektor příslušející $\lambda_j$) a dostaneme $\lambda_j = q(\vx) \geq 0$.

PD: Vzhledem k předchozímu bodu stačí ukázat ekvivalenci: $q(\vx) = 0$ pouze pro $\vx = \theta$, právě když $\lambda_j > 0$ pro každé $j \in \hat n$. $\boldsymbol{\Rightarrow}$: Opět pro $j \in \hat n$ zvolme $x = \mP \ve_j \neq \theta$, pak $0 < q(\vx) = \lambda_j$. $\boldsymbol{\Leftarrow}$: Z $q(\vx) = 0$ a (8.2) v tomto případě plyne $\mP^{T} \vx = \theta$ a tedy i $\vx = \theta$.

NSD a ND: analogicky.

ID: Důsledek již dokázaného.

$\square$

8.2.1 Úprava na čtverce

Mějme kvadratickou formu $q(\vx) = \vx^T \mM \vx$ a postupně provádějme následující algebraické operace (pokud je to možné, viz níže):

  1. Ve výrazu $q(\vx)$ zvolme proměnnou $x_k$, která se v něm vyskytuje v kvadrátu.

  2. Vezměme všechny členy obsahující proměnnou $x_k$, tj. výraz tvaru

    \begin{equation*} \alpha x_k^2 + A(x_j, \ j\neq k) \cdot x_k, \end{equation*}

    kde výraz $A := A(x_j, \ j \neq k)$ obsahuje už pouze konstantní násobky proměnných různých od $x_k$.

  3. Tento výraz doplňme na čtverec pomocí standardní úpravy

    \begin{equation*} \alpha x_k^2 + A \cdot x_k = \alpha \left(x_k + \frac{A}{2\alpha}\right)^2 - \frac{A^2}{4\alpha}. \end{equation*}

  4. Celkem pak dostáváme rovnost

    \begin{equation*} q(\vx) = \alpha \left(x_k + \frac{A}{2\alpha}\right)^2 + \tilde{q}(x_1, \ldots, x_{k-1},x_{k+1},\ldots,x_n), \end{equation*}

    kde nová forma $\tilde q$ už nezávisí na $k$-té proměnné $x_k$.

  5. Opakujme tento postup s $\tilde q$.

Pokud tento proces úspěšně proběhne, tak na konci získáme $q(\vx)$ ve tvaru součtu konstantních násobků nejvýše $n$ čtverců.

Věta 8.2 (Typy definitností a úprava na čtverce)

Předpokládejme, že předchozí postup úspěšně proběhl a máme tedy $q(\vx)$, $\vx\in\R^n$, vyjádřeno ve tvaru

\begin{equation*} q(\vx) = \sum_{j=1}^k \alpha_j \big( (\mP \vx)_j \big)^2, \end{equation*}

kde $1 \leq k \leq n$, $\mP \in \R^{k, n}$ má hodnost $k$ (plyne z postupné eliminace proměnných) a $\alpha_j \neq 0$, $j\in\hat{k}$.

Potom platí:

  • Pokud $k = n$ a $\alpha_j > 0$ pro všechna $j \in \hat{k}$, potom je $q$ PD.

  • Pokud $k = n$ a $\alpha_j < 0$ pro všechna $j \in \hat{k}$, potom je $q$ ND.

  • Pokud $k < n$ a $\alpha_j > 0$ pro všechna $j \in \hat{k}$, potom je $q$ PSD (ale ne PD).

  • Pokud $k < n$ a $\alpha_j < 0$ pro všechna $j \in \hat{k}$, potom je $q$ NSD (ale ne ND).

  • Pokud existují $j,\ell \in \hat{k}$ taková, že $\alpha_j > 0$ a $\alpha_\ell < 0$, potom je $q$ ID.

Zobrazit důkaz

Důkaz v podstatě kopíruje důkaz Důsledku 8.1. V něm jsme vlastní čísla a diagonalizaci využili k provedení úpravy na čtverce, viz rovnici (8.2). Koeficienty u čtverců byla právě vlastní čísla.

$\square$

Problém v předchozím postupu nastane v případě, kdy se jistá proměnná ve výrazu nevyskytuje v kvadrátu, ale pouze ve smíšených členech. Například $xy$.

V takovém konkrétním případě dvou proměnných můžeme použít úpravu

\begin{equation*} xy = \frac{1}{4}(x + y)^2 - \frac{1}{4}(x - y)^2, \end{equation*}

resp. provést substituci $x = u + v$ a $y = u - v$. V obecném případě většího počtu smíšených členů (nejhůře matice $\mM$ s nulovou diagonálou) se postup více komplikuje, ale výše uvedená substituce pomůže.

Úpravu na čtverec ale není nutné provádět, pokud lze snadno rozhodnout o ID. Např.:

\begin{equation*} q(x,y,z,u) = (x + y)^2 + yz - 2zu \end{equation*}

je ID: vynulujeme kvadrát ($x = -y$) a zbývající volnost využijeme k vytvoření hodnot s různými znaménky: $q(-1, 1, 1, 1) = -1$ a $q(-1, 1, -1, 1) = 1$. Tadá!

Rozhodněme nyní o definitnosti dvou kvadratických forem, které jsme zmínili dříve v textu (Příklad 8.4).

Příklad 8.5

Kvadratická forma $q(x,y) = x^2 + 2xy + 2y^2$ je PD, protože

\begin{equation*} q(x,y) = (x + y)^2 + y^2 \end{equation*}

Dvě proměnné a dva kladné čtverce.

Příklad 8.6

Kvadratická forma $q(x,y) = x^2 + 4xy + y^2$ je ID, protože

\begin{equation*} q(x,y) = (x + 2y)^2 - 3y^2. \end{equation*}

Jeden čtverec kladný, jeden záporný. Odtud také hned vidíme: $q(2, -1) = -3$ (nuluje první čtverec), $q(1, 0) = 1$ (nuluje druhý čtverec).

8.2.2 Sylvesterovo kritérium

Pro matici $\mM \in \R^{n,n}$ definujme $\mM_k$ jakožto čtvercovou matici $\mM_k = (\mM_{ij})_{i,j=1}^k$ (tj. „$k \times k$ podmatici v levém horním rohu“).

K určení pozitivní nebo negativní definitnosti máme k dispozici následující kritérium:

Věta 8.3 (Sylvesterovo kritérium)

Kvadratická forma $q(\vx) = \vx^T \mM \vx$, kde $\mM \in \R^{n,n}$ je symetrická matice, je

  • PD, právě když pro každé $k \in \hat n$ platí $\det \mM_k > 0$.

  • ND, právě když pro každé $k \in \hat n$ platí $(-1)^k \det \mM_k > 0$.

Důkaz stačí provést pro případ PD, existuje několik důkazů, my zde volíme jeden z přístupů z článku (Samuels, 1966). Ano, $\mM$ je ND, právě když $-\mM$ je PD a to je ekvivalentní podmínkám $0 < \det(-\mM_k) = (-1)^k \det \mM_k$, $k \in \hat n$.

Nejprve si všimněme, že kvadratická forma definovaná maticí $\mM_k$ je PD pro libovolné $k\in\hat n$. Skutečně, je-li $\vy \in \R^k$ nenulový vektor, pak vektor $\vx \ceq (y_1,\ldots, y_k, 0, \ldots 0)\in \R^n$ je také nenulový a dle předpokladu platí (využijte nul!)

\begin{equation*} \vy^T \mM_k \vy = \vx^T \mM \vx > 0. \end{equation*}

Nyní si stačí uvědomit, že determinant libovolné symetrické reálné PD matice je roven součinu jejích vlastních čísel, která jsou všechna kladná a proto je sám kladný.

$\square$

Lemma 8.1 (Pomocné tvrzení)

Mějme symetrickou matici $\mA \in \R^{n,n}$ takovou, že $\mA_{n-1}$ je regulární a označme $\mA = \left(\begin{smallmatrix} \mA_{n-1} & \va \\ \va^T & \alpha \end{smallmatrix}\right)$. Potom existuje regulární matice $\mP \in \R^{n,n}$ splňující $\mP^T \mA \mP = \left(\begin{smallmatrix} \mA_{n-1} & \theta \\ \theta^T & \beta \end{smallmatrix}\right)$. Pokud navíc $\det \mA_{n-1} > 0$ a $\det \mA > 0$, potom $\beta > 0$.

Zobrazit důkaz

Díky regularitě matice $\mA_{n-1}$ má soustava $\mA_{n-1} \vx = \va$ právě jedno řešení, ozn. ho $\vb = \mA_{n-1}^{-1} \va$. Položme $\mP = \left(\begin{smallmatrix} \mE_{n-1} & -\vb \\ \theta^T & 1 \end{smallmatrix}\right)$. Takováto matice je jistě regulární a platí

\begin{gather*} \mP^T \mA \mP = \begin{pmatrix} \mE_{n-1} & \theta \\ -\vb^T & 1 \end{pmatrix} \begin{pmatrix} \mA_{n-1} & \va \\ \va^T & \alpha \end{pmatrix} \begin{pmatrix} \mE_{n-1} & -\vb \\ \theta^T & 1 \end{pmatrix} = \\ \begin{pmatrix} \mA_{n-1} & \va \\ -\vb^T \mA_{n-1} + \va^T = \theta^T & - \vb^T \va + \alpha \end{pmatrix} \begin{pmatrix} \mE_{n-1} & -\vb \\ \theta^T & 1 \end{pmatrix} = \begin{pmatrix} \mA_{n-1} & -\mA_{n-1}\vb + \va = \theta \\ \theta^T & -\vb^T \va + \alpha =: \beta \end{pmatrix}\end{gather*}

Dodatek plyne z rovnosti $(\det \mP)^2 \det \mA = \det \mA_{n-1} \cdot \beta$.

$\square$

Nyní můžeme dokončit důkaz Sylvesterova kritéria.

Tvrzení je pravdivé pro $n = 1$ ($\det (a_{11}) = a_{11}$).

Mějme $n \geq 2$ a předpokládejme, že tvrzení platí pro $n-1$. Z předchozího Lemma aplikovaného na $\mM$ plyne existence regulární matice $\mP$ takové, že

\begin{equation*} (\mP \vx)^T \mM (\mP \vx) = \vx_{n-1} \mM_{n-1} \vx_{n-1} + \beta x_n^2, \end{equation*}

kde $\vx_{n-1} = (x_1,\ldots,x_{n-1})^T$. Matice $\mM_{n-1}$ je PD a $\beta$ je kladná, takže i $\mM$ je PD.

$\square$

Následující příklad vyvrací častý mýtus, který se někdy objevuje i v literatuře: pokud platí $\det \mM_k \geq 0$ pro každé $k \in \hat n$, tak příslušná kvadratická forma není nutně PSD (analogicky pro NSD).

Příklad 8.7

Uvažme

\begin{equation*} \mM = \begin{pmatrix} 1 & 0 & 2 \\ 0 & 0 & 0 \\ 2 & 0 & 1 \end{pmatrix}. \end{equation*}

Potom $\det \mM_1 = 1 \geq 0$, $\det \mM_2 = 0 \geq 0$ a $\det \mM_3 = 0 \geq 0$. Ale příslušná forma je indefinitní, protože (úprava na čtverce)

\begin{equation*} q_\mM(\vx) = \vx^T \mM \vx = x_1^2 + 4 x_1 x_3 + x_3^2 = (x_1 + 2x_3)^2 - 3x_3^2 \end{equation*}

a proto $q_\mM(2, 0, -1) = -3 < 0$ a $q_\mM(1, 0, 0) = 1 > 0$.