Začněme nejprve jednoduchými kritérii pro indefinitnost (stačí nalézt dva vektory, pro které dostaneme hodnoty různých znamének).
Pokud máme kvadratickou formu
pak dosazením $j$-tého standardního bazického $\ve_j$ vektoru dostaneme $j$-tý prvek na diagonále matice $\mM$: $q(\ve_j) = \mM_{jj}$. Tudíž jsme dokázali:
Pokud má symetrická matice $\mM$ na diagonále prvky s různým znaménkem (jedno kladné, jedno záporné), potom je kvadratická forma $q(\vx) = \vx^T \mM \vx$ indefinitní.
Toto pozorování dává pouze postačující podmínku pro indefinitnost. Kvadratická forma $q(\vx) = (x_1,x_2) \begin{pmatrix}1 & 2 \\ 2 & 1 \end{pmatrix} \begin{pmatrix}x_1 \\ x_2\end{pmatrix} = x_1^2 + 4x_1x_2 + x_2^2$ je indefinitní (ukážeme později) i když má na diagonále pouze kladná čísla!
Bez důkazu uvedeme následující klíčové tvrzení z Lineární algebry (studenti z BI-LA2 znají, pro ostatní stačí bez důkazu jako fakt).
Symetrická reálná matice je diagonalizovatelná a všechna její vlastní čísla jsou reálná. Vlastní vektory příslušející různým vlastním číslům jsou vzájemně ortogonální.
Připomeňme explicitněji smysl předchozího tvrzení: máme-li symetrickou reálnou matici $\mM \in \R^{n,n}$, pak existuje diagonální matice $\mD \in \R^{n,n}$ a regulární matice $\mP \in \R^{n,n}$ splňující
O matici $\mD$ dále víme, že má na diagonále (nutně reálná) vlastní čísla matice $\mM$ a v matici $\mP$ jsou ve sloupcích vlastní vektory příslušející vlastním číslům v pořadí na diagonále $\mD$. Matici $\mP$ lze volit tak, aby $\mP^{-1} = \mP^T$.
Vztah mezi vlastními čísly matice $\mM$ a definitností příslušné kvadratické formy je velmi úzký a názorný:
Kvadratická forma $q(\vx) = \vx^T \mM \vx$ je
PD, právě když všechna vlastní čísla matice $\mM$ jsou kladná.
PSD, právě když všechna vlastní čísla matice $\mM$ jsou nezáporná.
ID, právě když má matice $\mM$ kladné i záporné vlastní číslo.
NSD, právě když všechna vlastní čísla matice $\mM$ jsou nekladná.
ND, právě když všechna vlastní čísla matice $\mM$ jsou záporná.
Dle předchozí Věty 8.1 pro reálnou symetrickou matici $\mM \in \R^{n,n}$ existuje diagonální matice $\mD = \mathrm{diag}(\lambda_1,\ldots,\lambda_n)$ a ortogonální21 matice $\mP \in \R^{n,n}$ splňující $\mM = \mP \mD \mP^{T}$. Potom pro naší formu platí
Nyní si postupně rozmyslíme různé situace.
PSD: Pokud $\lambda_j \geq 0$ pro každé $j\in\hat n$, pak z (8.2) plyne $q(\vx) \geq 0$ pro každý $\vx \in \R^n$. Naopak, pokud $q(\vx) \geq 0$ pro každý $\vx \in \R^n$, pak pro $j\in\hat n$ zvolme $\vx = \mP \ve_j$ (vlastní vektor příslušející $\lambda_j$) a dostaneme $\lambda_j = q(\vx) \geq 0$.
PD: Vzhledem k předchozímu bodu stačí ukázat ekvivalenci: $q(\vx) = 0$ pouze pro $\vx = \theta$, právě když $\lambda_j > 0$ pro každé $j \in \hat n$. $\boldsymbol{\Rightarrow}$: Opět pro $j \in \hat n$ zvolme $x = \mP \ve_j \neq \theta$, pak $0 < q(\vx) = \lambda_j$. $\boldsymbol{\Leftarrow}$: Z $q(\vx) = 0$ a (8.2) v tomto případě plyne $\mP^{T} \vx = \theta$ a tedy i $\vx = \theta$.
NSD a ND: analogicky.
ID: Důsledek již dokázaného.
$\square$
Mějme kvadratickou formu $q(\vx) = \vx^T \mM \vx$ a postupně provádějme následující algebraické operace (pokud je to možné, viz níže):
Ve výrazu $q(\vx)$ zvolme proměnnou $x_k$, která se v něm vyskytuje v kvadrátu.
Vezměme všechny členy obsahující proměnnou $x_k$, tj. výraz tvaru
kde výraz $A := A(x_j, \ j \neq k)$ obsahuje už pouze konstantní násobky proměnných různých od $x_k$.
Tento výraz doplňme na čtverec pomocí standardní úpravy
Celkem pak dostáváme rovnost
kde nová forma $\tilde q$ už nezávisí na $k$-té proměnné $x_k$.
Opakujme tento postup s $\tilde q$.
Pokud tento proces úspěšně proběhne, tak na konci získáme $q(\vx)$ ve tvaru součtu konstantních násobků nejvýše $n$ čtverců.
Předpokládejme, že předchozí postup úspěšně proběhl a máme tedy $q(\vx)$, $\vx\in\R^n$, vyjádřeno ve tvaru
kde $1 \leq k \leq n$, $\mP \in \R^{k, n}$ má hodnost $k$ (plyne z postupné eliminace proměnných) a $\alpha_j \neq 0$, $j\in\hat{k}$.
Potom platí:
Pokud $k = n$ a $\alpha_j > 0$ pro všechna $j \in \hat{k}$, potom je $q$ PD.
Pokud $k = n$ a $\alpha_j < 0$ pro všechna $j \in \hat{k}$, potom je $q$ ND.
Pokud $k < n$ a $\alpha_j > 0$ pro všechna $j \in \hat{k}$, potom je $q$ PSD (ale ne PD).
Pokud $k < n$ a $\alpha_j < 0$ pro všechna $j \in \hat{k}$, potom je $q$ NSD (ale ne ND).
Pokud existují $j,\ell \in \hat{k}$ taková, že $\alpha_j > 0$ a $\alpha_\ell < 0$, potom je $q$ ID.
Problém v předchozím postupu nastane v případě, kdy se jistá proměnná ve výrazu nevyskytuje v kvadrátu, ale pouze ve smíšených členech. Například $xy$.
V takovém konkrétním případě dvou proměnných můžeme použít úpravu
resp. provést substituci $x = u + v$ a $y = u - v$. V obecném případě většího počtu smíšených členů (nejhůře matice $\mM$ s nulovou diagonálou) se postup více komplikuje, ale výše uvedená substituce pomůže.
Úpravu na čtverec ale není nutné provádět, pokud lze snadno rozhodnout o ID. Např.:
je ID: vynulujeme kvadrát ($x = -y$) a zbývající volnost využijeme k vytvoření hodnot s různými znaménky: $q(-1, 1, 1, 1) = -1$ a $q(-1, 1, -1, 1) = 1$. Tadá!
Rozhodněme nyní o definitnosti dvou kvadratických forem, které jsme zmínili dříve v textu (Příklad 8.4).
Kvadratická forma $q(x,y) = x^2 + 2xy + 2y^2$ je PD, protože
Dvě proměnné a dva kladné čtverce.
Kvadratická forma $q(x,y) = x^2 + 4xy + y^2$ je ID, protože
Jeden čtverec kladný, jeden záporný. Odtud také hned vidíme: $q(2, -1) = -3$ (nuluje první čtverec), $q(1, 0) = 1$ (nuluje druhý čtverec).
Pro matici $\mM \in \R^{n,n}$ definujme $\mM_k$ jakožto čtvercovou matici $\mM_k = (\mM_{ij})_{i,j=1}^k$ (tj. „$k \times k$ podmatici v levém horním rohu“).
K určení pozitivní nebo negativní definitnosti máme k dispozici následující kritérium:
Kvadratická forma $q(\vx) = \vx^T \mM \vx$, kde $\mM \in \R^{n,n}$ je symetrická matice, je
PD, právě když pro každé $k \in \hat n$ platí $\det \mM_k > 0$.
ND, právě když pro každé $k \in \hat n$ platí $(-1)^k \det \mM_k > 0$.
Důkaz stačí provést pro případ PD, existuje několik důkazů, my zde volíme jeden z přístupů z článku (Samuels, 1966). Ano, $\mM$ je ND, právě když $-\mM$ je PD a to je ekvivalentní podmínkám $0 < \det(-\mM_k) = (-1)^k \det \mM_k$, $k \in \hat n$.
Nejprve si všimněme, že kvadratická forma definovaná maticí $\mM_k$ je PD pro libovolné $k\in\hat n$. Skutečně, je-li $\vy \in \R^k$ nenulový vektor, pak vektor $\vx \ceq (y_1,\ldots, y_k, 0, \ldots 0)\in \R^n$ je také nenulový a dle předpokladu platí (využijte nul!)
Nyní si stačí uvědomit, že determinant libovolné symetrické reálné PD matice je roven součinu jejích vlastních čísel, která jsou všechna kladná a proto je sám kladný.
$\square$
Mějme symetrickou matici $\mA \in \R^{n,n}$ takovou, že $\mA_{n-1}$ je regulární a označme $\mA = \left(\begin{smallmatrix} \mA_{n-1} & \va \\ \va^T & \alpha \end{smallmatrix}\right)$. Potom existuje regulární matice $\mP \in \R^{n,n}$ splňující $\mP^T \mA \mP = \left(\begin{smallmatrix} \mA_{n-1} & \theta \\ \theta^T & \beta \end{smallmatrix}\right)$. Pokud navíc $\det \mA_{n-1} > 0$ a $\det \mA > 0$, potom $\beta > 0$.
Díky regularitě matice $\mA_{n-1}$ má soustava $\mA_{n-1} \vx = \va$ právě jedno řešení, ozn. ho $\vb = \mA_{n-1}^{-1} \va$. Položme $\mP = \left(\begin{smallmatrix} \mE_{n-1} & -\vb \\ \theta^T & 1 \end{smallmatrix}\right)$. Takováto matice je jistě regulární a platí
Dodatek plyne z rovnosti $(\det \mP)^2 \det \mA = \det \mA_{n-1} \cdot \beta$.
$\square$
Nyní můžeme dokončit důkaz Sylvesterova kritéria.
Tvrzení je pravdivé pro $n = 1$ ($\det (a_{11}) = a_{11}$).
Mějme $n \geq 2$ a předpokládejme, že tvrzení platí pro $n-1$. Z předchozího Lemma aplikovaného na $\mM$ plyne existence regulární matice $\mP$ takové, že
kde $\vx_{n-1} = (x_1,\ldots,x_{n-1})^T$. Matice $\mM_{n-1}$ je PD a $\beta$ je kladná, takže i $\mM$ je PD.
$\square$
Následující příklad vyvrací častý mýtus, který se někdy objevuje i v literatuře: pokud platí $\det \mM_k \geq 0$ pro každé $k \in \hat n$, tak příslušná kvadratická forma není nutně PSD (analogicky pro NSD).
Uvažme
Potom $\det \mM_1 = 1 \geq 0$, $\det \mM_2 = 0 \geq 0$ a $\det \mM_3 = 0 \geq 0$. Ale příslušná forma je indefinitní, protože (úprava na čtverce)
a proto $q_\mM(2, 0, -1) = -3 < 0$ a $q_\mM(1, 0, 0) = 1 > 0$.