Lineární zobrazení

Tomáš Kalvoda, KAM FIT ČVUT, 2019

Příklad 6.8

Tento příklad je poměrně typický a obsahuje většinu pojmů týkajících se lineárního zobrazení. Použijeme ho proto jako ukázkový.

Máme lineární zobrazení, resp. operátor, $A: \mathbb{R}^4 \to \mathbb{R}^4$ zadané předpisem

$A(\alpha_1, \alpha_2, \alpha_3, \alpha_4) := (\alpha_1, \alpha_1 - \alpha_2, \alpha_1 + 2\alpha_3, \alpha_4),$

pro každý vektor $(\alpha_1,\alpha_2,\alpha_3,\alpha_4)\in\mathbb{R}^4$ . Linearitu tohoto zobrazení na tomto místě nebudeme ověřovat, plyne velmi jednoduše přímo z definice (ověřte, že $A(x + \beta y) = Ax + \beta Ay$ pro každé $\beta\in\mathbb{R}, x,y\in\mathbb{R}^4$ ).

Pro naše účely v SageMath stačí pracovat v $\mathbb{Q}^4$ . Následuje definice našeho vektorového prostoru a samotného zobrazení $A$ .

V = QQ^4
def A(v):
    # pozor na indexování vektorů od 0
    return V([v[0], v[0] - v[1], v[0] + 2*v[2], v[3]])

Tato definice přesně odpovídá té v zadání Příkladu 6.8 o pár řádků výše. $A$ tedy na vektorech působí dle definice například takto

A(V([1,2,3,4]))

(1, -1, 7, 4)

A(V([1,0,0,0]))

(1, 1, 1, 0)

$A$ bere na vstupu čtveřici čísel, vektor z $\mathbb{R}^4$ , a vyplivne výsledek, opět vektor z $\mathbb{R}^4$ .

Dvě báze a připomenutí souřadnic vektoru

V prostoru $V$ máme v Příkladu 6.8 zadány dvě báze:

X = [
    V((1, 0, -1, 1)),
    V((2, 1, 0, -1)),
    V((0, 2, -1, 1)),
    V((2, -1, 1, 0))
]
Y = [
    V((0, 0, 0, 1)),
    V((0, 0, -1, 1)),
    V((0, 1, -1, 1)),
    V((1, 1, 1, 1))
]

# Abychom snadno mohli pracovat se souřadnicemi ve zvolených bázích,
# změníme si ve V bázi (v definici V výše se implicitně bere standardní).
VX = V.span_of_basis(X)
VY = V.span_of_basis(Y)

Máme-li například vektor $w = (1,2,3,4) \in V$ , pak jeho souřadnice vzhledem k bázi $\mathcal{X}$ jsou $w_\mathcal{X} = (-3, -5/2, 9/2, 9/2)$ . Tj. platí $w = -3x_1 - \frac{5}{2}x_2 + \frac{9}{2}x_3 + \frac{9}{2}x_4$ .

Skutečně, nejprve zadefinujme $w$ :

w = V((1, 2, 3, 4))
show(w)

\newcommand{\Bold}[1]{\mathbf{#1}}\left(1,\,2,\,3,\,4\right)

Nyní spočtěme souřadnice $w$ v bázi $\mathcal{X}$ :

cxW = VX.coordinates(w)
show(cxW)

\newcommand{\Bold}[1]{\mathbf{#1}}\left[-3, -\frac{5}{2}, \frac{9}{2}, \frac{9}{2}\right]

A otestujme požadovanou rovnost:

# pozor na indexování listů od 0, range(4) = {0,1,2,3}.
sum([ cxW[j] * X[j] for j in range(4) ])

(1, 2, 3, 4)

To je (nepřekvapivě!) skutečně vektor $w$ . Podívejme se na jeho souřadnice v bázi $\mathcal{Y}$ :

cyW = VY.coordinates(w)
show(cyW)

\newcommand{\Bold}[1]{\mathbf{#1}}\left[5, -3, 1, 1\right]

To je sice jiná čtveřice, ale stále platí následující vztah:

sum([ cyW[j] * Y[j] for j in range(4) ])

(1, 2, 3, 4)

"Přímý" výpočet matice lineárního zobrazení

Máme vypočítat matici ${}^{\mathcal{X}} A^\mathcal{Y}$ . O té z přednášky víme, že má ve sloupcích postupně souřadnice $A$ -obrazů bazických vektorů báze $\mathcal{X}$ v bázi $\mathcal{Y}$ . Tedy

$\big({}^{\mathcal{X}} A^\mathcal{Y}\big)_{: j} = (Ax_j)_\mathcal{Y}, \quad j=1,2,\ldots,\#\mathcal{X}.$

Klíčová vlasnost (z které vlastně lze i definici výše odvodit) této matice je následující:

${}^{\mathcal{X}} A^\mathcal{Y} \cdot x_\mathcal{X} = (Ax)_\mathcal{Y}.$

O co zde je? Původní zobrazení pracuje s vektory, matice lineárního zobrazení reprezentuje působení tohoto zobrazení pomocí souřadnic vektorů.

Sestavme matici našeho zobrazení $A$ vzhledem k bázím $\mathcal{X}$ a $\mathcal{Y}$ , přímo z definice:

XAY = matrix(QQ, 4) # alokace prázdné matice

for j in range(4):
    XAY[:, j] = V(VY.coordinates(A(X[j])))

show(XAY)

\newcommand{\Bold}[1]{\mathbf{#1}}\left(\begin{array}{rrrr} -2 & -3 & -1 & 0 \\ 2 & 1 & 4 & -3 \\ 0 & -1 & -2 & 1 \\ 1 & 2 & 0 & 2 \end{array}\right)

(Ručně bychom napočítali obrazy bazických vektorů báze $X$ a poté jejich souřadnice v bázi $Y$ ; provedli bychom tedy několik aplikací zobrazení $A$ a poté bychom vyřešili jeden GEM s více pravými stranami).

Jak tato matice souvisí se zobrazením $A$ (viz definice pomocí funkce výše)?

Stručně řečeno, souvislost mezi lineárním zobrazením a jeho maticí vzhledem k jistým bázím je následující:

vektoru $x$ zobrazení $A$ přiřadí vektor $Ax$ ,
vynásobíme-li souřadnice vektoru $x$ v bázi $\mathcal{X}$ maticí ${}^\mathcal{X} A^\mathcal{Y}$ zprava, tak dostaneme souřadnice vektoru $Ax$ v bázi $\mathcal{Y}$ .

Ukažme si to opět na našem vektoru $w$ . Z pohledu $A$ je to jednoduché.

w = V([1, 2, 3, 4])
print("vzor:")
show(w)
print("obraz:")
show(A(w))

vzor:

\newcommand{\Bold}[1]{\mathbf{#1}}\left(1,\,2,\,3,\,4\right)

obraz:

\newcommand{\Bold}[1]{\mathbf{#1}}\left(1,\,-1,\,7,\,4\right)

Aplikujme matici (zleva) zobrazení ${}^\mathcal{X} A^\mathcal{Y}$ na souřadnice vektoru $w$ v bázi $\mathcal{X}$ . Dostaneme souřadnice výstupního vektoru $Aw$ v bázi $\mathcal{Y}$ :

cyAw = XAY * V(VX.coordinates(w))
show(cyAw)

\newcommand{\Bold}[1]{\mathbf{#1}}\left(9,\,-4,\,-2,\,1\right)

Pokud pomocí těchto souřadnic napočteme zpětně $Aw$ , měli bychom dostat stejný výsledek jako výše.

# Aw = 
sum([ cyAw[j] * Y[j] for j in range(4) ])

(1, -1, 7, 4)

Opravdu!

Co je dobré si uvědomit:

Zobrazení $A$ v tomto příkladě je jedno. Vzhledem k různým bázím může mít různé matice zobrazení. Například ${}^\mathcal{X} A^\mathcal{X}$ je

XAX = matrix(QQ, 4) # alokace prázdné matice

for j in range(4):
    XAX[:, j] = V(VX.coordinates(A(X[j])))

show(XAX)

\newcommand{\Bold}[1]{\mathbf{#1}}\left(\begin{array}{rrrr} \frac{3}{5} & -\frac{8}{5} & \frac{12}{5} & -4 \\ \frac{1}{10} & \frac{2}{5} & -\frac{1}{10} & -\frac{1}{2} \\ \frac{1}{2} & 1 & -\frac{3}{2} & \frac{7}{2} \\ \frac{1}{10} & \frac{7}{5} & -\frac{11}{10} & \frac{7}{2} \end{array}\right)

Nebo ${}^\mathcal{Y} A^\mathcal{Y}$ :

YAY = matrix(QQ, 4) # alokace prázdné matice

for j in range(4):
    YAY[:, j] = V(VY.coordinates(A(Y[j])))

show(YAY)

\newcommand{\Bold}[1]{\mathbf{#1}}\left(\begin{array}{rrrr} 1 & -1 & -1 & 2 \\ 0 & 2 & 3 & -1 \\ 0 & 0 & -1 & -1 \\ 0 & 0 & 0 & 1 \end{array}\right)

Tyto různé matice reprezentují stále stejný operátor, jen počítají jeho působení z jiných bazí do jiných bazí, proto jsou to nutně jiné matice.

Konstrukce matice zobrazení může vypadat na tomto příkladě v $\mathbb{R}^4$ lehce uměle. Je dobré si ale uvědomit její sílu. Toto lze v zásadě provést s libovolným lineárním zobrazením. Ať je definované na jakém chce prostoru (třeba dimenze $n$ , $V_n$ ) a zobrazuje do jakého chce prostoru (třeba dimenze $m$ , $V_m$ ) a ať jsou prvky těchto prostorů jakékoliv, tak matice tohoto zobrazení ve zvolených bazích bude vždy matice typu $m \times n$ a na působení zobrazení $A$ se lze dívat jako na maticové násobení.

Výpočet pomocí matic přechodu

Vzhledem k tomu jak jsou matice lineárních zobrazení definované a jaký je jejich význam popsaný výše, tak by nemělo být překvapující jak souvisí se skládáním zobrazení. Pro přípustné báze a dvě lineární zobrazení zřejmě platí

${}^\mathcal{X} (A \circ B)^\mathcal{Y} = {}^\mathcal{Z} A^\mathcal{Y} \cdot {}^\mathcal{X} B^\mathcal{Z}.$

Jen si představte co tento vztah říká, jsou dva ekvivalentní způsoby jak z $x_\mathcal{X}$ spočítat $(ABx)_\mathcal{Y}$ :

vynásobit souřadnice $x_\mathcal{X}$ zleva maticí ${}^\mathcal{X} (A \circ B)^\mathcal{Y}$ ,
vynásobit souřadnice $x_\mathcal{X}$ zleva maticí ${}^\mathcal{X} (B)^\mathcal{Z}$ , získat tak $(Bx)_\mathcal{Z}$ , tento vektor zleva vynásobit maticí ${}^\mathcal{Z} (A)^\mathcal{Y}$ a získat tak $(ABx)_\mathcal{Y}$ .

Druhou ingrediencí, kterou budeme potřebovat, je jednoduché pozorování týkající se převodu souřadnic jednoho vektoru z jedné báze do druhé. K tomu lze využít identické zobrazení (které je jistě lineární), $E x = x$ . Toto zobrazení tedy s vektorem $x$ nic neudělá. Z toho plyne, že příslušná matice zobrazení (tzv. matice přechodu) ${}^\mathcal{X} E^\mathcal{Y}$ při násobení převádí souřadnice z báze $\mathcal{X}$ do báze $\mathcal{Y}$ , tedy

${}^\mathcal{X} E^\mathcal{Y} \cdot x_\mathcal{X} = x_\mathcal{Y}.$

Dáme-li si tyto dvě informace dohromady, tak

${}^\mathcal{X} A^\mathcal{Y} = {}^\mathcal{W} E^\mathcal{Y} \cdot {}^\mathcal{V} A^\mathcal{W} \cdot {}^\mathcal{X} E^\mathcal{V}.$

Pomocí matic přechodu, které je snadné sestavit, tak můžeme převádět matice zobrazení mezi libovolnými bázemi.

Jak tuto mašinérii použít v našem případě? Je snadné sestavit ${}^\mathcal{E} A^\mathcal{E}$ . Skutečně, stačí aplikovat $A$ a souřadnice výsledků ve standardní bázi máme ihned:

# standardní báze:
V.basis()

[
(1, 0, 0, 0),
(0, 1, 0, 0),
(0, 0, 1, 0),
(0, 0, 0, 1)
]

EAE = matrix(QQ, 4)

for j in range(4):
    EAE[:, j] = A(V.basis()[j])

show(EAE)

\newcommand{\Bold}[1]{\mathbf{#1}}\left(\begin{array}{rrrr} 1 & 0 & 0 & 0 \\ 1 & -1 & 0 & 0 \\ 1 & 0 & 2 & 0 \\ 0 & 0 & 0 & 1 \end{array}\right)

My však chceme

${}^\mathcal{X} A^\mathcal{Y} = {}^\mathcal{E} E^\mathcal{Y} \cdot {}^\mathcal{E} A^\mathcal{E} \cdot {}^\mathcal{X} E^\mathcal{E}.$

Matici ${}^\mathcal{X} E^\mathcal{E}$ je snadné sestavit, je to prostě matice mající bazické vektory báze $\mathcal{X}$ ve sloupcích:

XtoE = matrix(QQ, X).transpose()
show(XtoE)

\newcommand{\Bold}[1]{\mathbf{#1}}\left(\begin{array}{rrrr} 1 & 2 & 0 & 2 \\ 0 & 1 & 2 & -1 \\ -1 & 0 & -1 & 1 \\ 1 & -1 & 1 & 0 \end{array}\right)

Podobně je snadné sestavit ${}^\mathcal{Y} E^\mathcal{E}$ :

YtoE = matrix(QQ, Y).transpose()
show(YtoE)

\newcommand{\Bold}[1]{\mathbf{#1}}\left(\begin{array}{rrrr} 0 & 0 & 0 & 1 \\ 0 & 0 & 1 & 1 \\ 0 & -1 & -1 & 1 \\ 1 & 1 & 1 & 1 \end{array}\right)

My ovšem chceme ${}^\mathcal{E} E^\mathcal{Y} = \big({}^\mathcal{Y} E^\mathcal{E}\big)^{-1}$ :

EtoY = YtoE.inverse()
show(EtoY)

\newcommand{\Bold}[1]{\mathbf{#1}}\left(\begin{array}{rrrr} -2 & 0 & 1 & 1 \\ 2 & -1 & -1 & 0 \\ -1 & 1 & 0 & 0 \\ 1 & 0 & 0 & 0 \end{array}\right)

Konečně, pro naší matici ${}^\mathcal{X} A^\mathcal{Y}$ platí

show(EtoY * EAE * XtoE)

\newcommand{\Bold}[1]{\mathbf{#1}}\left(\begin{array}{rrrr} -2 & -3 & -1 & 0 \\ 2 & 1 & 4 & -3 \\ 0 & -1 & -2 & 1 \\ 1 & 2 & 0 & 2 \end{array}\right)

Což je samozřejmě stejný výsledek.