Jdi na navigaci předmětu

Otázky ke zkoušce

Rozhodovací stromy.
- Algoritmus ID3, kritéria pro větvení (entropie, gini, MSE), použití pro klasifikaci a regresi, hyperparametry rozhodovacích stromů.
Ensamble metody: bagging, boosting a náhodné lesy.
- Rozdíl mezi baggingem a boostingem. Náhodné lesy a jejich hyperparamtery.
Ensamble metody: bagging, boosting a AdaBoost.
- Rozdíl mezi baggingem a boostingem. Popis metody AdaBoost.
Principy nesupervizovaného učení a shlukování.
- Cíle nesupervizovného učení a shlukování. Vzdálenost (metrika): definice a příklady.
Hierarchické shlukování.
- Aglomerativní algoritmus, měření vzdáleností shluků, dendrogram.
Shlukování pomocí algoritmu k-means.
- Shlukování jako optimalizační úloha, algoritmus k-means a jeho účelová funkce.
Metoda nejbližších sousedů: kNN.
- Popis metody, hyperparametrů a jejího použití pro klasifikaci a regresi. Pojem metrika a normalizace dat.
Problémy s dimenzionalitou.
- Vysvětlení tzv. prokletí dimenzionality. Které metody jsou citlivé a které méně?
Dělení dat na trénovací, validační a testovací, křížová validace.
- Popis obvyklých scénářů vyžadující dělení dat. Pojem hyperparametru a jeho ladění.
Vyhodnocování úspěšnosti modelů (klasifikace i regrese).
- Přehled různých metrik a způsobů vyhodnocování kvality získaných výsledků.
Naivní Bayesův klasifikátor.
- Klasifikace pomocí podmíněné pravděpodobnosti, využití Bayesovy věty, naivní Bayesův klasifikátor, modely podmíněných pravděpodobností.
Lineární regrese, metoda nejmenších čtverců.
- Model lineární regrese, predikce, maticový zápis trénovací množiny. Metoda nejmenších čtverců: normální rovnice, řešení.
Logistická regrese.
- Použití pro binární klasifikaci, logistická regrese jako MLE odhad.
Geometrická interpretace metody nejmenších čtverců.
- Geometrická interpretace metody nejmenších čtverců, normální rovnice, řešení. Regularita versus lineární nezávislost sloupců matice X.
Hřebenová regrese.
- Regularizovaný reziduální součet čtverců, řešení. Rozklad očekávané chyby modelu, bias-variance tradeoff.
Redukce dimenzionality.
- Projekční metody: PCA, LLE. Interpretace hlavních komponent u PCA.
Neuronové sítě.
- Model perceptronu. Dopředný a zpětný chod. Aktivační funkce. Vícevrstvá síť, učení.