Atributy předmětu
Kód předmětu
D18MDD
Způsob zakončení
zk
Kredity
2
Rozsah
26 hodin
Úroveň studia
doktorská
Anotace:
Cílem předmětu je seznámit s moderními metodami dolování dat. Přitom se nabízí celá řada nástrojů matematické
logiky, matematické statistiky a teorie informace, které ve spojení s efektivními programovacími technikami umožňují
dolování dat v náročných aplikacích.
Osnova:
- Cíle dolování dat a jak je naplnit.
- Zdroj dat a jeho konverze do standardní formy.
- Extrakce pravidel: Hornova báze, booleova algebra, fuzzy logika.
- Redukce dimenze: PCA, data whitening, Kernel PCA.
- Shluková analýza: hierarchické metody, k-means, DBSCAN, OPTICS.
- Aplikace entropie: Identifikační stromy, data wrapping.
- Velké množství dat: subsampling, duální úloha.
Klíčová slova:
dolování dat, matematická logika, statistika, informační míry, data wrapping
Studijní literatura a studijní pomůcky:
[1] Schubert, E., Sander, J., Ester, M., Kriegel, H.P., Xu, X., Why and How You Should (Still) Use DBSCAN, ACM Trans. Database Syst. 42 (3): 19:1–21, 2017.
[2] Witten, I.H., Frank, E., Hall, M.A., Data Mining: Practical Machine Learning Tools and Techniques, Elsevier, New York, 2011.
Odkaz na bílou knihu
Vyučující