Metodika dolování dat

Atributy předmětu
Kód předmětu
D18MDD
Způsob zakončení
zk
Kredity
2
Rozsah
26 hodin
Úroveň studia
doktorská

Anotace:
Cílem předmětu je seznámit s moderními metodami dolování dat. Přitom se nabízí celá řada nástrojů matematické 
logiky, matematické statistiky a teorie informace, které ve spojení s efektivními programovacími technikami umožňují 
dolování dat v náročných aplikacích.

Osnova:

  1. Cíle dolování dat a jak je naplnit.
  2. Zdroj dat a jeho konverze do standardní formy.
  3. Extrakce pravidel: Hornova báze, booleova algebra, fuzzy logika.
  4. Redukce dimenze: PCA, data whitening, Kernel PCA.
  5. Shluková analýza: hierarchické metody, k-means, DBSCAN, OPTICS.
  6. Aplikace entropie: Identifikační stromy, data wrapping.
  7. Velké množství dat: subsampling, duální úloha.

Klíčová slova:
dolování dat, matematická logika, statistika, informační míry, data wrapping

Studijní literatura a studijní pomůcky:
[1] Schubert, E., Sander, J., Ester, M., Kriegel, H.P., Xu, X., Why and How You Should (Still) Use DBSCAN, ACM Trans. Database Syst. 42 (3): 19:1–21, 2017.
[2] Witten, I.H., Frank, E., Hall, M.A., Data Mining: Practical Machine Learning Tools and Techniques, Elsevier, New York, 2011.