Přeskočit na hlavní obsah
Přeskočit hlavičku
Ukončeno v akademickém roce 2022/2023

Metody analýzy dat III

Typ studia navazující magisterské
Jazyk výuky angličtina
Kód 460-4099/02
Zkratka MAD III
Název předmětu česky Metody analýzy dat III
Název předmětu anglicky Data Analysis III
Kreditů 4
Garantující katedra Katedra informatiky
Garant předmětu prof. Ing. Jan Platoš, Ph.D.

Osnova předmětu

Explorativní analýza dat
1. Hledání pravidel v datech, Hledání vzorů v datech
2. Shlukování pomocí reprezentantů, Hierarchické shlukování
3. Shlukování založené na hustotě dat, Validace shluků
4. Samo organizující se mapy
5. Detekce Anomálií
Klasifikace dat
6. Lineární klasifikátory (Lineární diskriminační analýza, Naive Bayes, Logistická regrese)
7. Rozhodovací stromy, Náhodné lesy
8. Support Vector Machine, Kernelové metody
9. Neuronové sítě (Perceptron, Feed forward NN+Back propagation)
10. Regresní metody
11. Pokročilé metody v klasifikaci dat
12. Validace klasifikačních algoritmů
Pokročilé metody
13. Analýza streamových dat
14. Vizualizace vektorových dat


Cvičení na počítačové učebně:
Explorativní analýza dat a učení bez učitele
1. Implementace metody APRIORI pro hledání pravidel v datech.
2. Dokončení implementace metody APRIORI nad daty.
3. Implementace hierarchického shlukování – Aglomerátivní shlukování.
4. Implementace algoritmu DBSCAN.
5. Validace shluků vytvořených implementovanými algoritmy.
6. Ukázka metody Samoorganizujích map
Klasifikace dat
7. Implementace metod pro výběr atributů.
8. Implementace rozhodovacího
9. Implementace metody Naive Bayes.
10. Otestování metody Support Vector Machine v programu.
11. Implementace jednoduchého perceptronu
12. Hodnocení klasifikátorů
13. Implementace Regresního stromu
14. Vizualizace dat

Povinná literatura

1. Prezentace k přednáškám
2. Ian H. Witten, Eibe Frank, Mark A. Hall, Data Mining: Practical Machine Learning Tools and Techniques, Third Edition, Morgan Kaufmann, 2011, ISBN: 978-0123748560

Doporučená literatura

1. Mohammed J. Zaki, Wagner Meira, Jr., Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, May 2014. ISBN: 9780521766333 .
2. Jure Leskovec, Anand Rajaraman, David Ullman, Mining of Massive Datasets, 2nd editions, Cambridge University Press, Novemeber 2014, ISBN: 9781107077232 , On-line http://infolab.stanford.edu/~ullman/mmds/book.pdf [2014-09-12]