Přeskočit na hlavní obsah
Přeskočit hlavičku
Terminated in academic year 2022/2023

Metody analýzy dat I

Typ studia navazující magisterskémagisterské
Jazyk výuky čeština
Kód 460-4071/01
Zkratka MAD I
Název předmětu česky Metody analýzy dat I
Název předmětu anglicky Data Analysis I
Kreditů 4
Garantující katedra Katedra informatiky
Garant předmětu doc. Mgr. Miloš Kudělka, Ph.D.

Subject syllabus

Přednášky:
1. Data pro dolování dat, typy a zdroje dat
2. Atributy a jejich typy, řídká data, neúplná a nepřesná data
3. Algebraický a geometrický pohled na data
4. Pravděpodobnostní pohled na data
5. Numerické a kategoriální atributy, základní analytické přístupy
6. Dolování dat, předzpracování a čištění dat
7. Reprezentace dat
8. Základní metody analýzy dat (klasifikace, shlukování)
9. Sítě a jejich vlastnosti
10. Typy sítí a jejich reprezentace
11. Metody měření důležitost vrcholů v sítích
12. Struktura a globální vlastnosti rozsáhlých sítí
13. Základní datové struktury pro reprezentaci sítí
14. Základní algoritmy pro analýzu sítí

Cvičení:
1. Diskuze a praktické ukázky: Data pro dolování dat, typy a zdroje dat.
2. Diskuze a praktické ukázky: Atributy a jejich typy, řídká data, neúplná a nepřesná data.
3. Diskuze a praktické ukázky: Algebraický a geometrický pohled na data
4. Diskuze a praktické ukázky: Pravděpodobnostní pohled na data
5. Praktické ukázky a procvičení: Numerické a kategoriální atributy, základní analytické přístupy.
6. Praktické ukázky a procvičení: Dolování dat, předzpracování a čištění dat
7. Procvičení: Reprezentace dat
8. Praktické ukázky a procvičení: Základní metody analýzy dat (klasifikace, shlukování)
9. Diskuze a praktické ukázky: Sítě a jejich vlastnosti
10. Diskuze a praktické ukázky: Typy sítí a jejich reprezentace
11. Procvičení: Metody měření důležitost vrcholů v sítích
12. Diskuze a praktické ukázky: Struktura a globální vlastnosti rozsáhlých sítí
13. Procvičení: Základní datové struktury pro reprezentaci sítí
14. Procvičení: Základní algoritmy pro analýzu sítí

Literature

Prezentace k přednáškám.
Ian H. Witten, Eibe Frank , Mark A. Hall. Data Mining: Practical Machine Learning Tools and Techniques (Third Edition). The Morgan Kaufmann Series in Data Management Systems, 2011. ISBN 978-0123748560.
Zaki, M. J., Meira Jr, W. (2014). Data Mining and Analysis: Fundamental Concepts and Algorithms. Cambridge University Press.
Mark Newman. Networks: An Introduction. Oxford University Press, 2010. ISBN 978-0199206650.

Advised literature

Bramer, M. (2013). Principles of data mining. Springer.
Leskovec, J., Rajaraman, A., Ullman, J. D. (2014). Mining of massive datasets. Cambridge University Press.