Přeskočit na hlavní obsah
Přeskočit hlavičku

Knihovny pro paralelní zpracování dat

Jazyk výuky angličtina, čeština
Kód 9600-1020
Zkratka KPZD
Název předmětu česky Knihovny pro paralelní zpracování dat
Název předmětu anglicky Libraries for parallel data processing
Garantující katedra IT4Innovations
Garant předmětu Ing. Jan Martinovič, Ph.D.

Course aims

Student po absolvování předmětu získá přehled o knihovnách pro paralelní zpracování velkých dat a získá základní zkušenost s použitím nejznámějších knihoven. Budou představeny základní koncepty jak s velkými daty minipulovat a základní paradigmata a programové modely pro jejich zpracování. Cvičení budou probíhat v jazyce Python, ve kterém existují knihovny pro všechný známé frameworky.

Literature

• Pandas dokumentace: http://pandas.pydata.org/
• Spark dokumentace: https://spark.apache.org/docs/latest/
• Tensorflow dokumentace: https://www.tensorflow.org/
• Keras dokumentace: https://keras.io/
HENDL, J., Big data - Věda o datech, základy a aplikace, Cosmopolis, 2021.

Advised literature

• Nathan Marz and James Warren: Big Data - Principles and best practices of scalable realtime data systems, Manning, April 2015 ISBN 9781617290343 .