Přeskočit na hlavní obsah
Přeskočit hlavičku

Knihovny pro paralelní zpracování dat

Cíle předmětu

Student po absolvování předmětu získá přehled o knihovnách pro paralelní zpracování velkých dat a získá základní zkušenost s použitím nejznámějších knihoven. Budou představeny základní koncepty jak s velkými daty minipulovat a základní paradigmata a programové modely pro jejich zpracování. Cvičení budou probíhat v jazyce Python, ve kterém existují knihovny pro všechný známé frameworky.

Povinná literatura

• Pandas dokumentace: http://pandas.pydata.org/
• Spark dokumentace: https://spark.apache.org/docs/latest/
• Tensorflow dokumentace: https://www.tensorflow.org/
• Keras dokumentace: https://keras.io/
HENDL, J., Big data - Věda o datech, základy a aplikace, Cosmopolis, 2021.

Doporučená literatura

• Nathan Marz and James Warren: Big Data - Principles and best practices of scalable realtime data systems, Manning, April 2015 ISBN 9781617290343 .


Jazyk výuky čeština, angličtina
Kód 9600-1020
Zkratka KPZD
Název předmětu česky Knihovny pro paralelní zpracování dat
Název předmětu anglicky Libraries for parallel data processing
Garantující katedra IT4Innovations
Garant předmětu Ing. Jan Martinovič, Ph.D.