Paralelní algoritmy II

Typ studia	navazující magisterské
Jazyk výuky	angličtina
Kód	460-4118/02
Zkratka	PA II
Název předmětu česky	Paralelní algoritmy II
Název předmětu anglicky	Parallel Algorithms II
Kreditů	4
Garantující katedra	Katedra informatiky
Garant předmětu	doc. Ing. Petr Gajdoš, Ph.D.

Subject EDISON

Subject syllabus

Přednášky jsou tematicky rozděleny tak, aby získané znalosti mohli studenti aplikovat na cvičeních.

Obsah jednotlivých přednášek:
1. Úvod do paralelních výpočtů na GPU, GPU historie a CUDA
2. Architektura CUDA, integrace na úrovni C++ projektu
3. Práce s vlákny, kernel funkce
4. Typy CUDA pamětí, vzory pro jejich využití
5. Řešení konfliktů paměti GPU
6. Řízení běhu programu, distribuce algoritmu
7. Výkon algoritmu v závislosti na jeho paralelizaci na GPU
8. Základní vektorové a maticové operace
9. Optimalizace na datové úrovni aplikace, efektivní datové struktury.
10. Optimalizace z pohledu maximálního využití GPU
11. Doplňková knihovna CUBLAS
12. Případové studie

Obsah jednotlivých cvičení (cvičení jsou na počítačových učebnách):
1. Vytvoření základní šablony aplikace, první spuštění, ukázková aplikace
2. Ukázky transferu dat na/z GPU
3. Hierarchie vláken, základní běh vlákna, limity, volání kernel funkcí, parametry a omezení
4. Typy CUDA pamětí, vzory pro jejich využití
5. Optimalizace přístupů do paměti, volba vhodné datové struktury
6. Streamy, paralelní volání kernel funkcí, synchronizace na úrovni vláken, bloků, GPU vs. CPU
7. Případová studia, experiment s více variantami řešení téže úlohy
8. Základní vektorové a maticové operace, případová studie zpracování dat, paralelní redukce
9. Integrace podpůrných knihoven pro lineární algebru
10. Ukázka grafické úlohy a její řešení při různém nastavení, využití bufferování
11. Případové studie, představení konkrétní praktické úlohy, nástin jejího řešení, demonstrace experimentů
12. Ladění programu s využitím nástrojů nVidia nSight

E-learning

https://vsb.sharepoint.com/:f:/r/sites/PAII/Class%20Materials/Lecture%20Notes?csf=1&web=1&e=tvvoiQ

Literature

[1] Bjarne Stroustrup. The C++ Programming Language, 4th Edition. Addison-Wesley Professional, 4th edition, 5 2013.
[2] Graham Sellers, Richard S. Wright, and Nicholas Haemel. OpenGL SuperBible: Comprehensive Tutorial and Reference (6th Edition). Addison-Wesley Professional, 6th edition, 7 2013.
[3] John Cheng, Max Grossman, and Ty McKercher. Professional CUDA C Programming. Wrox, 1st edition, 9 2014.
[4] Soyata, Tolga. GPU parallel program development using CUDA. CRC Press, 2018.

Advised literature

[1] Bjarne Stroustrup. The C++ Programming Language, 4th Edition. Addison-Wesley Professional, 4th edition, 5 2013.
[2] John Cheng, Max Grossman, and Ty McKercher. Professional CUDA C Programming. Wrox, 1st edition, 9 2014.
[3] Tuomanen, Brian. Hands-On GPU Programming with Python and CUDA: Explore high-performance parallel computing with CUDA. Packt Publishing Ltd, 2018.
[4] Volodymyr Kindratenko, editor. Numerical Computations with GPUs. Springer, 2014 edition, 7 2014.
[5] Vaidya, Bhaumik. Hands-On GPU-Accelerated Computer Vision with OpenCV and CUDA: Effective techniques for processing complex image data in real time using GPUs. Packt Publishing Ltd, 2018.
[6] Jung W. Suh and Youngmin Kim. Accelerating MATLAB with GPU Computing: A Primer with Examples. Morgan Kaufmann, 1st edition, 12 2013.

back to search page