Přeskočit na hlavní obsah
Přeskočit hlavičku

Analýza obrazu II

Typ studia navazující magisterské
Jazyk výuky čeština
Kód 460-4107/01
Zkratka ANO II
Název předmětu česky Analýza obrazu II
Název předmětu anglicky Image Analysis II
Kreditů 4
Garantující katedra Katedra informatiky
Garant předmětu Ing. Radovan Fusek, Ph.D.

Osnova předmětu

Přednášky:
* Základní pojmy z oblasti detekce objektů v obrazech, metoda posuvného okna.
* Metody detekce tváří v obrazech. Příznaky typu Haar. Lokální binární vzory, histogramy orientovaných gradientů a jejich využití pro analýzu objektů. Metody detekce chodců v obrazech.
* Konvoluční neuronové sítě (základní principy, popis vrstev). Moderní varianty konvolučních neuronových sítí (například VGGNet, GoogLeNet, ResNet).
* Lokalizační metody založené na konvolučních sítí (například R-CNN, Faster R-CNN, YOLO, SSD).
* Popis generativních sítí (DCGAN), sítě typu encoder-decoder, sítě typu transformer.
* Obrazové deskriptory, detektory zájmových bodů v obrazech (metoda SIFT).
* Optické systémy v oblasti samořiditelných vozidel, zpracování obrazů v IR spektru, zpracování lidarových obrazů, analýza hloubkových obrazů, využití hloubkových senzorů (RealSense, Kinect).


Cvičení (PC učebna):
* Vytvoření základní kostry detektoru pro zvolený zájmový objekt, implementace metody posuvného okna, příprava dat pro trénovací a testovací fázi detektoru.
* Detekce založená na příznacích typu Haar, detekce pomocí lokálních binárních vzorů, analýza objektů pomocí gradientů (metoda HOG), využití obrazových deskriptorů (metoda SIFT).
* Základní použití konvolučních neuronových sítí, experimentování s parametry konvolučních sítí.
* Využití různých typů konvolučních sítí v rozpoznání (například VGGNet, GoogLeNet, ResNet), experimentování s vytvořenými detektory, porovnání detektorů.
* Praktické využití lokalizačních metod založených na konvolučních sítí (například R-CNN, Faster R-CNN, YOLO).
* Praktické využití generativních sítí (DCGAN), sítě typu encoder-decoder, sítě typu transformer.
* Analýza objektů v IR a v hloubkových obrazech (RealSense, Kinect).

E-learning

Materiály jsou dostupné na webu pedagoga:
https://mrl.cs.vsb.cz//people/fusek/ano2_course.html

Povinná literatura

1. Chollet, F.: Deep Learning with Python. Manning, ISBN-13: 978-1617294433 , 2017
2. Gonzalez, R. C., Woods, R. E.: Digital image processing, New York, NY: Pearson, ISBN-13: 978-0133356724 , 2018
3. Zhang, A., Lipton, Z.C., Li, M., Smola, A.J.: Dive into Deep Learning, https://d2l.ai, 2020

Doporučená literatura

1. E. Sojka, J. Gaura, and M. Krumnikl, Matematické základy digitálního zpracování obrazu. Ostrava, Plzeň: VŠB-TU Ostrava (Fakulta elektrotechniky a informatiky), Západočeská univerzita v Plzni, 2. vydání ed., 2011.
2. Burger, W., Burge, M., J.: Principles of Digital Image Processing: Fundamental Techniques, Springer, ISBN-10: 1848001908 , ISBN-13: 978-1848001909 , 2011
3. Brahmbhatt, S.: Practical OpenCV (Technology in Action), Apress, ISBN-10: 1430260793 , ISBN-13: 978-1430260790 , 2013
4. Gary Bradski, Adrian Kaehler: Learning OpenCV 3: Computer Vision in C++ with the OpenCV Library, O'Reilly Media, 2017