Přeskočit na hlavní obsah
Přeskočit hlavičku

Analýza obrazu II

Typ studia navazující magisterské
Jazyk výuky čeština
Kód 460-4107/01
Zkratka AO2
Název předmětu česky Analýza obrazu II
Název předmětu anglicky Image Analysis II
Kreditů 4
Garantující katedra Katedra informatiky
Garant předmětu Ing. Radovan Fusek, Ph.D.

Subject syllabus

Přednášky:
- Základní pojmy detekce objektů v obrazech; příznaky typu Haar (AdaBoost, Viola-Jones); lokální binární vzory (LBP); histogramy orientovaných gradientů (HOG). Detekce chodců a tváří v obrazech. Detektory a deskriptory zájmových bodů (například SIFT, SURF).
- Konvoluční neuronové sítě (základní principy, popis vrstev). Moderní varianty konvolučních neuronových sítí (například GoogLeNet, ResNet, EfficientNet).
- Lokalizační metody založené na konvolučních sítích (například R-CNN, Faster R-CNN, YOLO, SSD).
- Popis generativních sítí (sítě typu DCGAN, Diffusion-GAN).
- Sítě typu transformer (zejména vision transformer - ViT) a jejich využití v analýze obrazu.
- Konvoluční neuronové sítě pro segmentaci obrazu (sítě typu encoder-decoder, U-Net).
- Určování polohy člověka pomocí hlubokého učení.
- Optické systémy v oblasti samořiditelných vozidel, zpracování obrazů v IR spektru, zpracování LiDARových dat, analýza hloubkových obrazů, využití hloubkových senzorů (například RealSense, Kinect).


Cvičení (PC učebna):
- Vytvoření základní kostry detektoru pro zvolený zájmový objekt, implementace metody posuvného okna, příprava dat pro trénovací a testovací fázi detektoru.
- Analýza objektů pomocí příznaků typu Haar, lokálních binárních vzorů (LBP) a histogramů orientovaných gradientů (HOG).
- Základní použití konvolučních neuronových sítí, experimentování s parametry konvolučních sítí.
- Využití různých typů konvolučních sítí v rozpoznávání (například GoogLeNet, ResNet, EfficientNet), experimentování s vytvořenými modely, porovnání modelů.
- Praktické využití lokalizačních metod založených na konvolučních sítích (například R-CNN, Faster R-CNN, YOLO).
- Praktické využití generativních sítí pro rozšíření datových sad (DCGAN, Diffusion-GAN).
- Experimenty se segmentací obrazu pomocí sítí typu encoder-decoder (U-Net).
- Využití sítí typu transformer pro analýzu objektů v obrazech.
- Analýza objektů v IR a v hloubkových obrazech (RealSense, Kinect).

E-learning

Materiály jsou dostupné na webu pedagoga:
https://mrl.cs.vsb.cz//people/fusek/ano2_course.html

Literature

1. Ayyadevara, V. Kishore; Reddy, Yeshwanth. Modern Computer Vision with PyTorch: Explore deep learning concepts and implement over 50 real-world image applications. Packt Publishing, 2020. ISBN 978-1839213472 .
2. Lakshmanan, V.; Shlens, J.; Sukthankar, R. Practical Machine Learning for Computer Vision: End-to-End Machine Learning for Images. O’Reilly Media, 2021. ISBN 978-1098102364.
3. Zhang, A.; Lipton, Z. C.; Li, M.; Smola, A. J. Dive into Deep Learning. arXiv, 2021. Available at: https://doi.org/10.48550/arXiv.2106.11342.

Advised literature

1. Sojka, E.; Gaura, J.; Krumnikl, M. Matematické základy digitálního zpracování obrazu. 2. vydání. Ostrava: VŠB–Technická univerzita Ostrava; Plzeň: Západočeská univerzita v Plzni, 2011.
2. Burger, W.; Burge, M. J. Principles of digital image processing: Fundamental techniques. Springer, 2011. ISBN 978-1848001909 .
3. Chollet, F. Deep learning with Python. Manning, 2017. ISBN 978-1617294433.
4. Howse, Joseph; Minichino, Joe. Learning OpenCV 4 Computer Vision with Python 3. 3rd ed. Birmingham: Packt Publishing, 2020. ISBN 978-1789531619.