Osnova přednášek
● Úvod do předmětu a oblasti zpracování řečových signálů, základní úlohy a praktická aplikace jejich použití.
● Tvorba řeči, základní pojmy, reprezentace a předzpracování signálu (DC Offset, preemfáze, segmentace, váhování).
● Základní parametry - Energie, průchody nulou (ZCR), Jitter, Shimmer, teorie autokorelace, F0.
● Spektrum, spektrogram, spektrální analýza samohlásek a souhlásek.
● Kepstrum, kepstrální analýza, Mel-frekvenční kepstrální koeficienty a další parametry řeči.
● Úvod do klasifikace a využití SOM, k-NN, GMM, ANN a fúze klasifikátorů.
● Rozpoznávání řečníka (SI) a možné přístupy k řešení.
● Rozpoznávání emočního stavu řečníka (SER), projevy emocí v posuvu F0, rozpoznání stresu.
● Rozpoznávání řeči (ASR) a možné přístupy k řešení.
● Převod textu do řeči (TTS), aplikace s využitím řečových korpusů a open-source projektů
Osnova cvičení
● Úvod, bezpečnost, podmínky absolvování předmětu.
● Praktické procvičení - předzpracování řečového signálu v prostředí – odstranění stejnosměrné složky, preemfáze, segmentace, váhování oknem.
● Praktické procvičení - Extrakce základních (skalárních) řečových parametrů – energie, počet průchodů nulou, základní frekvence.
● Praktické procvičení - Spektrální analýza řečového signálu.
● Praktické procvičení - Extrakce vektorových příznaků – MFCC, LPC
● Test a zadání semestrálních projektů.
● Návrh systému pro rozpoznávání řečníka - GMM, ANN.
● Ukázka vypracování projektu.
● Syntéza řeči.
● Prezentace projektů.
● Úvod do předmětu a oblasti zpracování řečových signálů, základní úlohy a praktická aplikace jejich použití.
● Tvorba řeči, základní pojmy, reprezentace a předzpracování signálu (DC Offset, preemfáze, segmentace, váhování).
● Základní parametry - Energie, průchody nulou (ZCR), Jitter, Shimmer, teorie autokorelace, F0.
● Spektrum, spektrogram, spektrální analýza samohlásek a souhlásek.
● Kepstrum, kepstrální analýza, Mel-frekvenční kepstrální koeficienty a další parametry řeči.
● Úvod do klasifikace a využití SOM, k-NN, GMM, ANN a fúze klasifikátorů.
● Rozpoznávání řečníka (SI) a možné přístupy k řešení.
● Rozpoznávání emočního stavu řečníka (SER), projevy emocí v posuvu F0, rozpoznání stresu.
● Rozpoznávání řeči (ASR) a možné přístupy k řešení.
● Převod textu do řeči (TTS), aplikace s využitím řečových korpusů a open-source projektů
Osnova cvičení
● Úvod, bezpečnost, podmínky absolvování předmětu.
● Praktické procvičení - předzpracování řečového signálu v prostředí – odstranění stejnosměrné složky, preemfáze, segmentace, váhování oknem.
● Praktické procvičení - Extrakce základních (skalárních) řečových parametrů – energie, počet průchodů nulou, základní frekvence.
● Praktické procvičení - Spektrální analýza řečového signálu.
● Praktické procvičení - Extrakce vektorových příznaků – MFCC, LPC
● Test a zadání semestrálních projektů.
● Návrh systému pro rozpoznávání řečníka - GMM, ANN.
● Ukázka vypracování projektu.
● Syntéza řeči.
● Prezentace projektů.