Přeskočit na hlavní obsah
Přeskočit hlavičku

Metody zpracování a analýzy dat

Typ studia bakalářskénavazující magisterské
Jazyk výuky angličtina
Kód 546-0182/02
Zkratka MAD
Název předmětu česky Metody zpracování a analýzy dat
Název předmětu anglicky Methods of Data Processing and Analysis
Kreditů 6
Garantující katedra Katedra environmentálního inženýrství
Garant předmětu Mgr. Oldřich Motyka, Ph.D.

Osnova předmětu

1. Příprava vzorkovacího plánu, uchovávání a ukládání dat.
2. Typy dat – kvantitativní a kvalitativní data, popis, charakteristiky polohy a variability, vizualizace, identifikace odlehlých hodnot.
3. Testování hypotéz – nulová a alternativní hypotéza, chyby I. a II. druhu, statistický test a jeho síla, p – hodnota.
4. Úvod do práce v programu R a v rozhraní R Studio. Vytváření projektů, vkládání dat, grafické výstupy.
5. Jednovýběrové a dvouvýběrové testy – parametrické a neparametrické metody. Analýza kategoriálních dat – chí-kvadrát a Fisherův test.
6. Analýza rozptylu (ANOVA)- hodnocení rozptylu, hodnocení normality, Kruskal-Wallisův test – neparametrická alternativa analýzy rozptylu.
7. Korelační analýza – Pearsonův a Spearmanův korelační koeficient, míry podobnosti dat (koeficienty podobnosti, koeficienty korelace, kovariance).
8. Regresní analýza – lineární regrese, předpoklady lineárního modelu, odhad parametrů regresního modelu, koeficient determinace, statistické testy.
9. Regresní analýza – polynomiální regrese, statistické testy, analýza reziduí regresních analýz.
10. Vícenásobná lineární regrese – typy interakcí proměnných, multikolinearita, problém chybějících dat, aplikace.
11. Problematika prostorových dat, autokorelace, vzorkování, analýza, lokální a globální statistiky.
12. Mnohorozměrná analýza dat – principy, předpoklady a úprava dat před analýzou.
13. Explorativní analýzy, analýza hlavních komponent (PCA), mnohonásobná korespondenční analýza (MCA), analýza smíšených dat (FAMD), shluková analýza

Povinná literatura

DROZD, Pavel, 2007. Cvičení z biostatistiky: Základy práce se softwarem R. Ostrava: Ostravská univerzita v Ostravě. Dostupné z WWW: cran.r-project.org/doc/contrib/CviceniR1.pdf
SPIWOK, Vojtěch, 2015. Statistická analysa dat v R. Praha: VŠCHT Dostupné z WWW: https://web.vscht.cz/~spiwokv/statistika/skripta.pdf
LEPŠ, Jan a Petr ŠMILAUER, 2016. Biostatistika: Základy práce se softwarem R. České Budějovice: Nakladatelství Jihočeské univerzity v Českých Budějovicích. ISBN 978-80-7394-587-9 
HOTHORN, Torsten a Brian EVERITT, c2014. A handbook of statistical analyses using R. 3rd ed. Boca Raton: CRC Press. Spatial analytics and GIS (Sage). ISBN 978-148-2204-582 

Doporučená literatura

PUNCH, Keith, 2008. Základy kvantitativního šetření. Praha: Portál. Biomedicínská statistika. ISBN 978-80-7367-381-9
ZVÁRA, Karel, 2013. Biomedicínská statistika IV: Základy statistiky v prostředí R. Praha: Karolinum. Biomedicínská statistika. ISBN 978-80-2462-245-3 
HENDL, Jan a Petr ŠMILAUER, 2014. Statistika v aplikacích. Praha: Portál. Biomedicínská statistika. ISBN ISBN978-80-262-0700-9
ZELTERMAN, Daniel, 2015. Applied multivariate statistics with R. Cham: Springer. Statistics for biology and health (Springer). ISBN 978-3-319-14093-3