Detail předmětu
Multidimensional Analysis of Biomedical Data
FEKT-MPA-VMMAk. rok: 2025/2026
Předmět je orientován na běžně používané metody z oblasti analýzy vícerozměrných dat: shluková analýza, metoda hlavních komponent, t-SNE, UMAP, apod. Jsou probíraný jak teoretické (základní principy jednotlivých metod), tak praktické (aplikace při zobrazování a analýze vícerozměrných dat) aspekty. Teorie je probíraná v přímé spojitosti s praktickými příklady. Veškeré výpočetní techniky jsou procvičovány s pomocí prostředí Python. Kurz připravuje posluchače k samostatnému využití daných metod pro analýzu dat ve vlastní vědecké či rutinní práci.
Jazyk výuky
Počet kreditů
Garant předmětu
Zajišťuje ústav
Nabízen zahraničním studentům
Vstupní znalosti
Student by měl mít znalosti z oblasti základní statistické analýzy dat a lineární algebry. V laboratorní výuce je předpokládána znalost Python.
Pravidla hodnocení a ukončení předmětu
Bodové hodnocení předmětu:
1) Týmový projekt (max. 20 bodů):
• Zpracování originálního řešení týmového projektu a jeho obhajoba na konci semestru (podle pokynů)
Pozn.:
- Hodnoceno bude splnění zadání a kvalita prezentace výsledků všemi členy týmu
- Plagiátorství bude mít za následek neudělení zápočtu
- Povinná alespoň jedna konzultace týmu s konzultantem!
2) Závěrečná zkouška (max. 80 bodů):
• ústní forma
• celkem dvě části, každá za max. 40 bodů
Podmínky pro udělení zápočtu a připuštění k závěrečné zkoušce:
• získání nenulového počtu bodů za týmový projekt
• maximálně dvě omluvené neúčastí na cvičeních (ve výjimečných případech rozhodne o řešení garant předmětu)
Podmínky pro úspěšné absolvování předmětu:
• získání zápočtu
• získání nejméně 20 bodů z každé ze dvou částí zkoušky
• získání celkem (tj. z projektu a zkoušky) alespoň 50 bodů
Učební cíle
Cílem předmětu je poskytnout studentům znalosti z oblasti vícerozměrné analýzy dat a prezentovat jim možnosti využiti vybraných postupů při zpracování a analýze biomedicínských dat.
Posluchač získá základní znalosti a dovednosti z oblasti využití metod vícerozměrné analýzy. Bude schopen aplikovat nejčastěji používané metody v praxi za účelem zpracování a analýzy dat.
Zkouškou se ověřuje, že absolvent předmětu je schopen:
- vysvětlit základní pojmy z oblasti vícerozměrné analýzy,
- popsat základní metody v této oblasti, diskutovat výhody a nevýhody jednotlivých metod,
- vybrat a použít vhodné nástroje pro daný problém z této oblasti,
- vyhodnotit kvalitu dosažených výsledků a prezentovat je ve vhodné formě,
- interpretovat dosažené výsledky.
Základní literatura
J.H. McDonald: Handbook of Biological Statistics, Sparky House Publishing, 2008 (CS)
Doporučená literatura
Elearning
Zařazení předmětu ve studijních plánech
Typ (způsob) výuky
Přednáška
Vyučující / Lektor
Osnova
1. Úvod do vícerozměrné analýzy biologických dat. Cíle vícerozměrné analýzy. Klasifikace metod.
2. Základy lineární algebry - opakování.
3. Vícerozměrné statistické rozdělení a testy.
4. Metody předzpracování dat. Typy transformace a standardizace. Problém chybějících dat.
5. Vztah mezi proměnnými ve vícerozměrném prostoru. Metriky podobnosti a vzdálenosti. Regrese, korelace, kovariance.
6. Shluková analýza biologických dat. Hierarchické a nehierarchické metody. Stanovení optimálního počtu shluků. Validace výsledků shlukování.
7. Ordinační analýza. Analýza hlavních komponent (PCA). Principy rozkladu matice.
8. Duální formy a jádra - kernel PCA.
9. Ordinační analýza. Faktorová analýza. Rotace faktorů.
10. Nelineární metody redukce dimenzionality dat. Metoda t-SNE.
11. Nelineární metody redukce dimenzionality dat. Metoda UMAP.
12. Příklady využití vícerozměrné analýzy biologických dat: vizualizace, selekce a extrakce příznaků, analýza vztahů mezi proměnnými.
Cvičení na počítači
Vyučující / Lektor
Osnova
1. Základy lineární algebry - opakování.
2. Průzkumová analýza dat: vizualizace, statistická deskriptivní analýza.
3. Průzkumová analýza dat: zpracování dat.
4. Vztahy ve vícerozměrném prostoru: korelační analýza.
5. Vztahy ve vícerozměrném prostoru: regresní analýza, logistická regrese.
6. Vztahy ve vícerozměrném prostoru: MANOVA.
7. Ordinační analýza: PCA.
8. Ordinační analýza: kernel PCA.
9. Shluková analýza: k-means, UPGMA.
10. Shluková analýza: hodnocení kvality shluků.
11. Vizualizace vícerozměrných dat I: t-SNE.
12. Vizualizace vícerozměrných dat II: UMAP.
Elearning