Vědci z Ostravské univerzity trénují AI na systému NVIDIA

Ústav pro výzkum a aplikace fuzzy modelování Ostravské univerzity byl první v České republice, kdo si pořídil nejnovější superpočítač pro výpočty umělé inteligence – NVIDIA DGX Station A100. A ačkoliv celý systém není o moc větší než běžný stolní počítač, nenechte se zmást jeho velikostí. Pod zlatou kapotou se ukrývá výkon neuvěřitelných 2,5 petaFLOPS pro AI výpočty.

Kdo DGX Station využívá

Zařízení NVIDIA DGX Station A100 jsme dodali týmu akademických výzkumníků z Ústavu pro výzkum a aplikace fuzzy modelování. Tento tým pracuje na problémech týkajících se počítačového vidění a 3D grafiky. Jejich práce je rozdělena na čistý akademický výzkum a navrhování řešení pro soukromý sektor. Řešení pro soukromý sektor jsou převážně zaměřena na defektoskopii průmyslových výrobků, zejména pro automobilový průmysl, a ve většině případů využívají hlubokých neuronových sítí. V akademickém výzkumu se zabývají rolí dat, jejich pre/post-processingem, anonymizací, a chybovými funkcemi. Konkrétní příklady jejich práce naleznete na stránkách projektu.

Ústav pro výzkum a aplikace fuzzy modelování (IRAFM) je vědecké pracoviště, které je součástí Ostravské univerzity. Zaměřuje se na teoretický výzkum a praktický vývoj různých metod tzv. fuzzy modelování, tj. tvorby modelů, které umožňují zahrnout vágně či nepřesně specifikované informace.

Ideální sdílené řešení pro věděcký tým

Vědecký tým Ústavu pro výzkum a aplikace fuzzy modelování Ostravské univerzity je vybaven lokálními standardními desktopy na kterých probíhá běžné prototypování a testování připravovaných aplikací. Tyto aplikace, tvořené především hlubokými neuronovými sítěmi, jsou následně migrovány na NVIDIA DGX Station A100, která je osazena čtyřmi vysoce výkonnými výpočetními akcelerátory NVIDIA A100 40GB. Na DGX Station má každý člen týmu vzdálený přístup a ta tvoří nejvyšší výpočetní úroveň vhodnou pro dlouhotrvající náročné výpočty. Zařízení slouží také jako rychlý sdílený datový sklad.

„Nasazením NVIDIA DGX Station A100 s vysokým výpočetním výkonem jsme získali možnost určení vhodných hyper parametrů neuronové sítě z většího prohledávaného prostoru, což vede k zvýšení kvality řešení. Toto je umocněno trénováním na větších datasetech ve více iteracích, než by bylo možné za stejný čas na desktopu se standardní grafickou kartou. Ve výsledku dostáváme kvalitnější řešení za kratší čas,“ říká Petr Hurtík, vedoucí vědeckého týmu.

Proč jste zvolili DGX Station?

✓ Trénování velkých modelů díky velké paměti karet
✓ Rychlejší zpracování velkých datasetů na multi-GPU
✓ Možnost současně pracovat na více projektech, které potřebují větší výpočetní kapacitu

Čím vás zaujalo řešení NVIDIA?

✓ Skvělá podpora Cudy
✓ Rychlá sběrnice mezi GPU
✓ Optimalizace pro učení neuronových sítí

Ve kterých oblastech ho využíváte?

✓ Laserové svařování a navádění průmyslového robota
✓ Simulátor gonio-fotometrického zařízení
✓ SW pro odhalování neurodegenerativních onemocnění

Používané frameworky

✓ TensorFlow / Keras
✓ PyTorch / PyTorch Lighting
✓ CUDA, cuDNN

Softwarové prostředí

Nvidia Docker + Nvidia containers, TensorRT 
Detectron2, MMDetection
NVIDIA Kaolin 

Využívaný hardware

NVIDIA DGX Station A100 160GB
NVIDIA RTX 3090
NVIDIA Jetson Nano