NVIDIA DGX Station

DGX Station představuje první osobní superpočítač optimalizovaný pro úlohy umělé inteligence a strojového učení.  Vedle výkonného hardwaru je součástí dodávky kompletní softwarový stack včetně všech nejpoužívanějších prostředích (TensorFlow, Caffe, Torch, Theano, …) nasazených v Docker kontejnerech nebo aplikací pro datové analytiky. Díky integrovanému vodnímu chlazení a nízke hlučnosti je vhodný i do prostředí kanceláří.  DGX Station patří vedle DGX-1 a DGX-2 do rodiny NVIDIA DGX systémů.


Hardware

Pojďme se na NVIDIA DGX Station podívat podrobněji, nejprve z pohledu hardwaru.

ParametrDGX Station
GPUs4× NVIDIA Tesla V100 32GB
Výkon (GPU FP16)0,5 PetaFLOPS
GPU paměť128 GB celkem
CPUE5-2698 v4 2.2GHz (20 jader)
NVIDIA CUDA cores20 480
NVIDIA Tensor cores2 560
RAM256 GB
HDD4× 1,92TB SSD
Network2× 10GbE
Maximální příkon1 500 W

Všechny NVIDIA DGX systémy jsou vybaveny nejnovějšími a zároveň nejrychlejšími akcelerátory současnosti — NVIDIA Tesla V100 32GB — DGX Station čtyřmi kartami, DGX-1 osmi kartami a DGX-2 dokonce šestnácti akcelerátory! Aby mohly akcelerátory mezi sebou rychle komunikovat, propojila je NVIDIA speciálními přepínači s obrovskou datovou propustností — tzv. NVSwitch. U Systému DGX-2 dosahuje díky těmto přepínačům celkové propustnosti 2.4 TB/s (bisection bandwidth).

V100 PCIe

Softwarová výbava

Co je ale mnohem zajímavější je již zmiňovaná softwarová výbava NVIDIA DGX Station. Všechny shodně nabízí předinstalovaná a především výkonově vyladěná prostředí pro strojové učení (např. Caffe, resp. Cafe 2, Theano, TensorFlow, Torch, nebo MXNet) nebo intuitivní prostředí pro datové analytiky (NVIDIA Digits). To vše elegantně zabalené v optimalizovaných Docker kontejnerech, volně ke stažení na NVDIA GPU Cloudu (NGC). Takto vyladěné prostředí poskytuje podle NVIDIE o 30% vyšší výkon pro aplikace v oblasti učení strojů proti aplikacím nasazených jenom čistě na NVIDIA hardwaru. Hlavní výhodou předinstalovaného prostředí je rychlost nasazení, které se pohybuje v jednotkách hodin.

NVIDIA DGX systems SW stack

NVIDIA DGX systems SW stack, NVIDIA GPU Cloud

Podpora

Silnou stránkou nabízeného řešení NVIDIA je podpora celého systému. Hardwarová podpora (v případě selhání některé z komponent) je samozřejmostí. Zásadní je softwarová podpora pro celé prostředí pro případ, že něco nefunguje tak, jak má. Zákazník má k dispozici stovky vývojářů připravených pomoci. Podpora je součástí nákupu systémů NVIDIA DGX. Je k dispozici na 1 nebo 3 roky a po skončení této doby je možné ji dále prodloužit.

Díky kombinaci vyladěného hardwaru, softwaru a NVIDIA podpory dosahují NVIDIA DGX systémy vyrazně vyššího výkonu a zrychlení učící fáze machine learning aplikací:

DGX Station performance

Rozdíl mezi odladěným řešením DGX systémů pro rychlé a výkonné nasazení strojového učení v praxi a variantou poskládejte si vše sami (DIY — Do It Yourself) je patrný z následujícího videa:

Pohled do zákulisí výroby NVIDIA DGX Station a rozhovory s vývojáři této pracovní stanice určené pro vývoj a nasazení machine learning aplikací. Jednu takovouto stanici vyrobili v NVIDIA továrně v USA i pro nás.