NVIDIA DGX Station
DGX Station představuje první osobní superpočítač optimalizovaný pro úlohy umělé inteligence a strojového učení. Vedle výkonného hardwaru je součástí dodávky kompletní softwarový stack včetně všech nejpoužívanějších prostředích (TensorFlow, Caffe, Torch, Theano, …) nasazených v Docker kontejnerech nebo aplikací pro datové analytiky. Díky integrovanému vodnímu chlazení a nízke hlučnosti je vhodný i do prostředí kanceláří. DGX Station patří vedle DGX-1 a DGX-2 do rodiny NVIDIA DGX systémů.
Hardware
Pojďme se na NVIDIA DGX Station podívat podrobněji, nejprve z pohledu hardwaru.
Parametr | DGX Station |
---|---|
GPUs | 4× NVIDIA Tesla V100 32GB |
Výkon (GPU FP16) | 0,5 PetaFLOPS |
GPU paměť | 128 GB celkem |
CPU | E5-2698 v4 2.2GHz (20 jader) |
NVIDIA CUDA cores | 20 480 |
NVIDIA Tensor cores | 2 560 |
RAM | 256 GB |
HDD | 4× 1,92TB SSD |
Network | 2× 10GbE |
Maximální příkon | 1 500 W |
Všechny NVIDIA DGX systémy jsou vybaveny nejnovějšími a zároveň nejrychlejšími akcelerátory současnosti — NVIDIA Tesla V100 32GB — DGX Station čtyřmi kartami, DGX-1 osmi kartami a DGX-2 dokonce šestnácti akcelerátory! Aby mohly akcelerátory mezi sebou rychle komunikovat, propojila je NVIDIA speciálními přepínači s obrovskou datovou propustností — tzv. NVSwitch. U Systému DGX-2 dosahuje díky těmto přepínačům celkové propustnosti 2.4 TB/s (bisection bandwidth).
Softwarová výbava
Co je ale mnohem zajímavější je již zmiňovaná softwarová výbava NVIDIA DGX Station. Všechny shodně nabízí předinstalovaná a především výkonově vyladěná prostředí pro strojové učení (např. Caffe, resp. Cafe 2, Theano, TensorFlow, Torch, nebo MXNet) nebo intuitivní prostředí pro datové analytiky (NVIDIA Digits). To vše elegantně zabalené v optimalizovaných Docker kontejnerech, volně ke stažení na NVDIA GPU Cloudu (NGC). Takto vyladěné prostředí poskytuje podle NVIDIE o 30% vyšší výkon pro aplikace v oblasti učení strojů proti aplikacím nasazených jenom čistě na NVIDIA hardwaru. Hlavní výhodou předinstalovaného prostředí je rychlost nasazení, které se pohybuje v jednotkách hodin.
Podpora
Silnou stránkou nabízeného řešení NVIDIA je podpora celého systému. Hardwarová podpora (v případě selhání některé z komponent) je samozřejmostí. Zásadní je softwarová podpora pro celé prostředí pro případ, že něco nefunguje tak, jak má. Zákazník má k dispozici stovky vývojářů připravených pomoci. Podpora je součástí nákupu systémů NVIDIA DGX. Je k dispozici na 1 nebo 3 roky a po skončení této doby je možné ji dále prodloužit.
Díky kombinaci vyladěného hardwaru, softwaru a NVIDIA podpory dosahují NVIDIA DGX systémy vyrazně vyššího výkonu a zrychlení učící fáze machine learning aplikací:
Rozdíl mezi odladěným řešením DGX systémů pro rychlé a výkonné nasazení strojového učení v praxi a variantou poskládejte si vše sami (DIY — Do It Yourself) je patrný z následujícího videa:
Pohled do zákulisí výroby NVIDIA DGX Station a rozhovory s vývojáři této pracovní stanice určené pro vývoj a nasazení machine learning aplikací. Jednu takovouto stanici vyrobili v NVIDIA továrně v USA i pro nás.