NVIDIA DGX Vera Rubin blade

NVIDIA DGX Rubin NVL8

Platforma NVIDIA Rubin je navržena pro éru agentní umělé inteligence a uvažování. Je optimalizována pro zvládání vícekrokového řešení problémů a rozsáhlých pracovních postupů s dlouhým kontextem ve velkém měřítku. Odstraněním klíčových bottlenecků v komunikaci a přesunech paměti platforma Rubin výrazně zrychluje inferenci, poskytuje více tokenů na watt a snižuje náklady na token oproti generaci NVIDIA Blackwell.

8x GPU

NVIDIA Rubin

2x CPU

Intel Xeon 6776P

2.3 TB

GPU Memory

400*

PFLOPS FP4I

280*

PFLOPS FP4T

140*

PFLOPS FP8/6T

* FP4I značí výkonnost při přesnosti NVFP4 pro inferenci, FP4T značí výkonnost NVFP4 pro trénování a FP8/6T značí výkonnost FP8 / FP6 pro trénování.