Přehled novinek z jarního GTC 2021
19. 4. 2021
19. 4. 2021
Pusťte si záznam webináře, ve kterém se dozvíte vše o nově oznámených kartách NVIDIA A30, A10, A16, RTX A5000, RTX A4000 nebo třeba čím je unikátní nová DGX Station A100. A také je v něm vysvětleno, proč se NVIDIA nově nazývá firmou třech čipů nebo třeba v čem je unikátní architektura NVIDIA DGX POD. Přehled a porovnání všech akcelerátorů také naleznete na stránce NVIDIA akcelerátory.
NVIDIA A30 je ideální karta pro uživatele, pro které je A100 až moc výkonná nebo překračuje možnosti jejich rozpočtu, ale zároveň stále vyžadují akcelerátor s podporou výpočtů s dvojitou přesností. A30 je nejnovějším nástupcem akcelerátorů NVIDIA T4, takže využití najde nejčastěji v akceleraci výpočtů HPC aplikací nebo u inferencí umělé intelicence.
NVIDIA A30 kombinuje tenzorová jádra 3. generace s 24 GB paměti HBM2 v 10,5 palcovém dual slotovém provedení PCI Express Gen4 a maximální spotřebou desky 165W. Karta je pasivně chlazena, což ji předurčuje pro použití v aktivně chlazených datacentrech. A30 je postavená na nejnovější architektuře NVIDIA Ampere, která nabízí podporu výpočtů Tensor Float 32 (TF32) a Tensor Core FP64. Kromě těchto funkcí podporuje A30 výpočty s dvojitou přesností (FP64), jednoduchou přesností (FP32), poloviční přesností (FP16), Brain Float 16 (BF16) a Integer (INT8). Funkce Multi-Instance GPU (MIG) umožňuje hardwarové oddělení až čtyřech úloh s ideální kapacitou 6GB pro každou z nich a maximalizuje tak využití všech zdrojů GPU.
Pokud je NVIDIA A30 označována jako levnější a méně výkonnější sestra vlajkové lodi mezi NVIDIA kartami A100, pak A10 by se dala popsat jako mladší sourozenec akcelerátoru A40. Zatímco A30 najde využití především u HPC a AI výpočtů, desítková karta bude zářit v oblasti vizualizace a virtualizace. Kompaktní single slotová karta A10 s rozumnou spotřebou 150W je vhodná jako naprosto univerzální karta pro velké množství úloh.
A10 je ideální pro provoz vysoce výkonných virtuálních pracovních stanic (vWS) s profesionálními vizualizačními aplikacemi nebo v kombinaci se softwarem NVIDIA Virtual PC (vPC) pro multimediální virtuální desktopy. Podporuje také výpočty hlubokého a strojového učení, kódování videa, cloudové hry, AI zvukové a video efekty, vykreslování, analýzu dat a mnoho dalších úloh.
A10 je k dostání pouze ve verzi s pasivním chlazením a narozdíl od A30 nepodporuje funkcionalitu Multi-Instance GPU (MIG).
Tak trochu jako A10, ale s mnohem vyšší hustotou výpočetního výkonu. To je nová specialitka od NVIDIE akcelerátor A16, který v sobě kombinuje výkon 4 grafických čipů na jednom boardu s pamětí 4x 16GB GDDR6. To znamená podporu až 64 souběžně pracujících uživatelů na jediné kartě ve dvouslotovém provedení. Jak již název napovídá, i A16 je postavená na nejnovější architektuře Ampere. Nahrazuje tak předchozí generaci s označením M10, která byla oznámena již v roce 2016 a přestávala vyhovovat zvyšujícím se nárokům dnešní doby.
NVIDIA A16 v kombinaci se softwarem NVIDIA vPC tvoří součást platformy NVIDIA EGX nové generace certifikované společností NVIDIA pro profesionální vizualizaci a přináší multimediální virtuální desktopy (VDI) umožňující vzdálenou práci odkudkoli.
Nový člen rodiny RTX karet určených pro vizualizaci NVIDIA RTX A5000 vložil do svého názvu písmeno A (jako Ampere) a nahradil tak předchozí generaci architektury Turing RTX 5000. Ve srovnání s ní nabízí až 2,5 násobný nárůst výkonu ve výpočtech s jednoduchou přesností (27,8 TFLOPS vs. 11,2 TFLOPS) a také došlo k navýšení paměti z 16Gb na 24 GB GDDR6. Samozřejmě, že se může pochlubit i nejovější druhou generací RT jader a třetí generací Tensorových jader. Velký posun také proběhnul v počtu CUDA jader, tam z 3072 narostl až na solidních 8192 jader.
RTX A5000 přináší dokonalou rovnováhu mezi výkonem, spotřebou a spolehlivostí pro náročné výpočty a je ideální pro využití v profesionálních pracovních stanicích. Vyniká především ve vykreslování paprsků v reálném čase (real-time ray tracing), akcelerovaných AI výpočtech a profesionálním grafickém renderování.
NVIDIA RTX A4000 je nejvýkonnější jednoslotová grafická karta nabízející skvělý výkon ve vykreslování paprsků v reálném čase (real-time ray tracing), v akcelerovaných AI výpočtech a profesionálním grafickém renderování. RTX A4000 nabízí 16 GB paměti GDDR6, která poskytuje až o 23% vyšší propustnost pro ray tracing, rendering a AI výpočty než předchozí generace RTX 4000. RTX A4000 poskytuje největší grafickou paměť ve své třídě, proto je ideální pro řešení velkých datových sad a modelů v profesionálních aplikacích citlivých na latenci. Příjemná je i podpora až čtyř 5K monitorů při 60 Hz nebo duálních 8K displejů při 60 Hz na kartu. RTX A4000 podporuje HDR barvy pro 4K @ 60Hz pro dekódování HEVC 10 / 12b a až 4K @ 60Hz pro 10b HEVC dekódování. Každý konektor DisplayPort dosáhne ultravysokého rozlišení 4096 x 2160 při 120 Hz s 30bitovou barvou.
RTX A4000 nabízí ve srovnání s předchozí generací RTX 4000 až 2,5 násobný nárůst výkonu ve výpočtech s jednoduchou přesností (19.2 TFLOPS vs. 7.1 TFLOPS) a také došlo k dvojnásobnému navýšení paměti z 8GB na 16 GB GDDR6 s ECC. Nejnovější generace RT jader a třetí generace Tensorových jader jsou u architektury Ampere již samozřejmostí. Výrazný nárůst proběhnul i v počtu CUDA jader, z původních 2304 u starší generace se zvýšil až na 6144 CUDA jader.
Asi největším překvapením a senzací v průběhu prezentace úvodního slova Jensena Huanga (NVIDIA CEO) na GTC21 bylo oznámení vývoje vlastního procesoru Grace, jehož název je inspirován významnou americkou programátorkou Grace Hooperovou. Ten bude vycházet z architektury procesorů ARM a Jensen nám slíbil, že jeho výkon bude v HPC a AI výpočtech až desektkrát vyšší než výkon konkurenčních řešení s procesory x86 společností AMD a Intel. Nvidia chce s touto novou technologií odstranit úzká hrdla v komunikaci mezi čipy a zvýšit datovou propustnost jak mezi procesory navzájem, tak i mezi procesorem a operační pamětí a samozřejmě i směrem ke grafickým akcelerátorům. Toho chce docílit použitím pamětí LPDDR5x s propustností přes 500 GB/s a čtvrtou generací NVLinku s propustností 900GB/s.
Jensen Huang uvedl, že nyní se může Nvidia označovat jako společnost třech čipů. Kromě svých tradičních GPU a nově oznámených CPU čipů získala loni Nvidia akvizicí společnosti Mellanox do svého produktového portfolia i tzv. DPU (Data Processing Unit), což jsou speciální programovatelné čipy, které provádí výpočty přímo na síti bez nutnosti odesílání některých datových paketů na procesor CPU. DPU odlehčuje zatížení sítě a zrychluje softwarově definované funkce sítě, úložiště a zabezpečení, což zásadně zlepšuje výkon, efektivitu a také bezpečnost datového centra.
Nvidia avizovala, že plánovaná třetí generace BlueField-3 DPU bude podporovat rychlosti až 400Gb/s, bude mít vlastní 16GB on-board DDR5 paměť, M.2 / U.2 konektory pro přímé připojení úložiště či dedikovaný 1GbE out-of-band management port.
NVIDIA Omniverse je end-to-end platforma pro týmovou spolupráci a simulace, která zásadně transformuje složité pracovní postupy vývoje a návrhu. Jedná se o virtuální 3D svět, ve kterém můžete v reálné čase vzdáleně spolupracovat s ostatními členy týmu a snadno vytvářet složité, fyzicky přesné simulace, obrázky nebo i filmy. NVIDIA Omniverse Enterprise umožňuje 3D produkčním týmům – které jsou často velké a geograficky rozptýlené – bezproblémově spolupracovat na složitých projektech. Spíše než komplikované domlouvání osobních setkání nebo výměnu a iteraci obrovských souborů, mohou designéři, umělci a testeři pracovat současně ve virtuálním světě odkudkoli a na jakémkoli zařízení. Od léta 2021 bude předplatné platformy Omniverse Enterprise k dispozici v globální síti partnerů NVIDIA, momentálně lze zatím testovat jen Beta verzi.
V loňském roce získala jako první společnost ve střední a východní Evropě nějvýšší status ELITE PARTNER a zároveň i dvě ocenění NVIDIA AI Innovator a NVIDIA AI Champion.