Novinky z podzimní konference GTC21

19. 11. 2021

Jako již tradičně, i na podzimní NVIDIA GPU Technology Conference 2021 jsme dávali pozor a nyní vám přinášíme přehled toho nejzajímavějšího, co bylo představeno během virtuálních prezentací. Nejvíce nám udělaly radost přírůstky do rodiny akcelerátorů generace Ampere a to především akcelerátor A2, který je přímým nástupcem velmi oblíbených Tesla T4. A samozřejmě jsme se těšili i na návštěvu Jensenovy kuchyně, kterou jsme si oblíbili během předchozích živých přenosů úvodního slova zakladatele společnosti Nvidia, i když tentokrát jsme ji navštívili trochu jinak, než jsme byli zvyklí.

NVIDIA A2

Ohlášením karty NVIDIA A2 se na trh konečně dostává přímý nástupce téměř čtyři roky staré NVIDIA Tesla T4. Tato malá a úsporná karta v sobě skrývá překvapivě velký výkon vhodný především pro inference umělé inteligence. Po akcelerátorech A10 se jedná o druhou single slotovou kartu z generace Ampere, ve své velikosti ale nemá konkureci. Svým formátem HHHL, tedy poloviční šířka / poloviční délka a s nastavitelným TDP pouhých 40-60 W se hodí téměř do každého serveru.

  • nabízí 16 GB paměti GDDR6
  • propustnost paměti až 200 GB/s
  • výkon 4,5 TFLOPS u výpočtů FP32 a až 18 TFLOPS u Tensor TF32 s využitím sparsity
  • výkon až 36 TFLOPS u výpočtů AI Tensor TF16 s využitím sparsity
  • konfigurovatelná spotřeba TDP 40-60W
  • pasivní chlazení, single-slot, low-profile formát
  • podporuje PCIe Gen 4, která dosahuje až dvojnásobné propustnosti (64GB/s) oproti předchozí generací PCIe Gen 3, což zvyšuje rychlost přenosu dat z paměti CPU u úloh náročných na velké množství dat

Srovnání výkonu AI inferencí NVIDIA A2 vs. CPU

NVIDIA RTX A4500

NVIDIA RTX A4500, postavená na architektuře NVIDIA Ampere, obsahuje nejnovější generace jader NVIDIA RT, Tensor a CUDA pro ty nejnáročnější grafické výpočty a akceleraci AI.

A4500 je ideální pro provoz vysoce výkonných virtuálních pracovních stanic (vWS) s profesionálními vizualizačními aplikacemi nebo v kombinaci se softwarem NVIDIA Virtual PC (vPC) pro multimediální virtuální desktopy. Podporuje také výpočty hlubokého a strojového učení, kódování videa, cloud gaming, AI zvukové a video efekty, vykreslování, analýzu dat a mnoho dalších úloh.

  • 20 GB paměti GDDR6 s podporou ECC
  • 7 168 CUDA a 224 Tensor jader třetí generace
  • výkon 23,7 TFLOPS s přesností FP32 a až 189,2 TFLOPS pro výpočty Tensor TF32 s využitím funkce sparsity
  • 56 RT jader s výkonem 46,2 TFLOPS
  • propustnost GPU paměti 640 GB/s
  • podporuje PCIe Gen4 s přenosovou rychlostí až 64 GB/s
  • možnost propojení dvou karet pomocí NVLink bridge
  • grafický výstup 4x DisplayPort
  • aktivní dual-slot karta se spotřebou 200W

NVIDIA RTX A2000

Tohoto drobečka si zamilujete! Grafický akcelerátor NVIDIA RTX A2000 je sice velikostí nejmenším zástupcem RTX karet pro pracovní stanice, ale za svůj výkon se rozhodně nemusí stydět! Využití nalezne především v oblasti renderování a vykreslování světla v reálném čase, 3D modelingu a simulacích, ale je skvělý i pro výpočty s akcelerací AI. Základní model nabídne 6GB GPU paměti, můžete si ale pořídit i variantu s 12GB GDDR s podporou ECC. Tato dual-slotová karta přichází jak v Low Profile, tak i v klasickém ATX provedení.

  • nabízí 6GB nebo 12GB GDDR6 paměti s podporou ECC
  • 3 328 CUDA a 104 Tensor jader třetí generace
  • výkon 8 TFLOPS s přesností FP32 a až 63,9 TFLOPS pro výpočty Tensor TF32 s využitím funkce sparsity
  • 26 RT jader s výkonem 15,6 TFLOPS
  • propustnost paměti 288 GB/s
  • PCIe Gen 4, která dosahuje až dvojnásobné propustnosti (64GB/s) oproti předchozí generací PCIe Gen 3
  • dual slot provedení se spotřebou 70W
  • grafický výstup 4x mini DisplayPort