Přehled novinek z jarního GTC 2021

19. 4. 2021

Pro společnost NVIDIA se stalo již tradicí pořádat dvě technologické konference ročně. S úctyhodným tempem jejich vývoje je to více než nutné a proto obě vždy nabídnou velké množství novinek a zajímavých produktových oznámení. Nyní nastal čas pro jarní NVIDIA GPU Technology Conference 2021 a my přinášíme souhrn toho nejzajímavějšího, co zaznělo během úvodního slova zakladatele NVIDIE Jensena Huanga. Za nás určitě vedou nové akcelerátory NVIDIA A10 a A30 postavené na čipech architektury Ampere a na které jsme se již dlouho těšili, ale bude toho samozřejmě mnohem více.

Webinář: Novinky z jarní konference NVIDIA GTC 2021

Pusťte si záznam webináře, ve kterém se dozvíte vše o nově oznámených kartách NVIDIA A30, A10, A16, RTX A5000, RTX A4000 nebo třeba čím je unikátní nová DGX Station A100. A také je v něm vysvětleno, proč se NVIDIA nově nazývá firmou třech čipů nebo třeba v čem je unikátní architektura NVIDIA DGX POD. Přehled a porovnání všech akcelerátorů také naleznete na stránce NVIDIA akcelerátory.

Stáhnout prezentaci

NVIDIA A30

NVIDIA A30 je ideální karta pro uživatele, pro které je A100 až moc výkonná nebo překračuje možnosti jejich rozpočtu, ale zároveň stále vyžadují akcelerátor s podporou výpočtů s dvojitou přesností. A30 je nejnovějším nástupcem akcelerátorů NVIDIA T4, takže využití najde nejčastěji v akceleraci výpočtů HPC aplikací nebo u inferencí umělé intelicence.

NVIDIA A30 kombinuje tenzorová jádra 3. generace s 24 GB paměti HBM2 v 10,5 palcovém dual slotovém provedení PCI Express Gen4 a maximální spotřebou desky 165W. Karta je pasivně chlazena, což ji předurčuje pro použití v aktivně chlazených datacentrech. A30 je postavená na nejnovější architektuře NVIDIA Ampere, která nabízí podporu výpočtů Tensor Float 32 (TF32) a Tensor Core FP64. Kromě těchto funkcí podporuje A30 výpočty s dvojitou přesností (FP64), jednoduchou přesností (FP32), poloviční přesností (FP16), Brain Float 16 (BF16) a Integer (INT8). Funkce Multi-Instance GPU (MIG) umožňuje hardwarové oddělení až čtyřech úloh s ideální kapacitou 6GB pro každou z nich a maximalizuje tak využití všech zdrojů GPU.

nabízí 24 GB paměti HBM2 s podporou ECC, škálovatelné až na 48 GB pomocí NVIDIA NVLinku
propustnost paměti až 933 GB/s
podpora výpočtů s dvojitou přesností FP64 s výkonem 5,2 TFLOPS a výkonem Tensor FP64 dokonce 10,3 TFLOPS
výkon až 165 TFLOPS u výpočtů TF32
podporuje PCIe Gen 4, která dosahuje až dvojnásobné propustnosti (64GB/s) oproti předchozí generací PCIe Gen 3, což zvyšuje rychlost přenosu dat z paměti CPU u úloh náročných na velké množství dat, jako je AI a datová analytika
až 4 hardwarově oddělené instance s dedikovanou GPU pamětí 6GB

Datasheet A30

Porovnání výkonu NVIDIA A30

Datasheet A10

NVIDIA A10

Pokud je NVIDIA A30 označována jako levnější a méně výkonnější sestra vlajkové lodi mezi NVIDIA kartami A100, pak A10 by se dala popsat jako mladší sourozenec akcelerátoru A40. Zatímco A30 najde využití především u HPC a AI výpočtů, desítková karta bude zářit v oblasti vizualizace a virtualizace. Kompaktní single slotová karta A10 s rozumnou spotřebou 150W je vhodná jako naprosto univerzální karta pro velké množství úloh.

A10 je ideální pro provoz vysoce výkonných virtuálních pracovních stanic (vWS) s profesionálními vizualizačními aplikacemi nebo v kombinaci se softwarem NVIDIA Virtual PC (vPC) pro multimediální virtuální desktopy. Podporuje také výpočty hlubokého a strojového učení, kódování videa, cloudové hry, AI zvukové a video efekty, vykreslování, analýzu dat a mnoho dalších úloh.

A10 je k dostání pouze ve verzi s pasivním chlazením a narozdíl od A30 nepodporuje funkcionalitu Multi-Instance GPU (MIG).

NVIDIA A10, postavená na architektuře NVIDIA Ampere, obsahuje nejnovější generace jader NVIDIA RT, Tensor a CUDA pro ty nejnáročnější grafické výpočty a akceleraci AI
24 GB paměti GDDR6 s podporou ECC
72 RT jader druhé generace
propustnost GPU paměti 600 GB/s
podporuje PCIe Gen4 s přenosovou rychlostí až 64 GB/s
výkon 31,2 TFLOPS s přesností FP32 a až 125 TFLOPS pro výpočty TF32
kompaktní single slot karta se spotřebou 150W

Porovnání výkonu NVIDIA A10

NVIDIA A16

Tak trochu jako A10, ale s mnohem vyšší hustotou výpočetního výkonu. To je nová specialitka od NVIDIE akcelerátor A16, který v sobě kombinuje výkon 4 grafických čipů na jednom boardu s pamětí 4x 16GB GDDR6. To znamená podporu až 64 souběžně pracujících uživatelů na jediné kartě ve dvouslotovém provedení. Jak již název napovídá, i A16 je postavená na nejnovější architektuře Ampere. Nahrazuje tak předchozí generaci s označením M10, která byla oznámena již v roce 2016 a přestávala vyhovovat zvyšujícím se nárokům dnešní doby.

NVIDIA A16 v kombinaci se softwarem NVIDIA vPC tvoří součást platformy NVIDIA EGX nové generace certifikované společností NVIDIA pro profesionální vizualizaci a přináší multimediální virtuální desktopy (VDI) umožňující vzdálenou práci odkudkoli.

nabízí 64GB (4x 16GB) GDDR6 paměti s podporou ECC
propustnost paměti 4x 232GB/s
podpora až 64 virtuálních ploch
PCIe Gen 4, která dosahuje až dvojnásobné propustnosti (64GB/s) oproti předchozí generací PCIe Gen 3
dual slot provedení se spotřebou 250W
podpora nejnovějších kodeků H.265 encode/decode, VP9 a AV1 decode

NVIDIA A16

NVIDIA RTX A5000

Nový člen rodiny RTX karet určených pro vizualizaci NVIDIA RTX A5000 vložil do svého názvu písmeno A (jako Ampere) a nahradil tak předchozí generaci architektury Turing RTX 5000. Ve srovnání s ní nabízí až 2,5 násobný nárůst výkonu ve výpočtech s jednoduchou přesností (27,8 TFLOPS vs. 11,2 TFLOPS) a také došlo k navýšení paměti z 16Gb na 24 GB GDDR6. Samozřejmě, že se může pochlubit i nejovější druhou generací RT jader a třetí generací Tensorových jader. Velký posun také proběhnul v počtu CUDA jader, tam z 3072 narostl až na solidních 8192 jader.

RTX A5000 přináší dokonalou rovnováhu mezi výkonem, spotřebou a spolehlivostí pro náročné výpočty a je ideální pro využití v profesionálních pracovních stanicích. Vyniká především ve vykreslování paprsků v reálném čase (real-time ray tracing), akcelerovaných AI výpočtech a profesionálním grafickém renderování.

24GB GDDR6 paměti s podporou ECC škálovatelné až na 48 GB pomocí NVIDIA NVLinku
propustnost paměti 768GB/s
8192 CUDA jader
256 Tensorových jader s výkonem až 222,2 TFLOPS
64 RT jader s výkonem až 54,2 TFLOPS
výkon s jednoduchou přesností 27,8 TFLOPS
PCIe Gen 4, která dosahuje až dvojnásobné propustnosti (64GB/s) oproti předchozí generací PCIe Gen 3
dual slot provedení se spotřebou 230W
aktivní chlazení

NVIDIA RTX A4000

NVIDIA RTX A4000 je nejvýkonnější jednoslotová grafická karta nabízející skvělý výkon ve vykreslování paprsků v reálném čase (real-time ray tracing), v akcelerovaných AI výpočtech a profesionálním grafickém renderování. RTX A4000 nabízí 16 GB paměti GDDR6, která poskytuje až o 23% vyšší propustnost pro ray tracing, rendering a AI výpočty než předchozí generace RTX 4000. RTX A4000 poskytuje největší grafickou paměť ve své třídě, proto je ideální pro řešení velkých datových sad a modelů v profesionálních aplikacích citlivých na latenci. Příjemná je i podpora až čtyř 5K monitorů při 60 Hz nebo duálních 8K displejů při 60 Hz na kartu. RTX A4000 podporuje HDR barvy pro 4K @ 60Hz pro dekódování HEVC 10 / 12b a až 4K @ 60Hz pro 10b HEVC dekódování. Každý konektor DisplayPort dosáhne ultravysokého rozlišení 4096 x 2160 při 120 Hz s 30bitovou barvou.

RTX A4000 nabízí ve srovnání s předchozí generací RTX 4000 až 2,5 násobný nárůst výkonu ve výpočtech s jednoduchou přesností (19.2 TFLOPS vs. 7.1 TFLOPS) a také došlo k dvojnásobnému navýšení paměti z 8GB na 16 GB GDDR6 s ECC. Nejnovější generace RT jader a třetí generace Tensorových jader jsou u architektury Ampere již samozřejmostí. Výrazný nárůst proběhnul i v počtu CUDA jader, z původních 2304 u starší generace se zvýšil až na 6144 CUDA jader.

16GB GDDR6 paměti s podporou ECC
propustnost paměti 448GB/s
6144 CUDA jader
192 Tensorových jader s výkonem až 153,4 TFLOPS
48 RT jader s výkonem až 37,4 TFLOPS
výkon s jednoduchou přesností 19,2 TFLOPS
PCIe Gen 4, až dvojnásobná propustnost (64GB/s) oproti předchozí generací PCIe Gen 3
single slot provedení se spotřebou 140W
aktivní chlazení

NVIDIA RTX A4000

NVIDIA Grace

Asi největším překvapením a senzací v průběhu prezentace úvodního slova Jensena Huanga (NVIDIA CEO) na GTC21 bylo oznámení vývoje vlastního procesoru Grace, jehož název je inspirován významnou americkou programátorkou Grace Hooperovou. Ten bude vycházet z architektury procesorů ARM a Jensen nám slíbil, že jeho výkon bude v HPC a AI výpočtech až desektkrát vyšší než výkon konkurenčních řešení s procesory x86 společností AMD a Intel. Nvidia chce s touto novou technologií odstranit úzká hrdla v komunikaci mezi čipy a zvýšit datovou propustnost jak mezi procesory navzájem, tak i mezi procesorem a operační pamětí a samozřejmě i směrem ke grafickým akcelerátorům. Toho chce docílit použitím pamětí LPDDR5x s propustností přes 500 GB/s a čtvrtou generací NVLinku s propustností 900GB/s.

NVIDIA BlueField DPU

Jensen Huang uvedl, že nyní se může Nvidia označovat jako společnost třech čipů. Kromě svých tradičních GPU a nově oznámených CPU čipů získala loni Nvidia akvizicí společnosti Mellanox do svého produktového portfolia i tzv. DPU (Data Processing Unit), což jsou speciální programovatelné čipy, které provádí výpočty přímo na síti bez nutnosti odesílání některých datových paketů na procesor CPU. DPU odlehčuje zatížení sítě a zrychluje softwarově definované funkce sítě, úložiště a zabezpečení, což zásadně zlepšuje výkon, efektivitu a také bezpečnost datového centra.

Nvidia avizovala, že plánovaná třetí generace BlueField-3 DPU bude podporovat rychlosti až 400Gb/s, bude mít vlastní 16GB on-board DDR5 paměť, M.2 / U.2 konektory pro přímé připojení úložiště či dedikovaný 1GbE out-of-band management port.

NVIDIA Omniverse

NVIDIA Omniverse je end-to-end platforma pro týmovou spolupráci a simulace, která zásadně transformuje složité pracovní postupy vývoje a návrhu. Jedná se o virtuální 3D svět, ve kterém můžete v reálné čase vzdáleně spolupracovat s ostatními členy týmu a snadno vytvářet složité, fyzicky přesné simulace, obrázky nebo i filmy. NVIDIA Omniverse Enterprise umožňuje 3D produkčním týmům – které jsou často velké a geograficky rozptýlené – bezproblémově spolupracovat na složitých projektech. Spíše než komplikované domlouvání osobních setkání nebo výměnu a iteraci obrovských souborů, mohou designéři, umělci a testeři pracovat současně ve virtuálním světě odkudkoli a na jakémkoli zařízení. Od léta 2021 bude předplatné platformy Omniverse Enterprise k dispozici v globální síti partnerů NVIDIA, momentálně lze zatím testovat jen Beta verzi.

Úvodní slovo Jensena Huanga na jarní GTC21

Výše je uveden stručný přehled nejzajímavějších novinek, které nás zaujaly během jarní konference GTC21, ale zaznělo toho samozřejmě mnohem více.

Pokud jste si minulý týden nestihli pustit úvodní slovo Jensena Huanga živě, můžete se na něj podívat alespoň ze záznamu na videu. Opět budete mít šanci podívat se, jak vypadá kuchyně zakladatele Nvidie a dozvědět se u toho, co pro nás Jensen upekl.

Společnost M Computers zastupuje společnost NVIDIA na českém trhu v Enterprise oblasti výpočetních akcelerátorů a AI systémů.

V loňském roce získala jako první společnost ve střední a východní Evropě nějvýšší status ELITE PARTNER a zároveň i dvě ocenění NVIDIA AI Innovator a NVIDIA AI Champion.

Přehled novinek z jarního GTC 2021

Webinář: Novinky z jarní konference NVIDIA GTC 2021

NVIDIA A30

Porovnání výkonu NVIDIA A30

NVIDIA A10

Porovnání výkonu NVIDIA A10

NVIDIA A16

NVIDIA RTX A5000

NVIDIA RTX A4000

NVIDIA Grace

NVIDIA BlueField DPU

NVIDIA Omniverse

Úvodní slovo Jensena Huanga na jarní GTC21

Společnost M Computers zastupuje společnost NVIDIA na českém trhu v Enterprise oblasti výpočetních akcelerátorů a AI systémů.

DALŠÍ AKTUALITY

Petr Plodík získal stříbrnou medaili prof. Jánského

Pomáháme zrychlit geolokační projekty

Na vlnách AI s Lenovo a M Computers

Do práce na kole 2024

NVIDIA DGX na CEITEC VUT v Brně

Víkend s nadací Srdce na dlani

Dubnová běžecká a pěší výzva

Získali jsme prestižní NVIDIA ocenění

Spolupráce s Photon Energy Group – video

O nás

Produkty NVIDIA

Produkty Intel a AMD

Kontakt