Petabajt chytřeji a levněji


Vědecké a výzkumné instituce generují v dnešní době obrovské objemy dat, které neustále narůstají. Masarykova univerzita v Brně v letošním roce rozšířila svůj seznam datových úložišť o novou instalaci s celkovou kapacitou 1 024 TB, tedy 1 PB (petabajt). Ve výběrovém řízení zvítězilo úložiště postavené na technologii IBM Spectrum Scale a diskových polích Infortrend. Toto pole dodala specializovaná česká firma M Computers.


img_5548Předmětem poptávky byla instalace a konfigurace „clusteru datových služeb“ o čisté kapacitě 1000 TB. Dodávka zahrnovala montáž hardware, jeho zapojení a konfiguraci, instalaci a nastavení softwarových balíků a komponent, vyladění výkonu, ověření bezchybného chodu všech komponent úložiště, a nakonec demonstraci požadovaného výkonu provedením akceptačních testů. Datové úložiště slouží pro ukládání dat zpracovávaných ve výpočetním prostředí CERIT-SC a MetaCentra. Uživatelé jsou jak z Masarykovy univerzity, tak i z řad vědecké komunity z celé České republiky. Celkově jde tedy o zhruba 1300 aktivních přístupů.

Požadavek na rychlost základem

Zadavatel kladl na úložiště řadu technických požadavků, jako vysokou dostupnost s maximální odolností proti výpadku jednotlivých komponent, active-active přístupy přes protokoly NFSv4 a CIFS z důvodu připojení uživatelů z různých prostředí jako Windows či Linux, nebo využití technologie SSD disků pro maximální zrychlení souborových operací na úložišti.  Zvláště důležité byly požadavky na rychlost – 7 GB/s pro čtení a 5GB/s pro zápis 16 souborů paralelně.

Levnější, přesto výkonnější a rychlejší

Díky svému know-how mohli odborníci společnosti M Computers sáhnout po cenově velmi efektivním řešení založeném na diskových polích Infortrend řady ESDS 1000, v provedení se 16 pozicemi v 3U chassis. Přestože jde o disková pole cílená primárně pro segment SMB, vyznačují se vysokou rychlostí a spolehlivostí, velkou modularitou, zaručí silnou integritu dat, podporují připojení pomocí technologií SAS, Fibre Channel nebo iSCSI.  V neposlední řadě usnadní práci administrátorů díky uživatelsky otevřenému managementu.

Parametry dodaného řešení:
Čistá kapacita: 1PB (1024 TB)
Rychlost zápisu: 5 GB/s
Rychlost čtení: 7 GB/s
Počet přístupových serverů v HA clusteru: 3
Škálovatelnost:
– až 2^99 bytu/fs
– 16 384 uzlů v cluster
Počet snapshotů: neomezený +
Snadná integrace pro zálohování, do cloudů nebo object storage
Cena: 4,2 mil Kč bez DPH

img_5534

 

Jedno diskové pole dosahuje výkonu až 550k IOPS a propustnosti až 5 500 MB/s, dodává se s duálními řadiči, redundantními zdroji a podporuje až 316 HDD v celkové kapacitě až 1 869 TB. Diskové pole nabízí možnost využití SSD cache, pro významné zrychlení čtecích IO operací a umožňuje víceúrovňový automatický tiering. Vzhledem k požadavkům na maximalizaci propustnosti celého úložiště využili specialisté společnosti M Computers rychlá rozhraní Fibre Channel pro přístup k datovým polím a Infiniband společně s 10Gbit Ethernetem pro uživatelský přístup k datům.

Řešení připravené pro velké objemy dat

img_5619Další požadavky byly kladeny na funkcionalitu snapshotů, tedy „zamrazení dat“ v určitém časovém okamžiku. V rámci řešeného úložiště jsou tyto s výhodou využívány pro efektivní operativní zálohy. Ty dovolují uživatelům návrat k předchozí verzi souboru, případně k obnovení omylem smazaných dat.  Pro aktuální den jsou pro velmi rychlou obnovu k dispozici snapshoty vytvářené po patnácti minutách, pro dalších až 14 dní je pak k dispozici jeden snapshot denně.

Velký objem a vysoká požadovaná rychlost klade na funkcionalitu snapshotů značné požadavky, které není velká většina systémů dostupných na trhu schopna splnit. Systém IBM Spectrum Scale však i v této oblasti ukazuje své unikátní vlastnosti a umožňuje funkcionalitu snapshotů využít skutečně naplno bez degradace výkonu či jiných omezení.

Řídicí software

img_5499Softwarovým srdcem úložiště se stal systém Spectrum Scale společnosti IBM. Ten patří ke světové špičce mezi produkty pro softwarově definovanou storage. Systém komplexně řeší problematiku ukládání a přístupu k velkým objemům dat v oblastech vědeckých výpočtů, big data, analýz, objektů, obecných nestrukturovaných dat a dalších. Vysoká  škálovatelnost systému umožňuje maximální velikost souborového systému až 299 bytů a maximum 16 384 uzlů v storage clusteru.

Systém je od začátku koncipován pro enterprise nasazení, velkou robustnost a vysoký výkon. Podporuje technologii hierarchických datových úložišť s unikátní možností integrace diskových, páskových i externích cloudových úložišť v jednom souborovém systému s jednotným uživatelským přístupem k datům uložených na různých médiích.

Podpora a servis

Řešení bylo dodáno včetně servisní a záruční podpory na 5 let s reakční dobou nejpozději následující pracovní den od nahlášení závady, s výměnou vadných komponent v místě instalace.

Systém je připojen na non-stop dohledové centrum společnosti M Computers. Technici dohledového centra mají k dispozici kompletní sadu náhradních dílů a mohou tak reagovat okamžitě na servisní požadavky.

 

Reference vyšla také jako článek na ITBiz.cz