Petabajt chytřeji a levněji
Vědecké a výzkumné instituce generují v dnešní době obrovské objemy dat, které neustále narůstají. Masarykova univerzita v Brně v letošním roce rozšířila svůj seznam datových úložišť o novou instalaci s celkovou kapacitou 1 024 TB, tedy 1 PB (petabajt). Ve výběrovém řízení zvítězilo úložiště postavené na technologii IBM Spectrum Scale a diskových polích Infortrend. Toto pole dodala specializovaná česká firma M Computers.
Předmětem poptávky byla instalace a konfigurace „clusteru datových služeb“ o čisté kapacitě 1000 TB. Dodávka zahrnovala montáž hardware, jeho zapojení a konfiguraci, instalaci a nastavení softwarových balíků a komponent, vyladění výkonu, ověření bezchybného chodu všech komponent úložiště, a nakonec demonstraci požadovaného výkonu provedením akceptačních testů. Datové úložiště slouží pro ukládání dat zpracovávaných ve výpočetním prostředí CERIT-SC a MetaCentra. Uživatelé jsou jak z Masarykovy univerzity, tak i z řad vědecké komunity z celé České republiky. Celkově jde tedy o zhruba 1300 aktivních přístupů.
Požadavek na rychlost základem
Zadavatel kladl na úložiště řadu technických požadavků, jako vysokou dostupnost s maximální odolností proti výpadku jednotlivých komponent, active-active přístupy přes protokoly NFSv4 a CIFS z důvodu připojení uživatelů z různých prostředí jako Windows či Linux, nebo využití technologie SSD disků pro maximální zrychlení souborových operací na úložišti. Zvláště důležité byly požadavky na rychlost – 7 GB/s pro čtení a 5GB/s pro zápis 16 souborů paralelně.
Levnější, přesto výkonnější a rychlejší
Díky svému know-how mohli odborníci společnosti M Computers sáhnout po cenově velmi efektivním řešení založeném na diskových polích Infortrend řady ESDS 1000, v provedení se 16 pozicemi v 3U chassis. Přestože jde o disková pole cílená primárně pro segment SMB, vyznačují se vysokou rychlostí a spolehlivostí, velkou modularitou, zaručí silnou integritu dat, podporují připojení pomocí technologií SAS, Fibre Channel nebo iSCSI. V neposlední řadě usnadní práci administrátorů díky uživatelsky otevřenému managementu.
Jedno diskové pole dosahuje výkonu až 550k IOPS a propustnosti až 5 500 MB/s, dodává se s duálními řadiči, redundantními zdroji a podporuje až 316 HDD v celkové kapacitě až 1 869 TB. Diskové pole nabízí možnost využití SSD cache, pro významné zrychlení čtecích IO operací a umožňuje víceúrovňový automatický tiering. Vzhledem k požadavkům na maximalizaci propustnosti celého úložiště využili specialisté společnosti M Computers rychlá rozhraní Fibre Channel pro přístup k datovým polím a Infiniband společně s 10Gbit Ethernetem pro uživatelský přístup k datům.
Řešení připravené pro velké objemy dat
Další požadavky byly kladeny na funkcionalitu snapshotů, tedy „zamrazení dat“ v určitém časovém okamžiku. V rámci řešeného úložiště jsou tyto s výhodou využívány pro efektivní operativní zálohy. Ty dovolují uživatelům návrat k předchozí verzi souboru, případně k obnovení omylem smazaných dat. Pro aktuální den jsou pro velmi rychlou obnovu k dispozici snapshoty vytvářené po patnácti minutách, pro dalších až 14 dní je pak k dispozici jeden snapshot denně.
Velký objem a vysoká požadovaná rychlost klade na funkcionalitu snapshotů značné požadavky, které není velká většina systémů dostupných na trhu schopna splnit. Systém IBM Spectrum Scale však i v této oblasti ukazuje své unikátní vlastnosti a umožňuje funkcionalitu snapshotů využít skutečně naplno bez degradace výkonu či jiných omezení.
Řídicí software
Softwarovým srdcem úložiště se stal systém Spectrum Scale společnosti IBM. Ten patří ke světové špičce mezi produkty pro softwarově definovanou storage. Systém komplexně řeší problematiku ukládání a přístupu k velkým objemům dat v oblastech vědeckých výpočtů, big data, analýz, objektů, obecných nestrukturovaných dat a dalších. Vysoká škálovatelnost systému umožňuje maximální velikost souborového systému až 299 bytů a maximum 16 384 uzlů v storage clusteru.
Systém je od začátku koncipován pro enterprise nasazení, velkou robustnost a vysoký výkon. Podporuje technologii hierarchických datových úložišť s unikátní možností integrace diskových, páskových i externích cloudových úložišť v jednom souborovém systému s jednotným uživatelským přístupem k datům uložených na různých médiích.
Podpora a servis
Řešení bylo dodáno včetně servisní a záruční podpory na 5 let s reakční dobou nejpozději následující pracovní den od nahlášení závady, s výměnou vadných komponent v místě instalace.
Systém je připojen na non-stop dohledové centrum společnosti M Computers. Technici dohledového centra mají k dispozici kompletní sadu náhradních dílů a mohou tak reagovat okamžitě na servisní požadavky.
Reference vyšla také jako článek na ITBiz.cz