PočetnaOstaloTech2 ExaFLOPS Aurora superračunalo je spremno: sa Intel Max serijom procesora i...

2 ExaFLOPS Aurora superračunalo je spremno: sa Intel Max serijom procesora i GPU-a


Nacionalni laboratorij Argonne i Intel objavili su u četvrtak da je instalacija 10.624 modula za superračunalo Aurora dovršena i da će sustav biti uključen kasnije tijekom ove godine. Stroj koristi desetke tisuća Xeon Max ‘Sapphire Rapids’ procesora s HBM2E memorijom, kao i deseci tisuća GPU Max ‘Ponte Vecchio’ računalnih GPU-ova za podatkovne centre kako bi postigli performanse od preko 2 FP64 ExaFLOPS-a.

Superračunalo Aurora koje je izgradio HPE sastoji se od 166 regala sa 64 modula po stalku, za ukupno 10.624 modula. Svaki Aurora modul temelji se na dva Xeon Max CPU-a sa 64 GB HBM2E memorije u paketu kao i šest Intel Data Center Max ‘Ponte Vecchio’ računalnih GPU-a. Ovi CPU-ovi i GPU-ovi bit će hlađeni prilagođenim sustavom hlađenja tekućinom.

Aurora superračunalo

Ukupno, superračunalo Aurora ima 21.248 CPU-a opće namjene s preko 1,1 milijun jezgri visokih performansi, 19,9 petabajta (PB) DDR5 memorije, 1,36 PB HBM2E memorije priključene na CPU-ove i 63.744 računalna GPU-a dizajnirana za masivna paralelna AI i HPC radna opterećenja s 8,16 PB HBM2E ugrađene memorije. Moduli su međusobno povezani pomoću HPE-ove Slingshot tkanine dizajnirane posebno za superračunala.

“Aurora je prva implementacija Intelove GPU serije Max, najvećeg sustava temeljenog na CPU-u Xeon Max i najvećeg klastera GPU-a na svijetu”, rekao je Jeff McVeigh, korporativni potpredsjednik Intela i generalni direktor Super Compute Group. “Ponosni smo što smo dio ovog povijesnog sustava i uzbuđeni zbog revolucionarne umjetne inteligencije, znanosti i inženjerstva koje će Aurora omogućiti.”

Aurora superračunalo

Superračunalo Aurora koristi niz od 1024 čvora za pohranu koji se sastoji od poluprovodničkih uređaja za pohranu i pruža 220PB kapaciteta kao i 31 TB/s ukupne propusnosti, što će biti zgodno za rukovanje radnim opterećenjima koja uključuju ogromne skupove podataka, poput istraživanja nuklearne fuzije, znanstveni inženjering, fizičke simulacije, istraživanje lijekova, vremenska prognoza kao i mnogi drugi zadaci.

Iako je instalacija Aurorinih modula dovršena, superračunalo tek treba proći prijemno testiranje. Kada to učini i bude online kasnije ove godine, obećava da će dosegnuti teoretsku vrhunsku izvedbu iznad 2 ExaFLOPS-a, što ga čini prvim superračunalom koje je postiglo ovu razinu performansi kada se pridruži rangu Top500 liste.

“Dok radimo na testiranju prihvatljivosti, koristit ćemo Auroru za treniranje nekih velikih generativnih AI modela otvorenog koda za znanost”, rekao je Rick Stevens, suradnik ravnatelja laboratorija Nacionalnog laboratorija Argonne. “Aurora, s više od 60.000 Intel Max GPU-ova, vrlo brzim I/O sustavom i potpuno solid-state sustavom masovne pohrane, savršeno je okruženje za obuku ovih modela.”

Dok superračunalo Aurora tek mora proći testove, a ANL tek mora dostaviti svoje rezultate performansi za Top500.org, Intel je iskoristio priliku da podijeli prednosti performansi koje njegov hardver ima u odnosu na konkurentska rješenja iz AMD-a i Nvidije.

Prema Intelu, preliminarni testovi s Max Series GPU-ima pokazuju da su izvrsni u ‘stvarnim znanstvenim i inženjerskim radnim opterećenjima’, pružajući performanse dvostruko veće od AMD Instinct MI250X GPU-a na OpenMC-u i gotovo savršeno skalabilne na stotine čvorova. Osim toga, Intel kaže da njegov Intel Xeon Max Series CPU nudi 40% prednosti u performansama u odnosu na konkurente u brojnim HPC aplikacijama, uključujući HPCG, NEMO-GYRE, Anerlastic Wave Propagation, BlackScholes i OpenFOAM.

Piše: D.M.


RELATED ARTICLES

Komentiraj

Please enter your comment!
Please enter your name here

- Advertisment -

Most Popular