Varför behöver vi superdatorer och vem använder dem?

Eftersom USA tävlar med Kina för att bygga de snabbaste superdatorer, kanske du undrar hur dessa jätte maskiner används.

En superdator kan innehålla hundratusentals processorkärnor och kräver en hel byggnad för att hysa och svalna – för att inte tala om miljoner dollar för att skapa och underhålla dem. Men trots dessa utmaningar kommer allt fler att gå online när USA och Kina utvecklar nya “exascale” superdatorer, som lovar en femfaldig prestandaförbättring jämfört med nuvarande ledande system.

Så vem behöver all denna datorkraft och varför? För att få reda på besökte PCMag Lawrence Livermore National Laboratory i Kalifornien, som är hem för flera superdatorer, inklusive världens näst snabbaste, Sierra. Det var där vi lärde oss hur systemingenjörer underhåller maskinerna för att tjäna vetenskapliga forskare men också testar något du kanske inte förväntar dig: kärnvapen.

Ett klassificerat system

Sierra Supercomputer 2

När du besöker Sierra kommer du att märka orden “klassificerad” och “hemlig begränsad data” publicerad på superdatorn, som består av 240 serverliknande rack. Varningarna finns eftersom Sierra bearbetar data som involverar USA: s kärnkraftslager, inklusive hur vapnen ska detonera i den verkliga världen.

USA genomförde sitt senaste levande kärnvapentest 1992. Sedan dess har landet använt superdatorer för att praktiskt utföra experimenten, och Sierra är en del av det uppdraget. Maskinen färdigställdes förra året främst för att hjälpa den amerikanska regeringen att övervaka och testa effektiviteten i landets åldrande kärnvapenarsenal, som rutinmässigt måste underhållas.

“Det enda sättet en avskräckande effekt är om du vet att den kan fungera, och att din motståndare också vet och tror att den fungerar”, säger Adam Bertsch, en högpresterande datorsystemtekniker vid laboratoriet.

Superdator-simuleringar

Inte överraskande kräver simning av en kärnexplosion mycket matte. Grundläggande principer inom vetenskapen kan förutsäga hur partiklar kommer att interagera med varandra under olika förhållanden. Den amerikanska regeringen har också decennier av data som samlats in från verkliga kärnvapenprov. Forskare har kombinerat denna information för att skapa ekvationer i datormodeller, som kan beräkna hur en kärnexplosion kommer att gå ut och förändras över tiden.

I huvudsak försöker du kartlägga en kedjereaktion. Så för att göra modellerna korrekta har de utformats för att förutsäga en kärnkraftsdetonation på molekylära nivåer med hjälp av verklig fysik. Utmaningen är att beräkna vad alla dessa partiklar kommer att kräva kräver mycket siffra.

Gå in i Sierra. Superdatorn har 190 000 CPU-processorkärnor och 17 000 GPU-kärnor. All den datorkraften innebär att den kan ta en enorm uppgift, som att simulera kärnklyvning, och bryta ner den i mindre bitar. Varje kärna kan sedan bearbeta en liten bit av simuleringen och kommunicera resultaten till resten av maskinen. Processen kommer att upprepas om och om igen när superdatorn försöker modellera en kärnexplosion från en sekund till en annan.

“Du kan göra en fullständig simulering av en kärnenhet i datorn”, tillade Bertsch. “Du kan ta reda på att det fungerar, exakt hur bra det fungerar och vilken typ av effekter som skulle hända.”

En forskningsmaskin

Superdator inuti

En superdatorns förmåga att beräkna och modellera partikelinteraktioner är därför det har blivit ett så viktigt verktyg för forskare. På sätt och vis händer reaktioner runt omkring oss. Detta kan inkludera vädret, hur en stjärna bildas eller när mänskliga celler kommer i kontakt med ett läkemedel.

En superdator kan simulera alla dessa interaktioner. Forskare kan sedan ta informationen för att lära sig användbara insikter, som om det regnar i morgon, om en ny vetenskaplig teori är giltig, eller om en kommande cancerbehandling ger något löfte.

Samma teknik kan också låta branscher utforska otaliga nya mönster och ta reda på vilka som är värda att testa i den verkliga världen. Det är därför laboratoriet har upplevt stor efterfrågan på sina två dussin superdatorer.

“Oavsett hur mycket datorkraft vi har haft, skulle folk använda den och be om mer”, sa Bertsch.

Det förklarar också varför den amerikanska regeringen vill ha en superdator i exaskala. Den extra datorkraften gör det möjligt för forskare att utveckla mer avancerade simuleringar, som att återskapa ännu mindre partikelinteraktioner, vilket kan bana väg för nya forskningsgenombrott. Exascale-systemen kommer också att kunna slutföra pågående forskningsprojekt på kortare tid. “Det du tidigare hade spenderat månader på kan bara ta timmar,” tillade Bertsch.

Gränssnitt med en superdator

.

Sierra är en del av ett klassificerat nätverk som inte är anslutet till det offentliga internet, vilket är tillgängligt för cirka 1000 godkända forskare i anslutna vetenskapliga program. Cirka 3000 personer forskar på oklassificerade superdatorer, som är tillgängliga online förutsatt att du har ett användarkonto och rätt inloggningsuppgifter. (Tyvärr, Bitcoin gruvarbetare.)

“Vi har folk som köper in datorn vid förvärvstidpunkten”, sa Bertsch. “Den summa pengar du lägger i korrelerar med procentandelen av maskinen du köpte.”

Ett schemaläggningssystem används för att säkerställa din “rättvisa andel” med maskinen. “Det försöker styra din användning mot den procentsats du har tilldelats”, tillade Bertsch. “Om du använde mindre än din rättvisa andel över tiden går din prioritet upp och du kommer att springa tidigare.”

Simuleringar är alltid igång. En superdator kan köra tusentals jobb när som helst. En maskin kan också bearbeta det som kallas en “hero run” eller ett enda jobb som är så stort att hela superdatorn krävs för att slutföra den på en rimlig tid.

Att hålla det igång

Tarmar av en Sequoia superdator

Sierra är en superdator, men maskinen har till stor del tillverkats med råvarudelar. Processorerna är till exempel företagsklasser från IBM och Nvidia och själva systemet kör Red Hat Enterprise Linux, ett populärt operativsystem bland serverleverantörer.

“Tillbaka på dagen var superdatorer dessa monolitiska stora, esoteriska hårdvaruklumpar”, säger Robin Goldstone, laboratoriets högpresterande datalösningsarkitekt. “Dessa dagar är till och med världens största system i huvudsak bara en massa servrar anslutna.”

För att maximera användningen måste ett system som Sierra kunna bedriva olika typer av forskning. Så labbet satte sig för att skapa en universalmaskin. Men även en superdator är inte perfekt. Laboratoriet uppskattar att Sierra var 12: e timme kommer att drabbas av ett fel som kan innebära maskinvarufel. Det låter kanske förvånande, men tänk på det som att äga 100 000 datorer; fel och reparationer är oundvikliga.

“De vanligaste sakerna som misslyckas är förmodligen minnes-DIMM-moduler, strömförsörjning, fläktar”, sa Goldstone. Lyckligtvis är Sierra så enorm att den har mycket kapacitet. Superdatorn skapar också rutinmässigt säkerhetskopior om ett fel stör ett projekt.

“Till viss del är detta inte precis som en dator du har hemma, utan en smak av det”, tillade Goldstone. “Ta spelarna som är besatta av att få det snabbaste minnet och den snabbaste GPU, och det är samma sak som vi är besatta av. Utmaningen för oss är att vi har så många som kör samtidigt.”

Vattenlednings superdator

Själva Sierra sitter i ett rum på 47 000 kvadratmeter, som är fyllt med buller från fans som håller hårdvaran sval. En nivå under maskinen är byggnadens vattenpumpsystem. Varje minut kan den skicka tusentals liter till rör, som sedan matas in i superdatorns rack och cirkulerar vatten ut igen.

På kraftfronten har laboratoriet utrustats för att leverera 45 megawatt – eller tillräckligt med el för en liten stad. Cirka 11 av dessa megawatt har delegerats till Sierra. En superdatorns energiförbrukning kan emellertid ibland utlösa klagomål från lokala energibolag. När en applikation kraschar kan maskinens energibehov plötsligt sjunka flera megawatt.

Energileverantören “gillar inte det alls. Eftersom de måste tappa belastning. De betalar för kraft”, sa Goldstone. “De har ringt oss i telefon och sagt ‘Kan du inte göra det längre?'”

The Exascale Future

Sequoia superdator

Lawrence Livermore National Lab är också hem för en annan superdator som heter Sequoia, som kort regerade som världens bästa system redan 2012. Men laboratoriet planerar att gå i pension senare i år för att ge plats för en större och bättre superdator, kallad El Capitan, vilket är bland de excale superdatorer som den amerikanska regeringen har planerat.

Förvänta dig att det går online 2023. Men det kommer inte att vara ensamt. El Capitan kommer att gå med i två andra exascale-system, som USA spenderar över 1 miljard dollar för att bygga. Båda kommer att slutföras 2021 vid separata laboratorier i Illinois och Tennessee.

“Vid något tillfälle tänker jag,” Är det inte tillräckligt snabbt? Hur mycket snabbare behöver vi verkligen att dessa datorer ska vara? “, Sa Goldstone. “Men det handlar mer om att kunna lösa problem snabbare eller studera problem med högre upplösning, så att vi verkligen kan se något på molekylära nivåer.”

Men superdatorindustrin kommer så småningom att behöva innovera. Det är helt enkelt ohållbart att fortsätta bygga större maskiner som äter mer kraft och tar mer fysiskt utrymme. “Vi driver gränserna för vad dagens teknik kan göra”, sa hon. “Det kommer att behöva ske framsteg inom andra områden än traditionella kiselbaserade datorchips för att ta oss till nästa nivå.”

Under tiden har laboratoriet arbetat med leverantörer som IBM och Nvidia för att lösa omedelbara flaskhalsar, inklusive att förbättra en superdatorns nätverksarkitektur så att den snabbt kan kommunicera över de olika klusterna, samt komponentens tillförlitlighet. “Processors hastighet spelar ingen roll längre”, tillade hon. “Så snabbt som processorerna är begränsade av minnesbandbredd.”

Labbet kommer att meddela mer information om El Capitan i framtiden. När det gäller den dator som den ersätter, Sequoia, är systemet på väg mot glömska.

Av säkerhetsskäl planerar laboratoriet att slipa upp varje del av maskinen och återvinna dess rester. Superdatorer kan sluta köra sekretessbelagda statliga data, så det är viktigt att alla spår av den informationen rensas helt – även om det innebär att göra maskinen till skrot. Det kan låta extremt, men fel kan göras när du försöker radera data virtuellt, så labbet måste vara helt säker på att data är borta permanent.

Relaterade Artiklar

Back to top button