Co vlastně dělá ze superpočítače „obra“
Superpočítač není jeden počítač v klasickém smyslu. Jde o celý datacentrový systém, který se skládá z tisíců až desetitisíců výpočetních uzlů, pamětí, síťových prvků, úložišť a podpůrné infrastruktury. Když se mluví o velikosti superpočítačů, nejde jen o fyzické rozměry racků, ale také o prostor pro napájení, chlazení, kabeláž a záložní systémy.
Typický moderní superpočítač může zabírat desítky až stovky racků. Každý rack má obvykle výšku kolem 2 metrů a váží stovky kilogramů, někdy i více než tunu. Do jednoho systému se přitom nevejdou jen procesory a GPU, ale také síťová infrastruktura s extrémně nízkou latencí, bez které by výpočty nefungovaly efektivně.
Praktický příklad: systémy z nejvyšších pater žebříčku TOP500 dnes běžně dosahují výkonu v řádu exaflops, tedy miliard miliard operací za sekundu. Takový výkon už nelze postavit na jednom „super čipu“. Musí se rozdělit mezi obrovské množství specializovaných komponent, které spolu komunikují v reálném čase.
Proč nejde výkon jednoduše zmenšit do menšího boxu
Hlavní důvod je fyzika. Výpočetní výkon roste s počtem jader, GPU akcelerátorů a šířkou paměťových kanálů, ale zároveň roste i spotřeba, teplo a nároky na propojení. Když chcete zpracovávat počasí, modelovat jaderné reakce, simulovat molekuly nebo trénovat velké AI modely, potřebujete masivní paralelismus.
Každý výpočetní uzel produkuje teplo. Pokud byste výkon „nahustili“ do menšího prostoru, narazíte na limity chlazení, napájení i signálové integrity. Proto jsou superpočítače rozprostřené do větších sálů a často mají specificky navržené budovy, které počítají s:
- nosností podlahy pro velmi těžké racky,
- přívodem vysokého elektrického výkonu v megawattech,
- rozvody chladicí vody nebo přímého kapalinového chlazení,
- redundantním napájením a UPS systémy,
- optickými a vysokorychlostními sítěmi mezi uzly.
U moderních AI superpočítačů je navíc často rozhodující poměr výkonu na watt. To znamená, že se nevybírá jen nejrychlejší hardware, ale takový, který je schopný dodat co nejvíce výpočtů na jednotku energie. I tak jde o extrémně náročné systémy, protože škálování na tisíce akcelerátorů samo o sobě energii násobí.
Kam mizí elektřina: procesory, paměti i chlazení
Spotřeba superpočítače není jen o samotných čipech. Ve skutečnosti se energie rozděluje do několika vrstev. Nejvíce ji obvykle spolykají CPU a GPU akcelerátory, ale významnou část tvoří také paměti, síťové adaptéry, úložiště a hlavně chlazení.
U velkých systémů se používá pojem PUE (Power Usage Effectiveness), který říká, kolik energie datacentrum spotřebuje celkově vůči samotné IT zátěži. Ideál je 1,0, ale reálně se moderní datacentra pohybují zhruba kolem 1,1 až 1,3. To znamená, že když IT část spotřebuje 10 MW, celý objekt může potřebovat 11 až 13 MW.
U superpočítačů to v praxi znamená, že významnou část nákladů netvoří jen výpočty, ale i udržení stabilní teploty. Pokud systém běží na plný výkon, téměř veškerá elektrická energie se nakonec promění v teplo. To je důvod, proč se už dnes používá:
- direct liquid cooling – kapalinové chlazení přímo na čipech,
- rear-door heat exchangers – výměníky na zadních dveřích racků,
- immerzní chlazení – ponoření komponent do dielektrické kapaliny,
- free cooling – využití chladného venkovního vzduchu nebo vody,
- rekuperace tepla – využití odpadního tepla pro vytápění budov.
Například některé evropské superpočítačové instalace už plánují nebo provozují systémy, kde odpadní teplo pomáhá vytápět univerzitní kampusy nebo okolní budovy. To sice nesnižuje samotnou spotřebu výpočtu, ale zlepšuje celkovou energetickou bilanci.
Kolik elektřiny superpočítač skutečně spotřebuje
Spotřeba se liší podle generace a zátěže, ale moderní špičkové systémy běžně běží v řádu několika megawattů až desítek megawattů. Pro představu: 1 MW nepřetržitého provozu odpovídá zhruba spotřebě menšího města nebo několika stovek domácností, podle místních podmínek a způsobu používání energie.
Historicky byly rekordní superpočítače spojovány i s příkony kolem 20–30 MW. To už je úroveň, která se blíží větším průmyslovým provozům. Pokud systém běží 24/7, spotřeba za rok může dosáhnout desítek až stovek GWh.
Jednoduchý výpočet: pokud superpočítač běží se spotřebou 15 MW po celý rok, dostanete:
- 15 MW × 24 hodin × 365 dní = 131 400 MWh,
- tedy přibližně 131 GWh ročně.
To je energie, která už není „IT náklad“, ale zásadní provozní položka. Proto se při návrhu superpočítače řeší nejen výkon, ale i cena elektřiny, dostupnost sítě, lokální klimatické podmínky a možnost přímého napojení na obnovitelné zdroje.
Jak se zvyšuje efektivita: od architektury po software
Největší úspory dnes nevznikají jen lepším chlazením, ale hlavně chytrým návrhem architektury a softwaru. Superpočítače jsou extrémně citlivé na to, jak dobře je aplikace paralelizovaná. Když software neumí efektivně využít všechny uzly, část energie se promrhá na nevyužitý výkon.
V praxi se proto používají tyto přístupy:
- GPU akcelerace pro úlohy, které lze masivně paralelizovat,
- optimalizované MPI komunikace mezi uzly,
- containerizace pro lepší správu prostředí a reprodukovatelnost,
- job schedulery jako Slurm pro efektivní plánování výpočtů,
- profiling pomocí nástrojů typu NVIDIA Nsight, Intel VTune nebo htop, ipmitool a systémy monitoringu infrastruktury.
Důležitý je i výběr úloh. Například AI trénink obvykle využije GPU velmi efektivně, zatímco některé vědecké simulace mohou být limitované komunikací mezi uzly. To znamená, že stejný hardware může mít v jednom scénáři výbornou efektivitu a v jiném relativně slabou.
Velcí provozovatelé dnes sledují metriky jako:
- FLOPS/W – kolik výpočetního výkonu získají z wattů,
- PUE – efektivitu datacentra jako celku,
- utilization rate – využití výpočetních kapacit,
- queue time – jak dlouho úlohy čekají ve frontě,
- thermal headroom – rezerva pro bezpečný provoz při špičkách.
Co si z toho odnést, pokud řešíte vlastní serverovnu nebo datacentrum
I když nemáte superpočítač, logika jeho návrhu je užitečná pro každého, kdo provozuje náročný web, AI infrastrukturu nebo větší firemní IT. Základní princip je jednoduchý: každý watt navíc musíte nejen dodat, ale i bezpečně odvést. Proto se vyplatí sledovat nejen výkon serverů, ale i jejich skutečnou energetickou efektivitu.
Pokud plánujete vyšší zátěž, zaměřte se na tyto kroky:
- měřte spotřebu na úrovni serveru i celé rackové větve,
- používejte monitoring přes Prometheus, Grafana nebo Zabbix,
- optimalizujte software, aby neplýtval CPU cykly a pamětí,
- volte hardware podle reálné zátěže, ne podle teoretického maxima,
- řešte chlazení dřív, než začnete škálovat výkon,
- počítejte s rezervou v napájení i síťové infrastruktuře.
Superpočítače jsou tak obrovské a energeticky náročné proto, že kombinují extrémní výkon, paralelní architekturu a neustálý odvod tepla do jednoho celku. Nejde o přepych, ale o nutnost: pokud chcete simulovat složité jevy, trénovat velké modely nebo zpracovat obrovská data v rozumném čase, musíte stavět systémy, které jsou fyzicky velké, technicky složité a provozně drahé. Právě v tom je jejich síla i cena.
