DGX Spark
Na CES 2025 v lednu odhalila Nvidia plán vydat minipočítač, který by měl dost výkonu pro různé lokálně běžící AI aplikace. Zařízení pojmenované tehdy Project Digits mělo mít v sobě GPU od Nvidie a ARM procesor, firma ale nesdělila moc podrobností mimo marketingových řečí o „AI superpočítači“. Teď na GTC 2025 dostal počítač oficiální jméno a konečně je toho o něm známo víc. Včetně mimochodem docela vysoké ceny.
Počítač v lednu označovaný jako Project Digits se nakonec jmenuje DGX Spark. Podle Nvidie je nejmenším „AI superpočítačem“ na světě, ale to je samozřejmě čistý marketingový nesmysl. Zařízení o hmotnosti 1,2 kg a rozměrech 15,0 × 15,0 × 5,05 cm sice nebude mít špatný výkon, ale ten bude prostě odpovídat jeho třídě a spotřebě, reálné superpočítače jsou někde úplně jinde.
Možná je spíš otázka, co ze své produkce Nvidia superpočítačem někdy nenazývala. V roce 2015 například takto vynášela do nebes čip Tegra X1, který o něco později začal pohánět Nintendo Switch a klišé o „výkonnostních orgiích“ byste s tímto handheldem v jedné větě asi nepoužili.
Deset jader Cortex-X925
DGX Spark má procesor, který Nvidia označuje jako „GB10 Superchip“ (Superchip je další oblíbený slogan Nvidie a také byste ho mimochodem našli v tiskových zprávách ohlašujících Tegru X1). Nvidia uvádí, že má 20 jader architektury ARM a na jednom místě říká, že jde o architekturu „Grace Blackwell“. Ale od serverového procesoru Grace se GB10 silně liší (a podle dosavadních informací by ho s Nvidii měl vyvíjet MediaTek).
Zatímco serverový Grace má 72 nebo u dvojčipové konfigurace 144 serverových jader ARM Neoverse V2, která už jsou starší a jsou odvozená od Cortexu-X3, GB10 je big.LITTLE procesor s pouze klientskými jádry, ale novějšími a výkonnějšími. Má deset loňských jader Cortex-X925 a k nim deset malých či prostředních jader Cortex-X725. Velká jádra Cortex-X925 byla vyvinutá s cílem dohnat architektury Applu v procesorech M1, M2 a M3 a s deseti kusy je tedy Nvidia GB10 poměrně silné CPU. Pokud tedy nemají nějakou nečekaně nízkou frekvenci – takty se Nvidia zveřejnit neobtěžovala (a dokonce ani výrobní proces).

Výkon GeForce RTX 5070, ale se 128GB pamětí
Firma bohužel také mlčí i o GPU části procesoru, o které bylo řečeno jen to, že používá architekturu Blackwell a podporuje AI výpočty s přesností FP4. V těch má GPU teoretický AI výkon 500 TOPS – nebo 1000 TOPS s využitím funkce sparsity. A pochopitelně jen v maticových operacích na tensor jádrech.
To je výkon rovnající se GeForce RTX 5070, pro kterou tu Nvidia uvádí 988 TOPS včetně sparsity a která je jednou z nižších herních grafických karet firmy (což je důvod oné jízlivosti nad přirovnáváními k superpočítačům v předchozích odstavcích). Nvidia nesděluje, kolik má GPU v GB10 bloků SM a shaderů (a tensor jader), také nevíme, zda obsahuje RT jádra pro herní grafiku. GPU nejspíš má o něco víc výpočetních jednotek než GB205 v GeForce RTX 5070, ale na nižším taktu.

Co Nvidia uvádí, jsou specifikace pamětí. Procesor GB10 má paměti LPDDR5X-8533 na 256bitové sběrnici s kapacitou 128 GB. Jde tedy o konfiguraci prakticky stejnou jako u Ryzenu AI Max+ 395 („Strix Halo“) od AMD, ale frekvence je o několik procent vyšší. Paměti takto poskytují propustnost 273 GB/s, což je o dost méně než v případě GeForce RTX 5070 (její GDDR7 na 192bitové sběrnici dává 672 GB/s), přičemž propustnost sdílí GPU i CPU.
To, co zařízení nabízí, tedy nebude úplně výkon, ale ta 128GB kapacita unifikované paměti. Dovolí pracovat s velmi velkými modely, přičemž kapacita paměti je dnes asi největším limitujícím faktorem pro inferenci s pokročilými AI, nikoliv tolik samotný výpočetní výkon.
GPU a CPU jsou na dvou kusech křemíku
Zvláštní je, že ač procesor, zdá se, používá sdílenou paměť mezi GPU a CPU, jsou obě části údajně propojené rozhraním „NVLink-C2C“ (Nvidia říká, že s 5× vyšší propustností, než má PCIe 5.0), snad odvozeného od NVLinku určeného pro externí propojení GPU. Podle všeho je totiž GB10 tvořený dvěma čiplety. Toto je asi proto, že jde o kolaboraci MediaTeku a Nvidie, která ale zřejmě nejde tak daleko, že by Nvidia poskytla IP k začlenění do jednoho monolitického SoC.
Uvidíme, zda to nebude dělat problémy ve výkonu. Bude docela zajímavé vidět, jak je paměť řešena. Pravděpodobné je, že všechny čipy LPDDR5X jsou napojené na paměťový řadič GPU části, což by ale znamenalo, že jádra CPU (která jsou senzitivní na latenci) přistupují do RAM vždy přes NVLink. U procesorů AMD to s jejich Infinity Fabric poměrně funguje, uvidíme tedy, jak to půjde Nvidii, respektive MediaTeku.
170W spotřeba
Zařízení má mít spotřebu 170 W, což je pravděpodobně maximální nebo typická spotřeba při plné zátěži, ale pravděpodobně pro celé zařízení, TDP procesoru asi bude o něco nižší. Chlazení tedy asi bude mít co dělat a při rozměrech šasi 15 × 15 × 5 cm asi nebude nejtišší. Zdroj by měl být externí, připojený přes konektor USB-C.

Ve výbavě počítače je vedle SoC a paměti ještě 10Gb/s Ethernet, Wi-Fi 7 a Bluetooth 5.3 a samozřejmě SSD – to se instaluje do slotu M.2 a může mít kapacitu 1 až 4 TB. Podle specifikací má zařízení jeden 10Gb/s Ethernet přes port RJ-45, ale na obrázcích jsou vidět dva porty pro optické transceivery SFP (ze separátního Infiniband adaptéru Nvidia / Mellanox ConnectX-7), takže ve skutečnosti je asi možné použít víc rozhraní.
Počítač lze asi používat jednak jako edge zařízení nebo (bezhlavý) mini server, ale i jako malou pracovní stanici s monitorem – pro tyto účely má jediný obrazový výstup HDMI 2.1a. Zařízení má čtyři 40Gb/s porty USB4, ale není u nich řečeno, zda podporují obrazový výstup. Jako operační systém je používán Linux, ovšem ve formě vlastní distribuce od Nvidie nazvané DGX OS (mělo by jít o upravené Ubuntu s přidaným softwarem Nvidie, ve verzi DGX OS 6 se základem Ubuntu 22.04 s jádrem 5.15).
DGX Spark bude vyrábět víc partnerů, cena od 3000 $
Zdá se, že Nvidia výrobu těchto počítačů bude pojímat podobně jako grafické karty. Bude existovat jednak verze zařízení přímo od Nvidie (ta se snad dokonce bude jmenovat Founders Edition, jako u herních grafik GeForce), vedle toho ale počítač budou nabízet možná s různými úpravami či pozměněnými specifikacemi také další partneři – Asus, Dell, HP a Lenovo.

Zatím není úplně jasné, zda budou používat referenční základní desku dodávanou Nvidií, nebo zda jim Nvidia/MediaTek bude dodávat čip GB10. Web ServeTheHome má fotky zařízení Asus Ascent GX10, které je jednou z verzí počítače DGX Spark, a rozložení portů vypadá stejně jako na základní desce přímo od Nvidie – její fotky jsou k vidění zde, což by nasvědčovalo první možnosti, ale asi není vyloučena ani druhá.
Počítače už si lze rezervovat, dostupnost zatím ale není přesně stanovena. Měla by být „později v tomto roce“.
Referenční verze od Nvidie má stát 3999 $ včetně 4TB SSD (s DPH u nás 111,5 tisíce Kč nebo 4530 €), ale ona verze od Asusu (Ascent GX10) má být za méně, jen 2999 $. Ovšem je v ní jen 1TB SSD. Je třeba pamatovat, že ani zařízení se zmiňovaným konkurenčním Ryzenem AI Max nemají být úplně levná, Framework Desktop desktop má například být za 2000 $.
Zdroje: Nvidia (1, 2), ServeTheHome (1, 2)
Jan Olšan, redaktor Cnews.cz
⠀
- Contents
- DGX Spark