Blackwell: Architektura a novinky GeForce RTX 5000 [Rozbor]

Nové technologie čipů Blackwell

Grafické karty nové generace od Nvidie – GeForce RTX 5090 a RTX 5080 – sice vyjdou až třicátého, ale už je po embargu a prvních recenzích nejvyššího modelu RTX 5090, který jsme testovali i my. V tomto článku se podíváme na architekturu Blackwell, která tyto nové grafiky pohání, a její nové vlastnosti a funkce. Od DLSS 4 přes architekturu výpočetních jednotek a výbavu čipu až po softwarovou stránku této nové generace.

PCI Express 5.0

Blackwell přináší podporu nové generace PCI Expressu – respektive, novější. PCIe 5.0 byl očekáván už od minulé generace Ada Lovelace v roce 2022, toto rozhraní totiž již poskytují desky platformy LGA 1700 (o nové LGA 1851 nemluvě) a procesory Intel Alder Lake od roku 2021. U AMD pak rozhraní umí Ryzeny 7000 (a 9000) na platformě AM5 od roku 2022. Specifikace byla hotová v roce 2019 a od roku 2021 už je venku specifikace následujícího PCI Expressu 6.0 s dvojnásobnou rychlostí, letos má být dokonce hotová technologie PCIe 7.0. Lze tedy říci, že herní GPU (všech značek, nejen Nvidia) mají v tomto případě velké zpoždění. Jak GB203, tak i toto GB205 podporují PCI Express 5.0 stejně jako highendové GB202.

PCI Express 5.0 každopádně přináší dvojnásobnou propustnost rozhraní mezi procesorem a systémem počítače a grafickou kartou. S PCIe 5.0 ×16 je to až 64 GB/s (v obou směrech, PCIe je duplexní). Alternativně to lze využít tím, že když GPU dostane jen osm linek (×8) třeba u desek, které část linek ze slotu pro grafiku odklánějí do slotů M.2 pro SSD, tak pořád bude mít stejnou propustnost, jakou dávalo plnotučné rozhraní PCIe 4.0 ×16. Efekt propustnosti mezi GPU a zbytkem CPU může být o něco vyšší u výpočetních aplikací, každopádně ale rychlejší PCI Express zvedá strop jednoho z potenciálních „úzkých hrdel“ výkonu, byť se na něj nemusí narážet moc často.

Web techPowerUp otestoval škálování výkonu s různými generacemi PCI Expressu na GeForce RTX 5090 a vyšlo mu, že tato grafika z PCIe 5.0 ×16 již trošku profituje, jinými slovy při použití jen PCIe 4.0 ×16 (nebo PCIe 5.0 ×8) je o něco nižší výkon – byť ne nijak významně. Rozdíl je v průměru jen asi 1 %, ale u některých her jsou vidět výjimky (větší propady například ve hře No Rest For The Wicked). Až starší PCI Express 3.0 ×16 (nebo ekvivalentní PCIe 4.0 ×8) má větší postih s asi 4% průměrnou ztrátou výkonu. Poklesy jsou obvykle drsnější v rozlišeních 2560 × 1440 a 3840 × 2160 a nižší v 1920 × 1080. Ale mezi testovanými hrami některé fungovaly i obráceně s drsnějšími propady při hraní na 1920 × 1080. Je možné, že tato nekonzistence ale někde byla způsobená problémy či chybami ovladačů.

DisplayPort 2.1b

Blackwell také splácí další dluh, respektive přináší věc, která se čekala už od předchozí generace, ale podporována nebyla, a sice konečně podporu DisplayPortu 2.0/2.1 pro připojení monitorů s vyšším rozlišením a obnovovací frekvencí. Či alternativně s nižší úrovní ztrátové komprese, která je dnes u monitorů používána. V tomto případě šlo na rozdíl od PCIe 5.0 o větší dluh, protože DisplayPort 2.1 už byl podporován některými grafikami předchozí generace – Radeony RX 7000 a kartami Intel Arc generace Alchemist (novější generací Battlemage také).

Grafiky GeForce RTX 5000 už umí DisplayPort 2.1b s podporou delších aktivních kabelů. Výstup je podporován i v nejrychlejším (co do přenosové kapacity) režimu UHBR20 s propustností 77,37 Gb/s (prakticky trojnásobnou proti datové propustnosti rozhraní DisplayPort 1.4a, které bylo maximem u GPU generace Ada Lovelace/RTX 4000).

Nvidia Blackwell – obrazový výstup a video

GPU Blackwell díky DP 2.1 už – jako Radeony RX 7000 – podporují rozlišení 8K až při 165 Hz (doteď bylo maximum karet GeForce 60 Hz) nebo 4K při až 480 Hz. Dokumenty Nvidie zmiňují, že UHBR20 bude vyžadovat aktivní kabely (DP80LL zavedené v DP 2.1b), zatímco konkurenční karty by měly UHBR20 umět i na pasivních kabelech do délky 1–1,2 metru (UHBR20 umí Radeony Pro s architekturou RDNA 3, ne však herní karty, které podporují UHBR13.5). Zda GeForce RTX 5000 toto nezvládají, je něco, co bude ještě třeba vyjasnit. Alespoň UHBR13.5 by ale mělo fungovat i s běžným levným kabelem.

Nadcházející HDMI 2.2 architektura Blackwell nepřináší, ale to se ani čekat nedalo, specifikace ještě ani není hotová.

Multimediální akcelerace: Inkrementální zlepšení

GPU by na druhou stranu měla mít o generaci novější multimediální enginy (9. generace NVEnc, 6. generace NVDec). Dekodéry jsou v počtu jednoho (RTX 5070 Ti, RTX 5070) nebo dvou, enkodérů je na čipu až trojice (u RTX 5090), ale méně u nižších modelů (RTX 5070 má jen jeden). Nevíme ale, zda jsou toto skutečné maximální parametry čipů. U herních karet mohou některé jednotky být uměle vypnuté, bylo to tak i v předchozí generaci.

Ty multimediální enginy jsou také nové generace, ale vypadá to, že neumí nové formáty (chybí akcelerace formátu VVC, kterou má zatím jen procesor Intel Lunar Lake / Core 200V). Má však být vylepšená kvalita komprese do AV1 a přibylo další kvalitnější nastavení komprese „Ultra Quality“. Nvidia uvádí zlepšení komprese (respektive metriky BD-Rate PSNR a BD.BR VMAF) o 4–18 %.

Enkódování AV1 na GPU Blackwell

Nvidia také přidala podporu 4:2:2 subsamplingu chrominance v YUV barvách pro některé formáty (HEVC a H.264). Toto kódování používají některé profesionální výstupy z kamer.

Data o teplotě hotspotů nebudou přístupná

Věc, která možná bude trápit overclockery, je odstranění informace o teplotě tzv. hot spotu (takže ji nebudete vidět třeba v programu HWiNFO). To nebyl nějaký konkrétní senzor, ale informace o tom, jaká nejvyšší teplota je na GPU v kterémkoli ze senzorů dosažena. V čipu by mělo být senzorů teploty větší množství, takže tento údaj dává lepší informaci navíc k průměrné teplotě, identifikující potenciální lokální přehřívání čipu.

Potenciální využití této informace by mohlo být například, když je špatně nasazený chladič nebo nanesená pasta – velká diskrepance mezi průměrnou teplotou (která může pořád vypadat nevinně) a teplotou hotspotu doteď mohla být použitá jako určité varovné znamení. Není známo z jakého přesně důvodu není u GPU Blackwell informace o hotspotové teplotě zpřístupněna uživateli. Podle Nvidie tato čísla nikdy nebyla příliš užitečná, ale asi to bude budit podezření, že údaj mohl působit nelichotivě – zejména třeba u nejvyššího modelu RTX 5090 s jeho 575W TDP.

Článek pokračuje na další straně.


  •  
  •  
  •  
Flattr this!

Lepší a schopnější, než se čekalo: Rozbor GPU architektury RDNA 4

Informace, které prosakovaly neoficiálně ven, původně od RDNA 4 moc neslibovaly, mluvily o tom, že architektura jenom opravuje nespecifikované chyby v RDNA 3 – s výjimkou nových jednotek pro ray tracing. Ale to byl omyl, protože RDNA 4 velký upgrade je a „sahá“ na většinu subsystémů GPU, zdaleka ne jen na ray tacingové jednotky. Přináší také posílenou akceleraci umělé inteligence i přepracované výpočetní jednotky (shadery). Celý článok „Lepší a schopnější, než se čekalo: Rozbor GPU architektury RDNA 4“ »

  •  
  •  
  •  

Intel zrušil x86S, snahu o vyčištění legacy zátěže procesorů x86

Na podzim jsme tu měli zprávu, že do procesorové architektury Panther Cove, kterou Intel vydá za dva roky (ne však v procesorech Panther Lake, takže pozor na záměnu), se zřejmě poprvé dostane vylepšení instrukční sady x86 označené APX a také „reformované“ SIMD instrukce AVX10, které jsou kompromis mezi AVX-512 a AVX2 určený pro hybridní procesory. Nepřijde ale architektura x86S, třetí z těchto očekávaných inovací. Byla totiž zrušena. Celý článok „Intel zrušil x86S, snahu o vyčištění legacy zátěže procesorů x86“ »

  •  
  •  
  •  

AMD aktualizací vypnulo část jádra Zen 4. Výkon by ale měl zůstat

Procesory AMD s architekturou Zen 5 po vydání dostávaly různé aktualizace vylepšující Windows (zejména ale šlo o aktualizaci Windows, která přímo v procesoru a firmwaru desek nic neměnila). Vypadá to, že u procesorů s předchozí architekturou Zen 4 místo toho došlo k drobné změně negativní, kdy jedna z aktualizací odebrala dříve aktivní funkci v jádrech. Z jakého důvodu, ví jenom AMD. Ale zdá se, že dopad by neměl být nijak významný. Celý článok „AMD aktualizací vypnulo část jádra Zen 4. Výkon by ale měl zůstat“ »

  •  
  •  
  •  

Pridaj komentár

Vaša e-mailová adresa nebude zverejnená. Vyžadované polia sú označené *