Die neue Ära des Computing mit dem NVIDIA GB200 Grace Blackwell Superchip: 72 Blackwell-GPUs, 30x schnellere Echtzeit-Inferenz für Billionen-Parameter-LLMs.





Der GB200 NVL72 verbindet 36 Grace-CPUs und 72 Blackwell-GPUs in einem rack-skaligen, flüssigkeitsgekühlten Design. Eine 72-GPU-NVLink-Domain wirkt wie eine einzelne, gewaltige GPU und liefert 15x schnellere Inferenz und 3x schnelleres Training im Vergleich zu DGX-H100-Systemen.
72 NVIDIA Blackwell GPUs, 36 NVIDIA Grace CPUs, 2.592 Arm Neoverse V2 Kerne
192 GB HBM3e pro B200, 8 TB/s pro GPU, 130 TB/s NVLink, 576 TB/s System gesamt
1.440 PFLOPS FP4, 720 PFLOPS FP8/FP6, 360 PFLOPS FP16/BF16, 180 PFLOPS TF32
NVLink der fünften Generation, 130 TB/s Bandbreite, nahtlose GPU-zu-GPU-Kommunikation
15x schnellere Inferenz vs. DGX H100, 3x schnelleres Training, 2,5x Leistung pro B200 vs. H200
Flüssigkeitsgekühltes Rack-Design, eine 72-GPU-Domain, Exascale-Computing
Revolutionaere Innovationen, die die Grenzen der KI-Computing-Leistung neu definieren – für die anspruchsvollsten KI-Workloads.
GB200 NVL72 bringt Spitzenfaehigkeiten und eine Transformer Engine der zweiten Generation für FP4-KI. Zusammen mit NVIDIA NVLink der fünften Generation liefert sie 30x schnellere Echtzeit-Inferenz für Sprachmodelle mit Billionen Parametern.
GB200 NVL72 nutzt eine schnellere Transformer Engine der zweiten Generation mit FP8-Praezision – bis zu 4x schnelleres Training grosser Sprachmodelle. Ergänzt durch NVLink der fünften Generation.
Exascale-Computing und Billionen-Parameter-Modelle brauchen schnelle, nahtlose Kommunikation zwischen allen GPUs im Cluster. NVLink Gen. 5 ist ein Scale-up-Interconnect für maximale Beschleunigung.
Flüssigkeitsgekühlte GB200-NVL72-Racks senken CO2-Fussabdruck und Energieverbrauch. Flüssigkühlung erhöht Rechendichte, spart Fläche und ermöglicht Hochbandbreiten-GPU-Kommunikation mit niedriger Latenz.
Die NVIDIA Grace CPU ist für moderne Rechenzentren mit KI, Cloud und HPC konzipiert – hohe Leistung und Speicherbandbreite bei doppelter Energieeffizienz gegenueber fuehrenden Server-Prozessoren.
Datenbanken sind zentral für Verarbeitung und Analyse grosser Datenmengen. GB200 nutzt Hochbandbreiten-Speicher, NVLink-C2C und Entpack-Engines und beschleunigt zentrale Datenbankabfragen um das 18-Fache gegenueber CPU.
Polarise hat den Status als NVIDIA Preferred Partner erreicht und ist als offizieller NVIDIA Cloud Service Provider (CSP) gelistet. Diese Auszeichnung ist ausgewählten Partnern vorbehalten, die grosse Cluster in enger Abstimmung mit NVIDIA auf Basis einer getesteten Referenzarchitektur betreiben.
Gemeinsam besprechen wir Ihre genauen Anforderungen in einem persönlichen Gespräch. Zusammen finden wir die passende Lösung für Ihr Projekt.