NVIDIA GB200 NVL72

Die neue Ära des Computing mit dem NVIDIA GB200 Grace Blackwell Superchip: 72 Blackwell-GPUs, 30x schnellere Echtzeit-Inferenz für Billionen-Parameter-LLMs.

72

Blackwell GPUs

13.4 TB

Schneller Speicher

130 TB/s

NVLink-Bandbreite

1,440

PFLOPS FP4

Angebot anfordern Technische Daten

Gehostet in der EU DSGVO-konform

Made in Germany Erstklassige Infrastruktur

Datensouveränität Volle Transparenz

Echtzeit-Modelle mit Billionen Parametern

Der GB200 NVL72 verbindet 36 Grace-CPUs und 72 Blackwell-GPUs in einem rack-skaligen, flüssigkeitsgekühlten Design. Eine 72-GPU-NVLink-Domain wirkt wie eine einzelne, gewaltige GPU und liefert 15x schnellere Inferenz und 3x schnelleres Training im Vergleich zu DGX-H100-Systemen.

Konfiguration

72 NVIDIA Blackwell GPUs, 36 NVIDIA Grace CPUs, 2.592 Arm Neoverse V2 Kerne

Speicher & Bandbreite

192 GB HBM3e pro B200, 8 TB/s pro GPU, 130 TB/s NVLink, 576 TB/s System gesamt

Tensor-Core-Leistung

1.440 PFLOPS FP4, 720 PFLOPS FP8/FP6, 360 PFLOPS FP16/BF16, 180 PFLOPS TF32

Netzwerk

NVLink der fünften Generation, 130 TB/s Bandbreite, nahtlose GPU-zu-GPU-Kommunikation

KI-Leistung

15x schnellere Inferenz vs. DGX H100, 3x schnelleres Training, 2,5x Leistung pro B200 vs. H200

Systemarchitektur

Flüssigkeitsgekühltes Rack-Design, eine 72-GPU-Domain, Exascale-Computing

Ein Exascale-Rechner in einem einzigen Rack – die neue Ära des Computing.

Angebot anfordern

Technologische Durchbrüche

Revolutionaere Innovationen, die die Grenzen der KI-Computing-Leistung neu definieren – für die anspruchsvollsten KI-Workloads.

Echtzeit-LLM-Inferenz

GB200 NVL72 bringt Spitzenfaehigkeiten und eine Transformer Engine der zweiten Generation für FP4-KI. Zusammen mit NVIDIA NVLink der fünften Generation liefert sie 30x schnellere Echtzeit-Inferenz für Sprachmodelle mit Billionen Parametern.

Training im großen Maßstab

GB200 NVL72 nutzt eine schnellere Transformer Engine der zweiten Generation mit FP8-Praezision – bis zu 4x schnelleres Training grosser Sprachmodelle. Ergänzt durch NVLink der fünften Generation.

NVIDIA NVLink der fünften Generation

Exascale-Computing und Billionen-Parameter-Modelle brauchen schnelle, nahtlose Kommunikation zwischen allen GPUs im Cluster. NVLink Gen. 5 ist ein Scale-up-Interconnect für maximale Beschleunigung.

Energieeffiziente Infrastruktur

Flüssigkeitsgekühlte GB200-NVL72-Racks senken CO2-Fussabdruck und Energieverbrauch. Flüssigkühlung erhöht Rechendichte, spart Fläche und ermöglicht Hochbandbreiten-GPU-Kommunikation mit niedriger Latenz.

NVIDIA Grace CPU

Die NVIDIA Grace CPU ist für moderne Rechenzentren mit KI, Cloud und HPC konzipiert – hohe Leistung und Speicherbandbreite bei doppelter Energieeffizienz gegenueber fuehrenden Server-Prozessoren.

Datenverarbeitung

Datenbanken sind zentral für Verarbeitung und Analyse grosser Datenmengen. GB200 nutzt Hochbandbreiten-Speicher, NVLink-C2C und Entpack-Engines und beschleunigt zentrale Datenbankabfragen um das 18-Fache gegenueber CPU.

Starten wir Ihr KI-Projekt!

Gemeinsam besprechen wir Ihre genauen Anforderungen in einem persönlichen Gespräch. Zusammen finden wir die passende Lösung für Ihr Projekt.

Termin vereinbaren Kontakt

Nils Herhaus

Business Development

@Polarise