NVIDIA GB200 NVL72

Die neue Ära des Computing mit dem NVIDIA GB200 Grace Blackwell Superchip: 72 Blackwell-GPUs, 30x schnellere Echtzeit-Inferenz für Billionen-Parameter-LLMs.

72
Blackwell GPUs
13.4 TB
Schneller Speicher
130 TB/s
NVLink-Bandbreite
1,440
PFLOPS FP4
NVIDIA GB200 NVL72 Rack
Bitkom Member
German Data Center Association
Eco Verband
Nvidia Partner
EU flag
Gehostet in der EU DSGVO-konform
DE flag
Made in Germany Erstklassige Infrastruktur
Datensouveränität Volle Transparenz

Echtzeit-Modelle mit Billionen Parametern

Der GB200 NVL72 verbindet 36 Grace-CPUs und 72 Blackwell-GPUs in einem rack-skaligen, flüssigkeitsgekühlten Design. Eine 72-GPU-NVLink-Domain wirkt wie eine einzelne, gewaltige GPU und liefert 15x schnellere Inferenz und 3x schnelleres Training im Vergleich zu DGX-H100-Systemen.

Konfiguration

72 NVIDIA Blackwell GPUs, 36 NVIDIA Grace CPUs, 2.592 Arm Neoverse V2 Kerne

Speicher & Bandbreite

192 GB HBM3e pro B200, 8 TB/s pro GPU, 130 TB/s NVLink, 576 TB/s System gesamt

Tensor-Core-Leistung

1.440 PFLOPS FP4, 720 PFLOPS FP8/FP6, 360 PFLOPS FP16/BF16, 180 PFLOPS TF32

Netzwerk

NVLink der fünften Generation, 130 TB/s Bandbreite, nahtlose GPU-zu-GPU-Kommunikation

KI-Leistung

15x schnellere Inferenz vs. DGX H100, 3x schnelleres Training, 2,5x Leistung pro B200 vs. H200

Systemarchitektur

Flüssigkeitsgekühltes Rack-Design, eine 72-GPU-Domain, Exascale-Computing

Ein Exascale-Rechner in einem einzigen Rack – die neue Ära des Computing.

Angebot anfordern

Technologische Durchbrüche

Revolutionaere Innovationen, die die Grenzen der KI-Computing-Leistung neu definieren – für die anspruchsvollsten KI-Workloads.

Echtzeit-LLM-Inferenz

GB200 NVL72 bringt Spitzenfaehigkeiten und eine Transformer Engine der zweiten Generation für FP4-KI. Zusammen mit NVIDIA NVLink der fünften Generation liefert sie 30x schnellere Echtzeit-Inferenz für Sprachmodelle mit Billionen Parametern.

Training im großen Maßstab

GB200 NVL72 nutzt eine schnellere Transformer Engine der zweiten Generation mit FP8-Praezision – bis zu 4x schnelleres Training grosser Sprachmodelle. Ergänzt durch NVLink der fünften Generation.

NVIDIA NVLink der fünften Generation

Exascale-Computing und Billionen-Parameter-Modelle brauchen schnelle, nahtlose Kommunikation zwischen allen GPUs im Cluster. NVLink Gen. 5 ist ein Scale-up-Interconnect für maximale Beschleunigung.

Energieeffiziente Infrastruktur

Flüssigkeitsgekühlte GB200-NVL72-Racks senken CO2-Fussabdruck und Energieverbrauch. Flüssigkühlung erhöht Rechendichte, spart Fläche und ermöglicht Hochbandbreiten-GPU-Kommunikation mit niedriger Latenz.

NVIDIA Grace CPU

Die NVIDIA Grace CPU ist für moderne Rechenzentren mit KI, Cloud und HPC konzipiert – hohe Leistung und Speicherbandbreite bei doppelter Energieeffizienz gegenueber fuehrenden Server-Prozessoren.

Datenverarbeitung

Datenbanken sind zentral für Verarbeitung und Analyse grosser Datenmengen. GB200 nutzt Hochbandbreiten-Speicher, NVLink-C2C und Entpack-Engines und beschleunigt zentrale Datenbankabfragen um das 18-Fache gegenueber CPU.

NVIDIA Cloud Partner

NVIDIA Preferred Partner

Polarise hat den Status als NVIDIA Preferred Partner erreicht und ist als offizieller NVIDIA Cloud Service Provider (CSP) gelistet. Diese Auszeichnung ist ausgewählten Partnern vorbehalten, die grosse Cluster in enger Abstimmung mit NVIDIA auf Basis einer getesteten Referenzarchitektur betreiben.

Starten wir Ihr KI-Projekt!

Gemeinsam besprechen wir Ihre genauen Anforderungen in einem persönlichen Gespräch. Zusammen finden wir die passende Lösung für Ihr Projekt.

Nils Herhaus - Business Development

Nils Herhaus

Business Development

@Polarise