NVIDIA H200 GPU TEE

H200-Slots für private Modelle.

H200-Kapazität mit hohem Speicher für größeres LLM-Serving, Tuning und geschützte Batch-Jobs.

H200 TEE capacity with 141GB HBM3e memory, confidential GPU mode, CVM runtime, and TEE operations.

Kapazitätszelle

Slot bereit
NVIDIA H200 chipNVIDIA H200 chipNVIDIA H200 chip

hardware proof rail

Diese GPU läuft durch denselben verifizierbaren GPU-Nachweispfad.

GPU TEE

H200

GPU TEE

141 GB HBM3e

GPU TEE

TEE proof

Speicher

141 GB HBM3e

Bandbreite

4,8 TB/s

Region

US-West / Indien

Skalieren

1–8 GPUs

Details zum GPU-Käufer

Mehr als nur ein GPU-Angebot.

GPU-Anbieter bleiben meist bei Preis und Verfügbarkeit stehen. Diese Seite macht die zusätzlichen TEE-Anforderungen sichtbar: Laufzeitgrenze, vertraulicher GPU-Modus, Attestierung und Betrieb.

Beste Wahl

GPU-Workload-Form

01Serving für große LLMs
02Fine-Tuning-Fenster
03Batch-Jobs mit hohem Speicherbedarf

Zugriff

1–8 GPU-Slots

Verpflichtung

Reservierte H200-Kapazität

Unternehmen

Multi-Node private Modell-Cluster

Checkliste für TEE-Readiness

01

Kapazität

GPU-Speicher, Bandbreite, Region und Skalierung sind vor dem Verkaufsgespräch sichtbar.

02

Cloud-Pfad

Ausführung über Confidential VMs, Bare-Metal-Pfade oder Enterprise-Deployments.

03

TEE-Bereitschaft

Intel TDX, NVIDIA Confidential Computing, Treiber, BIOS und Verifier-Bereitschaft werden von Phala übernommen.

04

Kaufentscheidung

Beginnen Sie mit einem 24-Stunden-Test, reservieren Sie einen Slot oder holen Sie ein Angebot für einen dedizierten Cluster ein.

Technisches GPU-Profil

Verwenden Sie H200, wenn Speicher der Engpass ist.

H200 eignet sich besser für das Serving größerer LLMs, Inferenz mit langem Kontext, geschützte Batch-Jobs und Tuning-Läufe, die mehr Modell- oder KV-Cache-Speicher benötigen, ohne sofort auf einen Blackwell-Cluster zu wechseln.

Speicher

141 GB HBM3e schaffen mehr Raum für größere Modelle und längere Kontexte, bevor Sharding nötig wird.

Bandbreite

4,8 TB/s Speicherbandbreite helfen, speicherintensive Inferenz- und Tuning-Jobs zu versorgen.

Skalieren

Nutze 1–8 GPU-Slots für reservierte Läufe, Benchmark-Fenster oder private Produktions-Model-Serving.

TEE-Schicht

Phala verbindet GPU-Kapazität mit CVM-Isolation, doppelten Nachweisen und TEE-bewussten Abläufen.

Leistungsmetriken für private AI GPU-Planung

relative index

1x

H100

1.9x

H200

LLM-Inferenz

model + KV cache

80GB

H100

141GB

H200

GPU-Speicher

feed batches

3.35TB/s

H100

4.8TB/s

H200

Speicherbandbreite

NVIDIA H100 chip

NVIDIA H100

80GB HBM3

NVIDIA H200 chip

NVIDIA H200

141GB HBM3e

Leistungsvergleich

NVIDIA H200 vs NVIDIA H100

H100 ist der praktische Ausgangspunkt für vertrauliche GPU-Tests. H200 schafft mehr Raum für größere Modelle und längere Kontexte, bevor Sharding nötig wird.

Nutzen Sie diesen Vergleich, um zu entscheiden, ob der Workload ein kurzes H100-Validierungsfenster oder reservierte H200-High-Memory-Kapazität braucht.

GPU-Beschaffungspfade

Wähle den Kaufpfad für den Job.

Teste eine einzelne Maschine, hole ein Angebot für einen reservierten Slot ein oder wechsle in einen dedizierten Cluster, wenn der Workload zur Produktionsinfrastruktur wird.

01 / On-Demand

Teste innerhalb von 24 Stunden eine vertrauliche GPU.

Kurze Testfenster für Builder, die private Inferenz, Model-Serving oder Proof-Generierung validieren.

02 / Slot

Kapazität vor dem nächsten Lauf reservieren.

Planbarer GPU-Zugriff für längere Trainings-, Fine-Tuning- und Benchmark-Fenster.

03 / Unternehmen

Dedizierte Cluster mit TEE-Betrieb.

Individuelle H100-, H200- oder B300-Deals mit TEE-bewusster Infrastrukturunterstützung und Deploy-Planung.

Nachweis-Pfad

Diese GPU ist nützlich, weil sie verifizierbar ist.

Die GPU wird nicht als Rohhardware verkauft. Sie wird über einen Confidential-VM-Pfad mit GPU Confidential Computing und integrierter Dual-Attestation bereitgestellt.

cvm-enclave · 80×24 · 24fpsdensity: .:-=+*#%@

01

CVM-Runtime

Docker-Workloads laufen in einer Intel-TDX-Confidential-VM mit GPU-Passthrough. Die Laufzeit ist gegen den Betreiber abgeschottet und wird vor dem Start des Workloads per Firmware gemessen.

gpu-cc · 80×22 · 24fpsdensity: .:-=+*#%@

02

GPU-CC-Modus

NVIDIA Confidential Computing versiegelt Modellgewichte, Aktivierungen und KV-Cache im geschützten GPU-Speicher. Die GPU erzwingt die Rechenisolation zusammen mit der CPU TEE.

dual-attestation · 80×20 · 24fpsdensity: .:-=+*#%@

03

Duale Attestation

Intel TDX und NVIDIA erzeugen jeweils einen signierten Quote. Phala sammelt beide und stellt sie über einen einzigen Verifier bereit, sodass CVM und GPU gemeinsam ihren Nachweis erbringen.

Andere vertrauliche GPUs

Vergleiche den nächsten Kapazitätspfad.

Nutzen Sie dasselbe Marketplace-Modell für H100, H200 und B300: Kapazität, Preis, Region und Nachweisstatus bleiben sichtbar.

H200 GPU TEE — 141GB HBM3e Confidential AI | Phala