NVIDIA H100 GPU TEE

H100-Testmaschinen für private KI.

Bewährte H100-Kapazität für vertrauliche Inferenz, Fine-Tuning und GPU-Tools innerhalb einer CVM.

H100 TEE capacity with 80GB HBM3 memory, Intel TDX runtime, NVIDIA confidential computing, and dual attestation.

Kapazitätszelle

Testbereit
NVIDIA H100 chipNVIDIA H100 chipNVIDIA H100 chip

hardware proof rail

Diese GPU läuft durch denselben verifizierbaren GPU-Nachweispfad.

GPU TEE

H100

GPU TEE

80 GB HBM3

GPU TEE

TEE proof

Speicher

80 GB HBM3

Bandbreite

3,35 TB/s

Region

US-West

Skalieren

1-2 GPUs

Details zum GPU-Käufer

Mehr als nur ein GPU-Angebot.

GPU-Anbieter bleiben meist bei Preis und Verfügbarkeit stehen. Diese Seite macht die zusätzlichen TEE-Anforderungen sichtbar: Laufzeitgrenze, vertraulicher GPU-Modus, Attestierung und Betrieb.

Beste Wahl

GPU-Workload-Form

01Private Inferenz-Tests
02Agent-GPU-Tools
03Beweiserzeugung

Zugriff

24-Stunden-Testmaschinen

Verpflichtung

Reservierte H100-Slots

Unternehmen

Kleine geschützte Cluster

Checkliste für TEE-Readiness

01

Kapazität

GPU-Speicher, Bandbreite, Region und Skalierung sind vor dem Verkaufsgespräch sichtbar.

02

Cloud-Pfad

Ausführung über Confidential VMs, Bare-Metal-Pfade oder Enterprise-Deployments.

03

TEE-Bereitschaft

Intel TDX, NVIDIA Confidential Computing, Treiber, BIOS und Verifier-Bereitschaft werden von Phala übernommen.

04

Kaufentscheidung

Beginnen Sie mit einem 24-Stunden-Test, reservieren Sie einen Slot oder holen Sie ein Angebot für einen dedizierten Cluster ein.

Technisches GPU-Profil

Verwende H100, wenn die Workload einen schnellen privaten Testpfad benötigt.

H100 ist der praktische Ausgangspunkt für Tests privater Inferenz, GPU-Tools für Agenten und Proof-Pipelines, bei denen eine 24-Stunden-Maschine ausreicht, um den Workload vor der Reservierung größerer Kapazitäten zu validieren.

Speicher

80 GB HBM3 für private Inferenz, Proof-Jobs und kleine Fine-Tuning-Fenster.

Leistung

Ein bewährter Hopper-Pfad für Teams, die jetzt zuverlässigen vertraulichen GPU-Zugriff benötigen.

Skalieren

Starten Sie mit 1–2 GPUs und wechseln Sie dann zu H200 oder B300, wenn Speicher oder Clustergröße zum Engpass wird.

TEE-Schicht

CVM-Laufzeit, NVIDIA CC-Modus, Attestierung und Firmware-Bereitschaft werden gemeinsam gehandhabt.

Leistungsmetriken für private AI GPU-Planung

relative index

1x

H100

1.9x

H200

LLM-Inferenz

model + KV cache

80GB

H100

141GB

H200

GPU-Speicher

feed batches

3.35TB/s

H100

4.8TB/s

H200

Speicherbandbreite

NVIDIA H100 chip

NVIDIA H100

80GB HBM3

NVIDIA H200 chip

NVIDIA H200

141GB HBM3e

Leistungsvergleich

NVIDIA H200 vs NVIDIA H100

H100 ist der praktische Ausgangspunkt für vertrauliche GPU-Tests. H200 schafft mehr Raum für größere Modelle und längere Kontexte, bevor Sharding nötig wird.

Nutzen Sie diesen Vergleich, um zu entscheiden, ob der Workload ein kurzes H100-Validierungsfenster oder reservierte H200-High-Memory-Kapazität braucht.

GPU-Beschaffungspfade

Wähle den Kaufpfad für den Job.

Teste eine einzelne Maschine, hole ein Angebot für einen reservierten Slot ein oder wechsle in einen dedizierten Cluster, wenn der Workload zur Produktionsinfrastruktur wird.

01 / On-Demand

Teste innerhalb von 24 Stunden eine vertrauliche GPU.

Kurze Testfenster für Builder, die private Inferenz, Model-Serving oder Proof-Generierung validieren.

02 / Slot

Kapazität vor dem nächsten Lauf reservieren.

Planbarer GPU-Zugriff für längere Trainings-, Fine-Tuning- und Benchmark-Fenster.

03 / Unternehmen

Dedizierte Cluster mit TEE-Betrieb.

Individuelle H100-, H200- oder B300-Deals mit TEE-bewusster Infrastrukturunterstützung und Deploy-Planung.

Nachweis-Pfad

Diese GPU ist nützlich, weil sie verifizierbar ist.

Die GPU wird nicht als Rohhardware verkauft. Sie wird über einen Confidential-VM-Pfad mit GPU Confidential Computing und integrierter Dual-Attestation bereitgestellt.

cvm-enclave · 80×24 · 24fpsdensity: .:-=+*#%@

01

CVM-Runtime

Docker-Workloads laufen in einer Intel-TDX-Confidential-VM mit GPU-Passthrough. Die Laufzeit ist gegen den Betreiber abgeschottet und wird vor dem Start des Workloads per Firmware gemessen.

gpu-cc · 80×22 · 24fpsdensity: .:-=+*#%@

02

GPU-CC-Modus

NVIDIA Confidential Computing versiegelt Modellgewichte, Aktivierungen und KV-Cache im geschützten GPU-Speicher. Die GPU erzwingt die Rechenisolation zusammen mit der CPU TEE.

dual-attestation · 80×20 · 24fpsdensity: .:-=+*#%@

03

Duale Attestation

Intel TDX und NVIDIA erzeugen jeweils einen signierten Quote. Phala sammelt beide und stellt sie über einen einzigen Verifier bereit, sodass CVM und GPU gemeinsam ihren Nachweis erbringen.

Andere vertrauliche GPUs

Vergleiche den nächsten Kapazitätspfad.

Nutzen Sie dasselbe Marketplace-Modell für H100, H200 und B300: Kapazität, Preis, Region und Nachweisstatus bleiben sichtbar.

H100 GPU TEE — Confidential AI on 80GB HBM3 | Phala