NVIDIA H200 GPU TEE

H200-slots voor privé modellen.

Hogegeheugen H200-capaciteit voor grotere LLM-serving, tuning en beveiligde batchjobs.

H200 TEE capacity with 141GB HBM3e memory, confidential GPU mode, CVM runtime, and TEE operations.

Capaciteitscel

Slot gereed
NVIDIA H200 chipNVIDIA H200 chipNVIDIA H200 chip

hardware proof rail

Deze GPU loopt via hetzelfde verifieerbare GPU-bewijspad.

GPU TEE

H200

GPU TEE

141GB HBM3e

GPU TEE

TEE proof

Geheugen

141GB HBM3e

Bandbreedte

4,8 TB/s

Regio

VS-West / India

Schalen

1-8 GPU’s

Details van GPU-kopers

Meer dan een GPU-offerte.

GPU-verkopers stoppen meestal bij prijs en beschikbaarheid. Deze pagina maakt de extra TEE-vereisten zichtbaar: runtime-grens, vertrouwelijke GPU-modus, attestatie en operations.

Beste match

GPU-workloadvorm

01Grote LLM-serving
02Fine-tuningvensters
03Batchjobs met veel geheugen

Toegang

1-8 GPU-slots

Toezegging

Gereserveerde H200-capaciteit

Enterprise

Multi-node private model-clusters

TEE-gereedheidschecklist

01

Capaciteit

GPU-geheugen, bandbreedte, regio en schaal zijn zichtbaar vóór het verkoopgesprek.

02

Cloud-pad

Draai via confidential VMs, bare-metalpaden of enterprise-implementaties.

03

TEE-gereedheid

Intel TDX, NVIDIA confidential computing, drivers, BIOS en verifier-gereedheid worden door Phala beheerd.

04

Aankoopbeweging

Begin met een proef van 24 uur, reserveer een slot of vraag een dedicated cluster aan.

Technisch GPU-profiel

Gebruik H200 wanneer geheugen de bottleneck is.

H200 is beter geschikt voor grotere LLM-serving, inference met lange context, beschermde batchjobs en tuning-runs die meer model- of KV-cachegeheugen nodig hebben zonder meteen naar een Blackwell-cluster te gaan.

Geheugen

141GB HBM3e geeft grotere modellen en langere contexten meer ruimte voordat sharding nodig is.

Bandbreedte

4,8 TB/s geheugenbandbreedte helpt high-memory inferentie- en tuningjobs gevoed te houden.

Schalen

Gebruik 1-8 GPU-slots voor gereserveerde runs, benchmarkvensters of productie van private modelserving.

TEE-laag

Phala koppelt GPU-capaciteit aan CVM-isolatie, dubbele bewijsvoering en TEE-bewuste operaties.

Prestatiegegevens voor planning van private AI-GPU's

relative index

1x

H100

1.9x

H200

LLM-inferentie

model + KV cache

80GB

H100

141GB

H200

GPU-geheugen

feed batches

3.35TB/s

H100

4.8TB/s

H200

Geheugenbandbreedte

NVIDIA H100 chip

NVIDIA H100

80GB HBM3

NVIDIA H200 chip

NVIDIA H200

141GB HBM3e

Prestatievergelijking

NVIDIA H200 vs NVIDIA H100

H100 is het praktische startpunt voor vertrouwelijke GPU-pilots. H200 biedt meer ruimte voor grotere modellen en langere contexten voordat sharding nodig is.

Gebruik deze vergelijking om te bepalen of de workload een kort H100-validatievenster nodig heeft of gereserveerde H200 high-memory-capaciteit.

GPU-aankooppaden

Kies het aankooppad voor de workload.

Test één machine, vraag een gereserveerde slot-offerte aan of stap over naar een dedicated cluster wanneer de workload productie-infrastructuur wordt.

01 / Op aanvraag

Test een vertrouwelijke GPU binnen 24 uur.

Korte testvensters voor builders die private inference, modelserving of proof generation valideren.

02 / Slot

Reserveer capaciteit vóór de volgende run.

Voorspelbare GPU-toegang voor langdurige training, fine-tuning en benchmarkvensters.

03 / Enterprise

Toegewijde clusters met TEE-operaties.

Aangepaste deals voor H100, H200 of B300 met TEE-bewuste infrastructuurondersteuning en deploymentplanning.

Bewijsroute

Deze GPU is nuttig omdat hij verifieerbaar is.

De GPU wordt niet als ruwe hardware verkocht. Hij wordt geleverd via een confidential-VM-pad met GPU confidential computing en ingebouwde dubbele attestatie.

cvm-enclave · 80×24 · 24fpsdensity: .:-=+*#%@

01

CVM-runtime

Docker-workloads draaien in een Intel TDX-confidential VM met GPU passthrough. De runtime is afgeschermd tegen de operator en wordt vóór start van de workload door firmware gemeten.

gpu-cc · 80×22 · 24fpsdensity: .:-=+*#%@

02

GPU CC-modus

NVIDIA Confidential Computing verzegelt modelgewichten, activaties en KV-cache in beschermd GPU-geheugen. De GPU handhaaft compute-isolatie naast de CPU TEE.

dual-attestation · 80×20 · 24fpsdensity: .:-=+*#%@

03

Dubbele attestation

Intel TDX en NVIDIA geven elk een ondertekende quote af. Phala verzamelt beide en biedt ze via één verifier aan, zodat de CVM en de GPU samen bewijzen dat ze echt zijn.

Andere vertrouwelijke GPU's

Vergelijk het volgende capaciteitspad.

Gebruik hetzelfde marketplace-model voor H100, H200 en B300: capaciteit, prijs, regio en bewijsstatus blijven zichtbaar.

H200 GPU TEE — 141GB HBM3e Confidential AI | Phala