NVIDIA H200 GPU TEE

Emplacements H200 pour modèles privés.

Capacité H200 à grande mémoire pour le service de LLM plus grands, le tuning et les tâches batch protégées.

H200 TEE capacity with 141GB HBM3e memory, confidential GPU mode, CVM runtime, and TEE operations.

Cellule de capacité

Emplacement prêt
NVIDIA H200 chipNVIDIA H200 chipNVIDIA H200 chip

hardware proof rail

Ce GPU suit le même chemin vérifiable de preuve GPU.

GPU TEE

H200

GPU TEE

141 Go de HBM3e

GPU TEE

TEE proof

Mémoire

141 Go de HBM3e

Bande passante

4,8 To/s

Région

US-Ouest / Inde

Mise à l’échelle

1-8 GPU

Détails de l’acheteur GPU

Plus qu’un devis GPU.

Les vendeurs de GPU s’arrêtent généralement au prix et à la disponibilité. Cette page rend visibles les exigences TEE supplémentaires : frontière d’exécution, mode GPU confidentiel, attestation et opérations.

Meilleur choix

forme de charge GPU

01Service de grands LLM
02Fenêtres de fine-tuning
03Jobs batch à grande mémoire

Accès

1-8 emplacements GPU

Engagement

Capacité H200 réservée

Entreprise

Clusters de modèles privés multi-nœuds

Checklist de préparation TEE

01

Capacité

La mémoire GPU, la bande passante, la région et l’échelle sont visibles avant l’appel commercial.

02

Voie cloud

Exécutez via des VMs confidentielles, des chemins bare metal ou des déploiements entreprise.

03

Disponibilité TEE

Intel TDX, le confidential computing NVIDIA, les pilotes, le BIOS et la disponibilité du vérificateur sont pris en charge par Phala.

04

Mouvement d’achat

Commencez par un essai de 24 heures, réservez un créneau ou demandez un devis pour un cluster dédié.

Profil technique GPU

Utilisez H200 lorsque la mémoire est le goulot d’étranglement.

H200 est mieux adapté au service de grands LLM, à l’inférence à long contexte, aux jobs batch protégés et aux sessions de tuning qui nécessitent davantage de mémoire modèle ou KV-cache sans passer immédiatement à un cluster Blackwell.

Mémoire

141 Go de HBM3e offrent davantage de marge aux modèles plus grands et aux contextes plus longs avant le sharding.

Bande passante

4,8 To/s de bande passante mémoire aident à alimenter les jobs d’inférence et de tuning à forte mémoire.

Mise à l’échelle

Utilisez 1 à 8 emplacements GPU pour les exécutions réservées, les fenêtres de benchmark ou l’inférence de modèles privés en production.

couche TEE

Phala associe la capacité GPU à l’isolation CVM, à la double preuve et à des opérations compatibles TEE.

Indicateurs de performance pour la planification GPU d’IA privée

relative index

1x

H100

1.9x

H200

Inférence LLM

model + KV cache

80GB

H100

141GB

H200

mémoire GPU

feed batches

3.35TB/s

H100

4.8TB/s

H200

Bande passante mémoire

NVIDIA H100 chip

NVIDIA H100

80GB HBM3

NVIDIA H200 chip

NVIDIA H200

141GB HBM3e

Comparaison des performances

NVIDIA H200 vs NVIDIA H100

H100 est le point de départ pratique pour les essais GPU confidentiels. H200 laisse davantage de marge aux modèles plus grands et aux contextes plus longs avant le sharding.

Utilisez cette comparaison pour décider si la charge de travail nécessite une courte fenêtre de validation H100 ou une capacité H200 haute mémoire réservée.

Parcours d’achat GPU

Choisissez le parcours d'achat pour la tâche.

Testez une seule machine, demandez un devis pour un emplacement réservé, ou passez à un cluster dédié lorsque la charge devient une infrastructure de production.

01 / À la demande

Testez un GPU confidentiel en 24 heures.

Courtes fenêtres de test pour les builders validant l’inférence privée, le service de modèles ou la génération de preuves.

02 / Slot

Réservez de la capacité avant la prochaine exécution.

Accès GPU prévisible pour l’entraînement prolongé, le fine-tuning et les fenêtres de benchmark.

03 / Entreprise

Clusters dédiés avec opérations TEE.

Offres sur mesure H100, H200 ou B300 avec support d’infrastructure compatible TEE et planification de déploiement.

Chemin de preuve

Ce GPU est utile parce qu’il est vérifiable.

Le GPU n’est pas vendu comme du matériel brut. Il est livré via un chemin de machine virtuelle confidentielle avec confidential computing GPU et double attestation intégrés.

cvm-enclave · 80×24 · 24fpsdensity: .:-=+*#%@

01

runtime CVM

Les charges de travail Docker s’exécutent dans une machine virtuelle confidentielle Intel TDX avec passthrough GPU. Le runtime est scellé contre l’opérateur et mesuré par le firmware avant le démarrage de la charge de travail.

gpu-cc · 80×22 · 24fpsdensity: .:-=+*#%@

02

Mode GPU CC

NVIDIA Confidential Computing scelle les poids du modèle, les activations et le cache KV à l’intérieur d’une mémoire GPU protégée. Le GPU impose l’isolation du calcul en parallèle de la TEE CPU.

dual-attestation · 80×20 · 24fpsdensity: .:-=+*#%@

03

Double attestation

Intel TDX et NVIDIA émettent chacun une quote signée. Phala collecte les deux et les expose via un seul vérificateur afin que le CVM et le GPU se prouvent ensemble.

Autres GPU confidentiels

Comparez la prochaine option de capacité.

Utilisez le même modèle marketplace sur H100, H200 et B300 : capacité, prix, région et état de preuve restent visibles.

H200 GPU TEE — 141GB HBM3e Confidential AI | Phala