NVIDIA H100 GPU TEE

Machines d’essai H100 pour l’IA privée.

Capacité H100 éprouvée pour l’inférence confidentielle, le fine-tuning et les outils GPU dans un CVM.

H100 TEE capacity with 80GB HBM3 memory, Intel TDX runtime, NVIDIA confidential computing, and dual attestation.

Cellule de capacité

Prêt pour essai
NVIDIA H100 chipNVIDIA H100 chipNVIDIA H100 chip

hardware proof rail

Ce GPU suit le même chemin vérifiable de preuve GPU.

GPU TEE

H100

GPU TEE

80 Go de HBM3

GPU TEE

TEE proof

Mémoire

80 Go de HBM3

Bande passante

3,35 To/s

Région

US-Ouest

Mise à l’échelle

1 à 2 GPU

Détails de l’acheteur GPU

Plus qu’un devis GPU.

Les vendeurs de GPU s’arrêtent généralement au prix et à la disponibilité. Cette page rend visibles les exigences TEE supplémentaires : frontière d’exécution, mode GPU confidentiel, attestation et opérations.

Meilleur choix

forme de charge GPU

01Essais d’inférence privée
02Outils GPU pour agents
03Génération de preuve

Accès

Machines d’essai de 24 heures

Engagement

Emplacements H100 réservés

Entreprise

Petits clusters protégés

Checklist de préparation TEE

01

Capacité

La mémoire GPU, la bande passante, la région et l’échelle sont visibles avant l’appel commercial.

02

Voie cloud

Exécutez via des VMs confidentielles, des chemins bare metal ou des déploiements entreprise.

03

Disponibilité TEE

Intel TDX, le confidential computing NVIDIA, les pilotes, le BIOS et la disponibilité du vérificateur sont pris en charge par Phala.

04

Mouvement d’achat

Commencez par un essai de 24 heures, réservez un créneau ou demandez un devis pour un cluster dédié.

Profil technique GPU

Utilisez H100 lorsque la charge de travail nécessite un chemin de test privé rapide.

H100 est le point de départ pratique pour les essais d’inférence privée, les outils GPU pour agents et les pipelines de preuve, lorsqu’une machine de 24 heures suffit pour valider la charge de travail avant de réserver une capacité plus importante.

Mémoire

80 Go de HBM3 pour l’inférence privée, les jobs de preuve et les petites fenêtres de fine-tuning.

Performance

Un chemin Hopper éprouvé pour les équipes qui ont besoin dès maintenant d’un accès GPU confidentiel fiable.

Mise à l’échelle

Commencez avec 1-2 GPU, puis passez à H200 ou B300 lorsque la mémoire ou la taille du cluster devient le facteur limitant.

couche TEE

Le runtime CVM, le mode NVIDIA CC, l’attestation et la disponibilité du firmware sont gérés ensemble.

Indicateurs de performance pour la planification GPU d’IA privée

relative index

1x

H100

1.9x

H200

Inférence LLM

model + KV cache

80GB

H100

141GB

H200

mémoire GPU

feed batches

3.35TB/s

H100

4.8TB/s

H200

Bande passante mémoire

NVIDIA H100 chip

NVIDIA H100

80GB HBM3

NVIDIA H200 chip

NVIDIA H200

141GB HBM3e

Comparaison des performances

NVIDIA H200 vs NVIDIA H100

H100 est le point de départ pratique pour les essais GPU confidentiels. H200 laisse davantage de marge aux modèles plus grands et aux contextes plus longs avant le sharding.

Utilisez cette comparaison pour décider si la charge de travail nécessite une courte fenêtre de validation H100 ou une capacité H200 haute mémoire réservée.

Parcours d’achat GPU

Choisissez le parcours d'achat pour la tâche.

Testez une seule machine, demandez un devis pour un emplacement réservé, ou passez à un cluster dédié lorsque la charge devient une infrastructure de production.

01 / À la demande

Testez un GPU confidentiel en 24 heures.

Courtes fenêtres de test pour les builders validant l’inférence privée, le service de modèles ou la génération de preuves.

02 / Slot

Réservez de la capacité avant la prochaine exécution.

Accès GPU prévisible pour l’entraînement prolongé, le fine-tuning et les fenêtres de benchmark.

03 / Entreprise

Clusters dédiés avec opérations TEE.

Offres sur mesure H100, H200 ou B300 avec support d’infrastructure compatible TEE et planification de déploiement.

Chemin de preuve

Ce GPU est utile parce qu’il est vérifiable.

Le GPU n’est pas vendu comme du matériel brut. Il est livré via un chemin de machine virtuelle confidentielle avec confidential computing GPU et double attestation intégrés.

cvm-enclave · 80×24 · 24fpsdensity: .:-=+*#%@

01

runtime CVM

Les charges de travail Docker s’exécutent dans une machine virtuelle confidentielle Intel TDX avec passthrough GPU. Le runtime est scellé contre l’opérateur et mesuré par le firmware avant le démarrage de la charge de travail.

gpu-cc · 80×22 · 24fpsdensity: .:-=+*#%@

02

Mode GPU CC

NVIDIA Confidential Computing scelle les poids du modèle, les activations et le cache KV à l’intérieur d’une mémoire GPU protégée. Le GPU impose l’isolation du calcul en parallèle de la TEE CPU.

dual-attestation · 80×20 · 24fpsdensity: .:-=+*#%@

03

Double attestation

Intel TDX et NVIDIA émettent chacun une quote signée. Phala collecte les deux et les expose via un seul vérificateur afin que le CVM et le GPU se prouvent ensemble.

Autres GPU confidentiels

Comparez la prochaine option de capacité.

Utilisez le même modèle marketplace sur H100, H200 et B300 : capacité, prix, région et état de preuve restent visibles.

H100 GPU TEE — Confidential AI on 80GB HBM3 | Phala