GPU TEE Marketplace

TEE-ready GPUs for AI builders.

Name: GPU TEE - Confidential GPU Computing
Brand: Phala
Price: 50.37 USD
Availability: InStock
Rating: 4.8 (127 reviews)

H100, H200, and B300 capacity with CVMs, dual attestation, and TEE-aware operations.

Trial a machine for 24 hours, reserve a slot, or quote dedicated clusters. Phala handles the hard part: confidential GPUs, Intel TDX runtime, NVIDIA attestation, and the DevOps required to keep it working.

Trial nowQuote price

Confidential GPU cloud

Capacity first. Proof after the workload runs.

H100 / H200 / B300

hardware proof rail

H100, H200, and B300 move through one verifiable GPU path.

GPU TEE

H100

GPU TEE

H200

GPU TEE

B300

Trial

24h minimum

Reserve

slots and clusters

Verify

CVM + GPU evidence

Marketplace inventory

Capacity with proof built in.

Pick a GPU for a 24-hour trial, reserve a slot for sustained jobs, or quote a dedicated cluster. Every path starts from TEE-ready infrastructure instead of a raw GPU box.

Trial ready

NVIDIA H100

Proven confidential inference and fine-tuning capacity.

Memory

80GB HBM3

Bandwidth

3.35 TB/s

Region

US-West

Scale

1-2 GPUs

On-demand

$3.08/GPU/hr

24h minimum

Slot

$2.38/GPU/hr

reserved

Trial now Details

Slot ready

NVIDIA H200

High-memory runtime for larger private model jobs.

Memory

141GB HBM3e

Bandwidth

4.8 TB/s

Region

US-West / India

Scale

1-8 GPUs

On-demand

$4.80/GPU/hr

24h minimum

Slot

$3.20/GPU/hr

reserved

Trial now Details

Quote now

NVIDIA B300

Blackwell Ultra confidential capacity for frontier inference.

Memory

288GB HBM3e

Bandwidth

8 TB/s

Region

US-East / US-West

Scale

1-8 GPUs

1-month

$6.50/GPU/hr

30d minimum

Slot

$5.60/GPU/hr

reserved

Trial now Details

Prices include Intel TDX + NVIDIA confidential computing readiness. Volume and enterprise pricing are quoted by workload.

Quote price

Indicateurs de performance pour la planification GPU d’IA privée

H100

H200

B300

relative index

H100

1.9x

H200

3.2x

B300

Inférence LLM

model + KV cache

80GB

H100

141GB

H200

288GB

B300

mémoire GPU

feed batches

3.35TB/s

H100

4.8TB/s

H200

8TB/s

B300

Bande passante mémoire

NVIDIA H100

80GB HBM3

NVIDIA H200

141GB HBM3e

NVIDIA B300

288GB HBM3e

Comparatif GPU

H100 vs H200 vs B300

Comparez la forme de capacité avant le devis. H100 est le chemin de test rapide, H200 ajoute de la marge mémoire, et B300 est la voie Blackwell Ultra pour l’inférence de pointe et les clusters dédiés.

Le débit exact dépend du modèle, de la taille de lot, de la précision et du runtime. Phala cite le GPU avec la voie de CVM confidentielle, la compatibilité GPU CC et les opérations d’attestation.

Maquette de cloud GPU

Voies de capacité avec état de preuve.

La vue marketplace doit rendre le parcours d’achat évident : essai, réservation, puis montée en charge vers un cluster dédié avec la disponibilité TEE associée.

H100

80GB HBM3

from

$3.08/hr

H200

141GB HBM3e

from

$4.80/hr

B300

288GB HBM3e

from

$6.50/hr

vérifié

runtime CVM

vérifié

Mode GPU CC

vérifié

Double attestation

Chemin de preuve GPU TEE

Ce que Phala gère pour la voie CVM.

L’isolation GPU n’est utile que lorsque toute la chaîne — runtime, mode GPU et collecte de preuves — est vérifiable de bout en bout. Phala livre les trois ensemble.

                                                                                
                                                                                
                                                                                
                                                                                
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++

cvm-enclave · 80×24 · 24fpsdensity: .:-=+*#%@

runtime CVM

Les charges de travail Docker s’exécutent dans une machine virtuelle confidentielle Intel TDX avec passthrough GPU. Le runtime est scellé contre l’opérateur et mesuré par le firmware avant le démarrage de la charge de travail.

                                                                                
                                                                                
      @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@      
      @                                                                  @      
      @  @@@@ @@@@ @@@@ @@@@ @@@@ @@@@ @@@@ @@@@ @@@@ @@@@ @@@@ @@@@ @   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @                                                                  @      
      @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@

gpu-cc · 80×22 · 24fpsdensity: .:-=+*#%@

Mode GPU CC

NVIDIA Confidential Computing scelle les poids du modèle, les activations et le cache KV à l’intérieur d’une mémoire GPU protégée. Le GPU impose l’isolation du calcul en parallèle de la TEE CPU.

                                                                                
                                                                                
                                                                                
     @@@@@@@@@@@@                                                               
     @=--::--=++@+-:.                                                           
     @=--::--=++@#*+-::....                                                     
     @@@@@@@@@@@@        ...........                                            
                                   ..........                  @@@@@@@@@@@@@    
                                            ...........        @======++***@    
                                                     ..........@=====++****@    
                                                     ..........@====++*****@    
                                       .::::...........        @===++******@    
                                  .:-*%@@%*-:.                 @@@@@@@@@@@@@    
     @@@@@@@@@@@@        ...........::::.                                       
     @:::-==++++@..........                                                     
     @:::-==++++@                                                               
     @@@@@@@@@@@@

dual-attestation · 80×20 · 24fpsdensity: .:-=+*#%@

Double attestation

Intel TDX et NVIDIA émettent chacun une quote signée. Phala collecte les deux et les expose via un seul vérificateur afin que le CVM et le GPU se prouvent ensemble.

Parcours d’achat

Commencez petit. Réservez quand cela fonctionne.

La place de marché est structurée autour de la façon dont les bâtisseurs d’IA achètent réellement des GPU : tester rapidement, réserver de la capacité quand une charge de travail fait ses preuves, puis passer à des contrats entreprise lorsque le cluster devient critique en production.

01 / À la demande

Testez un GPU confidentiel en 24 heures.

Courtes fenêtres de test pour les builders validant l’inférence privée, le service de modèles ou la génération de preuves.

Essayer maintenant

02 / Slot

Réservez de la capacité avant la prochaine exécution.

Accès GPU prévisible pour l’entraînement prolongé, le fine-tuning et les fenêtres de benchmark.

Obtenir un devis

03 / Entreprise

Clusters dédiés avec opérations TEE.

Offres sur mesure H100, H200 ou B300 avec support d’infrastructure compatible TEE et planification de déploiement.

Parler aux ventes

Parcours de solution IA

Use GPU TEE where AI touches secrets.

GPU capacity is one part of the privacy boundary. The same confidential compute path supports private inference, agents, training, and data workflows.

LLM API

Inférence IA privée

Diffuser des appels de modèles compatibles OpenAI où les prompts, sorties et le contexte client nécessitent une protection chiffrée en cours d’utilisation.

Ouvrir la solution

Agents

Agents IA privés

Exécutez des agents avec clés, outils, mémoire et actions dans un runtime vérifié au lieu d’un cloud d’automatisation visible.

Ouvrir la solution

Training

Entraînement de modèle privé

Adaptez les modèles sur des données propriétaires tout en conservant les jeux de données, gradients, checkpoints et traces d’évaluation à l’intérieur de la frontière.

Ouvrir la solution

Data

Données d’IA privées

Déplacez les modèles vers des dossiers sensibles et renvoyez des résultats approuvés sans exposer les données brutes à l’opérateur du modèle.

Ouvrir la solution

Exécution privée. Résultats vérifiables.

Newsletter

GPU TEE Cloud — H100/H200/B300 Confidential AI | Phala