Trial ready
NVIDIA H100

Proven confidential inference and fine-tuning capacity.
Memory
80GB HBM3
Bandwidth
3.35 TB/s
Region
US-West
Scale
1-2 GPUs
On-demand
$3.08/GPU/hr
24h minimum
Slot
$2.38/GPU/hr
reserved
GPU TEE Marketplace
H100, H200, and B300 capacity with CVMs, dual attestation, and TEE-aware operations.
Trial a machine for 24 hours, reserve a slot, or quote dedicated clusters. Phala handles the hard part: confidential GPUs, Intel TDX runtime, NVIDIA attestation, and the DevOps required to keep it working.
Confidential GPU cloud



hardware proof rail
GPU TEE
H100
GPU TEE
H200
GPU TEE
B300
Trial
24h minimum
Reserve
slots and clusters
Verify
CVM + GPU evidence
Marketplace inventory
Pick a GPU for a 24-hour trial, reserve a slot for sustained jobs, or quote a dedicated cluster. Every path starts from TEE-ready infrastructure instead of a raw GPU box.
Trial ready

Proven confidential inference and fine-tuning capacity.
Memory
80GB HBM3
Bandwidth
3.35 TB/s
Region
US-West
Scale
1-2 GPUs
On-demand
$3.08/GPU/hr
24h minimum
Slot
$2.38/GPU/hr
reserved
Slot ready

High-memory runtime for larger private model jobs.
Memory
141GB HBM3e
Bandwidth
4.8 TB/s
Region
US-West / India
Scale
1-8 GPUs
On-demand
$4.80/GPU/hr
24h minimum
Slot
$3.20/GPU/hr
reserved
Quote now

Blackwell Ultra confidential capacity for frontier inference.
Memory
288GB HBM3e
Bandwidth
8 TB/s
Region
US-East / US-West
Scale
1-8 GPUs
1-month
$6.50/GPU/hr
30d minimum
Slot
$5.60/GPU/hr
reserved
Prices include Intel TDX + NVIDIA confidential computing readiness. Volume and enterprise pricing are quoted by workload.
relative index
1x
1.9x
3.2x
Inférence LLM
model + KV cache
80GB
141GB
288GB
mémoire GPU
feed batches
3.35TB/s
4.8TB/s
8TB/s
Bande passante mémoire

NVIDIA H100
80GB HBM3

NVIDIA H200
141GB HBM3e

NVIDIA B300
288GB HBM3e
Comparatif GPU
Comparez la forme de capacité avant le devis. H100 est le chemin de test rapide, H200 ajoute de la marge mémoire, et B300 est la voie Blackwell Ultra pour l’inférence de pointe et les clusters dédiés.
Le débit exact dépend du modèle, de la taille de lot, de la précision et du runtime. Phala cite le GPU avec la voie de CVM confidentielle, la compatibilité GPU CC et les opérations d’attestation.
Maquette de cloud GPU
La vue marketplace doit rendre le parcours d’achat évident : essai, réservation, puis montée en charge vers un cluster dédié avec la disponibilité TEE associée.

H100
80GB HBM3from
$3.08/hr

H200
141GB HBM3efrom
$4.80/hr

B300
288GB HBM3efrom
$6.50/hr
vérifié
runtime CVM
vérifié
Mode GPU CC
vérifié
Double attestation
Chemin de preuve GPU TEE
L’isolation GPU n’est utile que lorsque toute la chaîne — runtime, mode GPU et collecte de preuves — est vérifiable de bout en bout. Phala livre les trois ensemble.
01
Les charges de travail Docker s’exécutent dans une machine virtuelle confidentielle Intel TDX avec passthrough GPU. Le runtime est scellé contre l’opérateur et mesuré par le firmware avant le démarrage de la charge de travail.
02
NVIDIA Confidential Computing scelle les poids du modèle, les activations et le cache KV à l’intérieur d’une mémoire GPU protégée. Le GPU impose l’isolation du calcul en parallèle de la TEE CPU.
03
Intel TDX et NVIDIA émettent chacun une quote signée. Phala collecte les deux et les expose via un seul vérificateur afin que le CVM et le GPU se prouvent ensemble.
Parcours d’achat
La place de marché est structurée autour de la façon dont les bâtisseurs d’IA achètent réellement des GPU : tester rapidement, réserver de la capacité quand une charge de travail fait ses preuves, puis passer à des contrats entreprise lorsque le cluster devient critique en production.
01 / À la demande
Courtes fenêtres de test pour les builders validant l’inférence privée, le service de modèles ou la génération de preuves.
02 / Slot
Accès GPU prévisible pour l’entraînement prolongé, le fine-tuning et les fenêtres de benchmark.
03 / Entreprise
Offres sur mesure H100, H200 ou B300 avec support d’infrastructure compatible TEE et planification de déploiement.
Parcours de solution IA
Le point de terminaison du modèle privé est le premier point d’entrée. Le même principe de confidentialité s’étend aux agents, aux workflows de données et à l’entraînement.
Diffuser des appels de modèles compatibles OpenAI où les prompts, sorties et le contexte client nécessitent une protection chiffrée en cours d’utilisation.
128K
$0.27/M input
256K
$0.40/M input
128K
$0.15/M input
128K
$0.10/M input
200K
$3.00/M input
1M
$1.25/M input
Exécutez des agents avec clés, outils, mémoire et actions dans un runtime vérifié au lieu d’un cloud d’automatisation visible.
Adaptez les modèles sur des données propriétaires tout en conservant les jeux de données, gradients, checkpoints et traces d’évaluation à l’intérieur de la frontière.
private training run
01
sealed
02
running
03
private
04
verified
loss curve
proof attached
attestation.json
Déplacez les modèles vers des dossiers sensibles et renvoyez des résultats approuvés sans exposer les données brutes à l’opérateur du modèle.
source
EHR data
source
Customer records
source
Internal docs
TEE clean room
approved output
© 2026 Hashforest Technology. Tous droits réservés. Confidentialité • Conditions