Trial ready
NVIDIA H100

Proven confidential inference and fine-tuning capacity.
Memory
80GB HBM3
Bandwidth
3.35 TB/s
Region
US-West
Scale
1-2 GPUs
On-demand
$3.08/GPU/hr
24h minimum
Slot
$2.38/GPU/hr
reserved
GPU TEE Marketplace
H100, H200, and B300 capacity with CVMs, dual attestation, and TEE-aware operations.
Trial a machine for 24 hours, reserve a slot, or quote dedicated clusters. Phala handles the hard part: confidential GPUs, Intel TDX runtime, NVIDIA attestation, and the DevOps required to keep it working.
Confidential GPU cloud



hardware proof rail
GPU TEE
H100
GPU TEE
H200
GPU TEE
B300
Trial
24h minimum
Reserve
slots and clusters
Verify
CVM + GPU evidence
Marketplace inventory
Pick a GPU for a 24-hour trial, reserve a slot for sustained jobs, or quote a dedicated cluster. Every path starts from TEE-ready infrastructure instead of a raw GPU box.
Trial ready

Proven confidential inference and fine-tuning capacity.
Memory
80GB HBM3
Bandwidth
3.35 TB/s
Region
US-West
Scale
1-2 GPUs
On-demand
$3.08/GPU/hr
24h minimum
Slot
$2.38/GPU/hr
reserved
Slot ready

High-memory runtime for larger private model jobs.
Memory
141GB HBM3e
Bandwidth
4.8 TB/s
Region
US-West / India
Scale
1-8 GPUs
On-demand
$4.80/GPU/hr
24h minimum
Slot
$3.20/GPU/hr
reserved
Quote now

Blackwell Ultra confidential capacity for frontier inference.
Memory
288GB HBM3e
Bandwidth
8 TB/s
Region
US-East / US-West
Scale
1-8 GPUs
1-month
$6.50/GPU/hr
30d minimum
Slot
$5.60/GPU/hr
reserved
Prices include Intel TDX + NVIDIA confidential computing readiness. Volume and enterprise pricing are quoted by workload.
relative index
1x
1.9x
3.2x
LLM çıkarımı
model + KV cache
80GB
141GB
288GB
GPU belleği
feed batches
3.35TB/s
4.8TB/s
8TB/s
Bellek bant genişliği

NVIDIA H100
80GB HBM3

NVIDIA H200
141GB HBM3e

NVIDIA B300
288GB HBM3e
GPU karşılaştırması
Tekliften önce kapasite profilini karşılaştırın. H100 hızlı deneme yolu, H200 daha fazla bellek payı ekler ve B300, öncü çıkarım ile özel kümeler için Blackwell Ultra yoludur.
Tam aktarım hızı modele, batch boyutuna, hassasiyete ve çalışma zamanına bağlıdır. Phala, GPU’yu confidential VM yolu, GPU CC hazır oluşu ve attestation operasyonlarıyla birlikte fiyatlar.
GPU bulut maketi
Pazar yeri görünümü, satın alma hareketini açıkça göstermeli: dene, rezerve et, ardından TEE hazırlığı eklenmiş ayrılmış kümeye ölçekle.

H100
80GB HBM3from
$3.08/hr

H200
141GB HBM3efrom
$4.80/hr

B300
288GB HBM3efrom
$6.50/hr
doğrulanmış
CVM çalışma zamanı
doğrulanmış
GPU CC modu
doğrulanmış
Çift doğrulama
GPU TEE kanıt yolu
GPU izolasyonu ancak tüm yol — çalışma zamanı, GPU modu ve kanıt toplama — uçtan uca doğrulanabilir olduğunda faydalıdır. Phala üçünü birlikte sunar.
01
Docker iş yükleri, GPU passthrough ile Intel TDX gizli VM içinde çalışır. Çalışma zamanı operatöre karşı mühürlenir ve iş yükü başlamadan önce firmware tarafından ölçülür.
02
NVIDIA Confidential Computing, model ağırlıklarını, aktivasyonları ve KV cache’i korumalı GPU belleği içinde mühürler. GPU, CPU TEE ile birlikte çalışma izolasyonunu uygular.
03
Intel TDX ve NVIDIA ayrı ayrı imzalı quote üretir. Phala ikisini birden toplar ve tek bir doğrulayıcı üzerinden sunar; böylece CVM ve GPU birlikte kendilerini kanıtlar.
Satın alma yolları
Pazar yeri, yapay zeka geliştiricilerinin GPU’ları gerçekte nasıl satın aldığına göre yapılandırılmıştır: hızlıca test et, iş yükü kendini kanıtladığında kapasite ayır, ardından küme üretim açısından kritik hale geldiğinde kurumsal anlaşmalara geç.
01 / İsteğe bağlı
Özel çıkarım, model servisi veya kanıt üretimini doğrulayan geliştiriciler için kısa test pencereleri.
02 / Slot
Sürekli eğitim, ince ayar ve benchmark pencereleri için öngörülebilir GPU erişimi.
03 / Kurumsal
TEE farkındalıklı altyapı desteği ve dağıtım planlamasıyla özel H100, H200 veya B300 anlaşmaları.
Yapay zeka çözüm yolları
Özel model uç noktası ilk giriş noktasıdır. Aynı gizlilik ilkesi ajanlara, veri iş akışlarına ve eğitime de genişler.
Promptların, çıktıların ve müşteri bağlamının kullanım sırasında şifreli korunması gereken OpenAI uyumlu model çağrılarını sunun.
128K
$0.27/M input
256K
$0.40/M input
128K
$0.15/M input
128K
$0.10/M input
200K
$3.00/M input
1M
$1.25/M input
Ajanları, görülebilir bir otomasyon bulutu yerine anahtarlar, araçlar, bellek ve eylemlerle birlikte doğrulanmış bir çalışma zamanında çalıştırın.
Veri kümelerini, gradyanları, checkpoint’leri ve değerlendirme izlerini sınırın içinde tutarken tescilli veriler üzerinde modelleri uyarlayın.
private training run
01
sealed
02
running
03
private
04
verified
loss curve
proof attached
attestation.json
Modelleri hassas kayıtlara taşıyın ve ham veriyi model operatörüne açmadan onaylı çıktılar döndürün.
source
EHR data
source
Customer records
source
Internal docs
TEE clean room
approved output