GPU TEE Marketplace

TEE-ready GPUs for AI builders.

H100, H200, and B300 capacity with CVMs, dual attestation, and TEE-aware operations.

Trial a machine for 24 hours, reserve a slot, or quote dedicated clusters. Phala handles the hard part: confidential GPUs, Intel TDX runtime, NVIDIA attestation, and the DevOps required to keep it working.

Confidential GPU cloud

Capacity first. Proof after the workload runs.

NVIDIA H100 chipNVIDIA H200 chipNVIDIA B300 chip

hardware proof rail

H100, H200, and B300 move through one verifiable GPU path.

GPU TEE

H100

GPU TEE

H200

GPU TEE

B300

Trial

24h minimum

Reserve

slots and clusters

Verify

CVM + GPU evidence

Marketplace inventory

Capacity with proof built in.

Pick a GPU for a 24-hour trial, reserve a slot for sustained jobs, or quote a dedicated cluster. Every path starts from TEE-ready infrastructure instead of a raw GPU box.

Trial ready

NVIDIA H100

NVIDIA H100 chip

Proven confidential inference and fine-tuning capacity.

Memory

80GB HBM3

Bandwidth

3.35 TB/s

Region

US-West

Scale

1-2 GPUs

On-demand

$3.08/GPU/hr

24h minimum

Slot

$2.38/GPU/hr

reserved

Slot ready

NVIDIA H200

NVIDIA H200 chip

High-memory runtime for larger private model jobs.

Memory

141GB HBM3e

Bandwidth

4.8 TB/s

Region

US-West / India

Scale

1-8 GPUs

On-demand

$4.80/GPU/hr

24h minimum

Slot

$3.20/GPU/hr

reserved

Quote now

NVIDIA B300

NVIDIA B300 chip

Blackwell Ultra confidential capacity for frontier inference.

Memory

288GB HBM3e

Bandwidth

8 TB/s

Region

US-East / US-West

Scale

1-8 GPUs

1-month

$6.50/GPU/hr

30d minimum

Slot

$5.60/GPU/hr

reserved

Prices include Intel TDX + NVIDIA confidential computing readiness. Volume and enterprise pricing are quoted by workload.

Quote price

Özel AI GPU planlaması için performans metrikleri

relative index

1x

H100

1.9x

H200

3.2x

B300

LLM çıkarımı

model + KV cache

80GB

H100

141GB

H200

288GB

B300

GPU belleği

feed batches

3.35TB/s

H100

4.8TB/s

H200

8TB/s

B300

Bellek bant genişliği

NVIDIA H100 chip

NVIDIA H100

80GB HBM3

NVIDIA H200 chip

NVIDIA H200

141GB HBM3e

NVIDIA B300 chip

NVIDIA B300

288GB HBM3e

GPU karşılaştırması

H100 vs H200 vs B300

Tekliften önce kapasite profilini karşılaştırın. H100 hızlı deneme yolu, H200 daha fazla bellek payı ekler ve B300, öncü çıkarım ile özel kümeler için Blackwell Ultra yoludur.

Tam aktarım hızı modele, batch boyutuna, hassasiyete ve çalışma zamanına bağlıdır. Phala, GPU’yu confidential VM yolu, GPU CC hazır oluşu ve attestation operasyonlarıyla birlikte fiyatlar.

GPU bulut maketi

Kanıt durumu olan kapasite şeritleri.

Pazar yeri görünümü, satın alma hareketini açıkça göstermeli: dene, rezerve et, ardından TEE hazırlığı eklenmiş ayrılmış kümeye ölçekle.

NVIDIA H100 chip

H100

80GB HBM3
NVIDIA H200 chip

H200

141GB HBM3e
NVIDIA B300 chip

B300

288GB HBM3e

doğrulanmış

CVM çalışma zamanı

doğrulanmış

GPU CC modu

doğrulanmış

Çift doğrulama

GPU TEE kanıt yolu

CVM yolu için Phala’nın ele aldıkları.

GPU izolasyonu ancak tüm yol — çalışma zamanı, GPU modu ve kanıt toplama — uçtan uca doğrulanabilir olduğunda faydalıdır. Phala üçünü birlikte sunar.

cvm-enclave · 80×24 · 24fpsdensity: .:-=+*#%@

01

CVM çalışma zamanı

Docker iş yükleri, GPU passthrough ile Intel TDX gizli VM içinde çalışır. Çalışma zamanı operatöre karşı mühürlenir ve iş yükü başlamadan önce firmware tarafından ölçülür.

gpu-cc · 80×22 · 24fpsdensity: .:-=+*#%@

02

GPU CC modu

NVIDIA Confidential Computing, model ağırlıklarını, aktivasyonları ve KV cache’i korumalı GPU belleği içinde mühürler. GPU, CPU TEE ile birlikte çalışma izolasyonunu uygular.

dual-attestation · 80×20 · 24fpsdensity: .:-=+*#%@

03

Çift doğrulama

Intel TDX ve NVIDIA ayrı ayrı imzalı quote üretir. Phala ikisini birden toplar ve tek bir doğrulayıcı üzerinden sunar; böylece CVM ve GPU birlikte kendilerini kanıtlar.

Satın alma yolları

Küçük başlayın. İşe yaradığında ayırın.

Pazar yeri, yapay zeka geliştiricilerinin GPU’ları gerçekte nasıl satın aldığına göre yapılandırılmıştır: hızlıca test et, iş yükü kendini kanıtladığında kapasite ayır, ardından küme üretim açısından kritik hale geldiğinde kurumsal anlaşmalara geç.

01 / İsteğe bağlı

24 saat içinde gizli bir GPU deneyin.

Özel çıkarım, model servisi veya kanıt üretimini doğrulayan geliştiriciler için kısa test pencereleri.

02 / Slot

Bir sonraki çalışmadan önce kapasite ayırın.

Sürekli eğitim, ince ayar ve benchmark pencereleri için öngörülebilir GPU erişimi.

03 / Kurumsal

TEE operasyonları olan ayrılmış kümeler.

TEE farkındalıklı altyapı desteği ve dağıtım planlamasıyla özel H100, H200 veya B300 anlaşmaları.

Yapay zeka çözüm yolları

Yapay zeka gizliliğe duyarlı verilere dokunduğunda özel modeller kullanın.

Özel model uç noktası ilk giriş noktasıdır. Aynı gizlilik ilkesi ajanlara, veri iş akışlarına ve eğitime de genişler.

LLM API

Özel AI çıkarımı

Promptların, çıktıların ve müşteri bağlamının kullanım sırasında şifreli korunması gereken OpenAI uyumlu model çağrılarını sunun.

Çözümü aç
encrypted

DeepSeek V3.1

128K

$0.27/M input

encrypted

Qwen3 Coder

256K

$0.40/M input

encrypted

Llama 3.3 70B

128K

$0.15/M input

encrypted

GPT OSS 120B

128K

$0.10/M input

encrypted

Claude Sonnet 4.5

200K

$3.00/M input

encrypted

Gemini 2.5 Pro

1M

$1.25/M input

Agents

Özel yapay zekâ temsilcileri

Ajanları, görülebilir bir otomasyon bulutu yerine anahtarlar, araçlar, bellek ve eylemlerle birlikte doğrulanmış bir çalışma zamanında çalıştırın.

Çözümü aç
Training

Özel model eğitimi

Veri kümelerini, gradyanları, checkpoint’leri ve değerlendirme izlerini sınırın içinde tutarken tescilli veriler üzerinde modelleri uyarlayın.

Çözümü aç

private training run

Observe without exposing weights.

H100 CC

01

dataset

sealed

02

fine-tune

running

03

eval

private

04

checkpoint

verified

loss curve

proof attached

attestation.json

Data

Private AI verisi

Modelleri hassas kayıtlara taşıyın ve ham veriyi model operatörüne açmadan onaylı çıktılar döndürün.

Çözümü aç

source

EHR data

source

Customer records

source

Internal docs

TEE clean room

query without raw access

approved output

aggregate only
no row exportproof linked
GPU TEE Cloud — H100/H200/B300 Confidential AI | Phala