Trial ready
NVIDIA H100

Proven confidential inference and fine-tuning capacity.
Memory
80GB HBM3
Bandwidth
3.35 TB/s
Region
US-West
Scale
1-2 GPUs
On-demand
$3.08/GPU/hr
24h minimum
Slot
$2.38/GPU/hr
reserved
GPU TEE Marketplace
H100, H200, and B300 capacity with CVMs, dual attestation, and TEE-aware operations.
Trial a machine for 24 hours, reserve a slot, or quote dedicated clusters. Phala handles the hard part: confidential GPUs, Intel TDX runtime, NVIDIA attestation, and the DevOps required to keep it working.
Confidential GPU cloud



hardware proof rail
GPU TEE
H100
GPU TEE
H200
GPU TEE
B300
Trial
24h minimum
Reserve
slots and clusters
Verify
CVM + GPU evidence
Marketplace inventory
Pick a GPU for a 24-hour trial, reserve a slot for sustained jobs, or quote a dedicated cluster. Every path starts from TEE-ready infrastructure instead of a raw GPU box.
Trial ready

Proven confidential inference and fine-tuning capacity.
Memory
80GB HBM3
Bandwidth
3.35 TB/s
Region
US-West
Scale
1-2 GPUs
On-demand
$3.08/GPU/hr
24h minimum
Slot
$2.38/GPU/hr
reserved
Slot ready

High-memory runtime for larger private model jobs.
Memory
141GB HBM3e
Bandwidth
4.8 TB/s
Region
US-West / India
Scale
1-8 GPUs
On-demand
$4.80/GPU/hr
24h minimum
Slot
$3.20/GPU/hr
reserved
Quote now

Blackwell Ultra confidential capacity for frontier inference.
Memory
288GB HBM3e
Bandwidth
8 TB/s
Region
US-East / US-West
Scale
1-8 GPUs
1-month
$6.50/GPU/hr
30d minimum
Slot
$5.60/GPU/hr
reserved
Prices include Intel TDX + NVIDIA confidential computing readiness. Volume and enterprise pricing are quoted by workload.
relative index
1x
1.9x
3.2x
LLM-inferentie
model + KV cache
80GB
141GB
288GB
GPU-geheugen
feed batches
3.35TB/s
4.8TB/s
8TB/s
Geheugenbandbreedte

NVIDIA H100
80GB HBM3

NVIDIA H200
141GB HBM3e

NVIDIA B300
288GB HBM3e
GPU-vergelijking
Vergelijk eerst de capaciteitsvorm vóór de offerte. H100 is het snelle proefpad, H200 voegt extra geheugenruimte toe, en B300 is het Blackwell Ultra-pad voor frontier inference en dedicated clusters.
De exacte throughput hangt af van model, batchgrootte, precisie en runtime. Phala vermeldt de GPU samen met het vertrouwelijke VM-pad, GPU CC-gereedheid en attesteringsoperaties.
Mockup van GPU-cloud
De marketplace-weergave moet de aankoopstroom duidelijk maken: proberen, reserveren, dan opschalen naar een dedicated cluster met TEE-gereedheid erbij.

H100
80GB HBM3from
$3.08/hr

H200
141GB HBM3efrom
$4.80/hr

B300
288GB HBM3efrom
$6.50/hr
geverifieerd
CVM-runtime
geverifieerd
GPU CC-modus
geverifieerd
Dubbele attestation
GPU TEE-proofpad
GPU-isolatie is alleen nuttig wanneer het volledige pad — runtime, GPU-modus en evidence-collectie — end-to-end verifieerbaar is. Phala levert alle drie samen.
01
Docker-workloads draaien in een Intel TDX-confidential VM met GPU passthrough. De runtime is afgeschermd tegen de operator en wordt vóór start van de workload door firmware gemeten.
02
NVIDIA Confidential Computing verzegelt modelgewichten, activaties en KV-cache in beschermd GPU-geheugen. De GPU handhaaft compute-isolatie naast de CPU TEE.
03
Intel TDX en NVIDIA geven elk een ondertekende quote af. Phala verzamelt beide en biedt ze via één verifier aan, zodat de CVM en de GPU samen bewijzen dat ze echt zijn.
Aankooproutes
De marketplace is ingericht rond hoe AI-builders GPU’s echt inkopen: snel testen, capaciteit reserveren zodra een workload is bewezen, en daarna overstappen op enterprise-deals wanneer het cluster productie-kritisch wordt.
01 / Op aanvraag
Korte testvensters voor builders die private inference, modelserving of proof generation valideren.
02 / Slot
Voorspelbare GPU-toegang voor langdurige training, fine-tuning en benchmarkvensters.
03 / Enterprise
Aangepaste deals voor H100, H200 of B300 met TEE-bewuste infrastructuurondersteuning en deploymentplanning.
AI-oplossingspaden
Het endpoint voor het privé-model is het eerste toegangspunt. Hetzelfde privacy-gebouwblok breidt zich uit naar agents, datastromen en training.
Bied OpenAI-compatibele modelaanroepen aan waarbij prompts, outputs en klantcontext versleutelde-bij-gebruik bescherming nodig hebben.
128K
$0.27/M input
256K
$0.40/M input
128K
$0.15/M input
128K
$0.10/M input
200K
$3.00/M input
1M
$1.25/M input
Laat agents draaien met sleutels, tools, geheugen en acties binnen een geverifieerde runtime in plaats van een zichtbare automation cloud.
Pas modellen aan op propriëtaire data terwijl datasets, gradients, checkpoints en evaluatietraces binnen de grens blijven.
private training run
01
sealed
02
running
03
private
04
verified
loss curve
proof attached
attestation.json
Verplaats modellen naar gevoelige records en geef goedgekeurde outputs terug zonder ruwe data bloot te stellen aan de modeloperator.
source
EHR data
source
Customer records
source
Internal docs
TEE clean room
approved output
© 2026 Hashforest Technology. Alle rechten voorbehouden. Privacy • Voorwaarden