Trial ready
NVIDIA H100

Proven confidential inference and fine-tuning capacity.
Memory
80GB HBM3
Bandwidth
3.35 TB/s
Region
US-West
Scale
1-2 GPUs
On-demand
$3.08/GPU/hr
24h minimum
Slot
$2.38/GPU/hr
reserved
GPU TEE Marketplace
H100, H200, and B300 capacity with CVMs, dual attestation, and TEE-aware operations.
Trial a machine for 24 hours, reserve a slot, or quote dedicated clusters. Phala handles the hard part: confidential GPUs, Intel TDX runtime, NVIDIA attestation, and the DevOps required to keep it working.
Confidential GPU cloud



hardware proof rail
GPU TEE
H100
GPU TEE
H200
GPU TEE
B300
Trial
24h minimum
Reserve
slots and clusters
Verify
CVM + GPU evidence
Marketplace inventory
Pick a GPU for a 24-hour trial, reserve a slot for sustained jobs, or quote a dedicated cluster. Every path starts from TEE-ready infrastructure instead of a raw GPU box.
Trial ready

Proven confidential inference and fine-tuning capacity.
Memory
80GB HBM3
Bandwidth
3.35 TB/s
Region
US-West
Scale
1-2 GPUs
On-demand
$3.08/GPU/hr
24h minimum
Slot
$2.38/GPU/hr
reserved
Slot ready

High-memory runtime for larger private model jobs.
Memory
141GB HBM3e
Bandwidth
4.8 TB/s
Region
US-West / India
Scale
1-8 GPUs
On-demand
$4.80/GPU/hr
24h minimum
Slot
$3.20/GPU/hr
reserved
Quote now

Blackwell Ultra confidential capacity for frontier inference.
Memory
288GB HBM3e
Bandwidth
8 TB/s
Region
US-East / US-West
Scale
1-8 GPUs
1-month
$6.50/GPU/hr
30d minimum
Slot
$5.60/GPU/hr
reserved
Prices include Intel TDX + NVIDIA confidential computing readiness. Volume and enterprise pricing are quoted by workload.
relative index
1x
1.9x
3.2x
LLM-Inferenz
model + KV cache
80GB
141GB
288GB
GPU-Speicher
feed batches
3.35TB/s
4.8TB/s
8TB/s
Speicherbandbreite

NVIDIA H100
80GB HBM3

NVIDIA H200
141GB HBM3e

NVIDIA B300
288GB HBM3e
GPU-Vergleich
Vergleichen Sie die Kapazitätsform vor dem Angebot. H100 ist der schnelle Trial-Pfad, H200 bietet mehr Speicherpuffer, und B300 ist der Blackwell-Ultra-Pfad für Frontier-Inference und dedizierte Cluster.
Der exakte Durchsatz hängt von Modell, Batch-Größe, Präzision und Runtime ab. Phala nennt die GPU zusammen mit dem vertraulichen VM-Pfad, GPU-CC-Readiness und Attestierungs-Operationen.
Mockup der GPU-Cloud
Die Marketplace-Ansicht sollte die Kaufbewegung klar machen: testen, reservieren, dann in einen dedizierten Cluster mit angehängter TEE-Bereitschaft skalieren.

H100
80GB HBM3from
$3.08/hr

H200
141GB HBM3efrom
$4.80/hr

B300
288GB HBM3efrom
$6.50/hr
verifiziert
CVM-Runtime
verifiziert
GPU-CC-Modus
verifiziert
Duale Attestation
GPU-TEE-Beweispfad
GPU-Isolation ist nur dann nützlich, wenn die gesamte Kette — Laufzeit, GPU-Modus und Evidenzsammlung — Ende-zu-Ende verifizierbar ist. Phala liefert alle drei zusammen.
01
Docker-Workloads laufen in einer Intel-TDX-Confidential-VM mit GPU-Passthrough. Die Laufzeit ist gegen den Betreiber abgeschottet und wird vor dem Start des Workloads per Firmware gemessen.
02
NVIDIA Confidential Computing versiegelt Modellgewichte, Aktivierungen und KV-Cache im geschützten GPU-Speicher. Die GPU erzwingt die Rechenisolation zusammen mit der CPU TEE.
03
Intel TDX und NVIDIA erzeugen jeweils einen signierten Quote. Phala sammelt beide und stellt sie über einen einzigen Verifier bereit, sodass CVM und GPU gemeinsam ihren Nachweis erbringen.
Kaufpfade
Der Marktplatz ist so strukturiert, wie KI-Builder GPUs tatsächlich kaufen: schnell testen, Kapazität reservieren, wenn sich ein Workload bewährt, und dann auf Enterprise-Deals umsteigen, sobald der Cluster produktionskritisch wird.
01 / On-Demand
Kurze Testfenster für Builder, die private Inferenz, Model-Serving oder Proof-Generierung validieren.
02 / Slot
Planbarer GPU-Zugriff für längere Trainings-, Fine-Tuning- und Benchmark-Fenster.
03 / Unternehmen
Individuelle H100-, H200- oder B300-Deals mit TEE-bewusster Infrastrukturunterstützung und Deploy-Planung.
KI-Lösungswege
Der private Modell-Endpunkt ist der erste Einstiegspunkt. Dieselbe Datenschutz-Primitive lässt sich auf Agents, Daten-Workflows und Training ausweiten.
OpenAI-kompatible Modellaufrufe bereitstellen, bei denen Prompts, Outputs und Kundenkontext Schutz durch Verschlüsselung während der Nutzung benötigen.
128K
$0.27/M input
256K
$0.40/M input
128K
$0.15/M input
128K
$0.10/M input
200K
$3.00/M input
1M
$1.25/M input
Agenten mit Schlüsseln, Tools, Speicher und Aktionen in einer verifizierten Laufzeit ausführen statt in einer sichtbaren Automatisierungs-Cloud.
Passe Modelle an proprietäre Daten an, während Datensätze, Gradients, Checkpoints und Evaluations-Traces innerhalb der Grenze bleiben.
private training run
01
sealed
02
running
03
private
04
verified
loss curve
proof attached
attestation.json
Modelle zu sensiblen Datensätzen verschieben und freigegebene Ausgaben zurückgeben, ohne Rohdaten dem Modellbetreiber offenzulegen.
source
EHR data
source
Customer records
source
Internal docs
TEE clean room
approved output
© 2026 Hashforest Technology. Alle Rechte vorbehalten. Datenschutz • Nutzungsbedingungen