GPU TEE Marketplace

TEE-ready GPUs for AI builders.

Name: GPU TEE - Confidential GPU Computing
Brand: Phala
Price: 50.37 USD
Availability: InStock
Rating: 4.8 (127 reviews)

H100, H200, and B300 capacity with CVMs, dual attestation, and TEE-aware operations.

Trial a machine for 24 hours, reserve a slot, or quote dedicated clusters. Phala handles the hard part: confidential GPUs, Intel TDX runtime, NVIDIA attestation, and the DevOps required to keep it working.

Trial nowQuote price

Confidential GPU cloud

Capacity first. Proof after the workload runs.

H100 / H200 / B300

hardware proof rail

H100, H200, and B300 move through one verifiable GPU path.

GPU TEE

H100

GPU TEE

H200

GPU TEE

B300

Trial

24h minimum

Reserve

slots and clusters

Verify

CVM + GPU evidence

Marketplace inventory

Capacity with proof built in.

Pick a GPU for a 24-hour trial, reserve a slot for sustained jobs, or quote a dedicated cluster. Every path starts from TEE-ready infrastructure instead of a raw GPU box.

Trial ready

NVIDIA H100

Proven confidential inference and fine-tuning capacity.

Memory

80GB HBM3

Bandwidth

3.35 TB/s

Region

US-West

Scale

1-2 GPUs

On-demand

$3.08/GPU/hr

24h minimum

Slot

$2.38/GPU/hr

reserved

Trial now Details

Slot ready

NVIDIA H200

High-memory runtime for larger private model jobs.

Memory

141GB HBM3e

Bandwidth

4.8 TB/s

Region

US-West / India

Scale

1-8 GPUs

On-demand

$4.80/GPU/hr

24h minimum

Slot

$3.20/GPU/hr

reserved

Trial now Details

Quote now

NVIDIA B300

Blackwell Ultra confidential capacity for frontier inference.

Memory

288GB HBM3e

Bandwidth

8 TB/s

Region

US-East / US-West

Scale

1-8 GPUs

1-month

$6.50/GPU/hr

30d minimum

Slot

$5.60/GPU/hr

reserved

Trial now Details

Prices include Intel TDX + NVIDIA confidential computing readiness. Volume and enterprise pricing are quoted by workload.

Quote price

Leistungsmetriken für private AI GPU-Planung

H100

H200

B300

relative index

H100

1.9x

H200

3.2x

B300

LLM-Inferenz

model + KV cache

80GB

H100

141GB

H200

288GB

B300

GPU-Speicher

feed batches

3.35TB/s

H100

4.8TB/s

H200

8TB/s

B300

Speicherbandbreite

NVIDIA H100

80GB HBM3

NVIDIA H200

141GB HBM3e

NVIDIA B300

288GB HBM3e

GPU-Vergleich

H100 vs H200 vs B300

Vergleichen Sie die Kapazitätsform vor dem Angebot. H100 ist der schnelle Trial-Pfad, H200 bietet mehr Speicherpuffer, und B300 ist der Blackwell-Ultra-Pfad für Frontier-Inference und dedizierte Cluster.

Der exakte Durchsatz hängt von Modell, Batch-Größe, Präzision und Runtime ab. Phala nennt die GPU zusammen mit dem vertraulichen VM-Pfad, GPU-CC-Readiness und Attestierungs-Operationen.

Mockup der GPU-Cloud

Kapazitäts-Lanes mit Proof-Status.

Die Marketplace-Ansicht sollte die Kaufbewegung klar machen: testen, reservieren, dann in einen dedizierten Cluster mit angehängter TEE-Bereitschaft skalieren.

H100

80GB HBM3

from

$3.08/hr

H200

141GB HBM3e

from

$4.80/hr

B300

288GB HBM3e

from

$6.50/hr

verifiziert

CVM-Runtime

verifiziert

GPU-CC-Modus

verifiziert

Duale Attestation

GPU-TEE-Beweispfad

Was Phala für den CVM-Pfad übernimmt.

GPU-Isolation ist nur dann nützlich, wenn die gesamte Kette — Laufzeit, GPU-Modus und Evidenzsammlung — Ende-zu-Ende verifizierbar ist. Phala liefert alle drei zusammen.

                                                                                
                                                                                
                                                                                
                                                                                
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++                         
                         ++++++++++++++++++++++++++++++

cvm-enclave · 80×24 · 24fpsdensity: .:-=+*#%@

CVM-Runtime

Docker-Workloads laufen in einer Intel-TDX-Confidential-VM mit GPU-Passthrough. Die Laufzeit ist gegen den Betreiber abgeschottet und wird vor dem Start des Workloads per Firmware gemessen.

                                                                                
                                                                                
      @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@      
      @                                                                  @      
      @  @@@@ @@@@ @@@@ @@@@ @@@@ @@@@ @@@@ @@@@ @@@@ @@@@ @@@@ @@@@ @   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @  ...: :::: :... .::: :::: ...: :::: ::.. .::: :::: ...: :::: :   @      
      @                                                                  @      
      @@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@

gpu-cc · 80×22 · 24fpsdensity: .:-=+*#%@

GPU-CC-Modus

NVIDIA Confidential Computing versiegelt Modellgewichte, Aktivierungen und KV-Cache im geschützten GPU-Speicher. Die GPU erzwingt die Rechenisolation zusammen mit der CPU TEE.

                                                                                
                                                                                
                                                                                
     @@@@@@@@@@@@                                                               
     @=--::--=++@+-:.                                                           
     @=--::--=++@#*+-::....                                                     
     @@@@@@@@@@@@        ...........                                            
                                   ..........                  @@@@@@@@@@@@@    
                                            ...........        @======++***@    
                                                     ..........@=====++****@    
                                                     ..........@====++*****@    
                                       .::::...........        @===++******@    
                                  .:-*%@@%*-:.                 @@@@@@@@@@@@@    
     @@@@@@@@@@@@        ...........::::.                                       
     @:::-==++++@..........                                                     
     @:::-==++++@                                                               
     @@@@@@@@@@@@

dual-attestation · 80×20 · 24fpsdensity: .:-=+*#%@

Duale Attestation

Intel TDX und NVIDIA erzeugen jeweils einen signierten Quote. Phala sammelt beide und stellt sie über einen einzigen Verifier bereit, sodass CVM und GPU gemeinsam ihren Nachweis erbringen.

Kaufpfade

Klein anfangen. Bei Erfolg reservieren.

Der Marktplatz ist so strukturiert, wie KI-Builder GPUs tatsächlich kaufen: schnell testen, Kapazität reservieren, wenn sich ein Workload bewährt, und dann auf Enterprise-Deals umsteigen, sobald der Cluster produktionskritisch wird.

01 / On-Demand

Teste innerhalb von 24 Stunden eine vertrauliche GPU.

Kurze Testfenster für Builder, die private Inferenz, Model-Serving oder Proof-Generierung validieren.

Jetzt testen

02 / Slot

Kapazität vor dem nächsten Lauf reservieren.

Planbarer GPU-Zugriff für längere Trainings-, Fine-Tuning- und Benchmark-Fenster.

Preis anfragen

03 / Unternehmen

Dedizierte Cluster mit TEE-Betrieb.

Individuelle H100-, H200- oder B300-Deals mit TEE-bewusster Infrastrukturunterstützung und Deploy-Planung.

Mit dem Vertrieb sprechen

KI-Lösungswege

Use GPU TEE where AI touches secrets.

GPU capacity is one part of the privacy boundary. The same confidential compute path supports private inference, agents, training, and data workflows.

LLM API

Private AI-Inferenz

OpenAI-kompatible Modellaufrufe bereitstellen, bei denen Prompts, Outputs und Kundenkontext Schutz durch Verschlüsselung während der Nutzung benötigen.

Lösung öffnen

Agents

Private KI-Agenten

Agenten mit Schlüsseln, Tools, Speicher und Aktionen in einer verifizierten Laufzeit ausführen statt in einer sichtbaren Automatisierungs-Cloud.

Lösung öffnen

Training

Private Modelltrainings

Passe Modelle an proprietäre Daten an, während Datensätze, Gradients, Checkpoints und Evaluations-Traces innerhalb der Grenze bleiben.

Lösung öffnen

Data

Private KI-Daten

Modelle zu sensiblen Datensätzen verschieben und freigegebene Ausgaben zurückgeben, ohne Rohdaten dem Modellbetreiber offenzulegen.

Lösung öffnen

Private Ausführung. Verifizierbare Ergebnisse.

Newsletter

GPU TEE Cloud — H100/H200/B300 Confidential AI | Phala