Confidential AI Models

Private LLMs.
Verified results.

Frontier inference without exposing prompts, tools, or memory.

OpenAI-compatible APIs run inside hardware-backed TEEs and return proof of the runtime that handled the request.

AI-aanroepen dragen meer dan alleen een prompt.

TEE-grens

Phala private LLM

same SDK
TEE endpoint
hardwarebewijs

Private AI calls prompts, keys, tools, and memory stay inside the runtime. providers route the request without becoming the trust boundary. Proof follows the answer. verify GPU, container, model route, and response. same API shape, hardware-backed receipt, private inference. streaming, tool calls, and agent memory keep their normal developer flow. auditors can inspect evidence without reading the prompt. users get answers plus runtime proof, not another black box.

Private LLM catalog

Frontier models with private runtime.

OpenAI-compatible models with hardware-backed privacy and verification. Keep your SDK flow, change the endpoint, and copy the real call when you need it.

versleuteld

Qwen: Qwen3.5-122B-A10B

262K context

$0.46/M input

Bekijk details
versleuteld

Qwen: Qwen3 32B

41K context

$0.12/M input

Bekijk details
versleuteld

Google: Gemma 4 31B

262K context

$0.15/M input

Bekijk details
versleuteld

Qwen: Qwen3.6 35B A3B

262K context

$0.20/M input

Bekijk details
versleuteld

DeepSeek: DeepSeek V4 Pro

800K context

$1.50/M input

Bekijk details
versleuteld

Phala: Gemma-4 26B-A4B Uncensored (Heretic)

66K context

$0.15/M input

Bekijk details
versleuteld

Phala: Qwen3.6 35B-A3B Uncensored (Aggressive)

131K context

$0.30/M input

Bekijk details
versleuteld

MoonshotAI: Kimi K2.6

262K context

$1.09/M input

Bekijk details
versleuteld

Z.ai: GLM 5.1

203K context

$1.21/M input

Bekijk details
versleuteld

Qwen: Qwen3.5-27B

262K context

$0.30/M input

Bekijk details
versleuteld

Qwen: Qwen3.5 397B A17B

262K context

$0.55/M input

Bekijk details
versleuteld

MiniMax: MiniMax M2.5

197K context

$0.20/M input

Bekijk details
Model requests are routed through confidential AI providers with TEE support.
Check all

Integrate in minutes

Same SDK, Change Endpoint, Verify E2EE.

Keep your OpenAI-compatible client. Point it at the private endpoint, choose a Phala model slug, and read the proof when the output needs an audit trail.

selected proof

Private LLM Gateway

The OpenAI-compatible endpoint terminates inside the verified gateway boundary.

reporttls_endpointreceiptgateway_app_idstatusverified
app_idlinked
endpointlinked
policylinked
app_certlinked
drag · zoom · click node

AI-oplossingspaden

Gebruik privé-modellen waar AI met geheimen werkt.

Het endpoint voor het privé-model is het eerste toegangspunt. Hetzelfde privacy-gebouwblok breidt zich uit naar agents, datastromen en training.

LLM API

Private AI-inference

Bied OpenAI-compatibele modelaanroepen aan waarbij prompts, outputs en klantcontext versleutelde-bij-gebruik bescherming nodig hebben.

Open oplossing
encrypted

DeepSeek V3.1

128K

$0.27/M input

encrypted

Qwen3 Coder

256K

$0.40/M input

encrypted

Llama 3.3 70B

128K

$0.15/M input

encrypted

GPT OSS 120B

128K

$0.10/M input

encrypted

Claude Sonnet 4.5

200K

$3.00/M input

encrypted

Gemini 2.5 Pro

1M

$1.25/M input

Agents

Privé AI-agents

Laat agents draaien met sleutels, tools, geheugen en acties binnen een geverifieerde runtime in plaats van een zichtbare automation cloud.

Open oplossing
Training

Privémodeltraining

Pas modellen aan op propriëtaire data terwijl datasets, gradients, checkpoints en evaluatietraces binnen de grens blijven.

Open oplossing

private training run

Observe without exposing weights.

H100 CC

01

dataset

sealed

02

fine-tune

running

03

eval

private

04

checkpoint

verified

loss curve

proof attached

attestation.json

Data

Privé AI-data

Verplaats modellen naar gevoelige records en geef goedgekeurde outputs terug zonder ruwe data bloot te stellen aan de modeloperator.

Open oplossing

source

EHR data

source

Customer records

source

Internal docs

TEE clean room

query without raw access

approved output

aggregate only
no row exportproof linked

Vragen

Wat teams vragen voordat ze overstappen.

Private LLM's zijn niet zomaar een endpoint. Het is een keuze tussen SaaS-gemak en zelf beheerde AI-infrastructuur.

1

Waarin verschilt dit van een normale LLM API?

Een normale LLM API verwacht dat je de providergrens vertrouwt. Phala draait de modeloproep binnen hardware-ondersteunde TEE’s en kan runtime-bewijs toevoegen dat laat zien wat de aanvraag beschermde.

2

Hoe verschilt dit van modellen on-prem draaien?

On-prem geeft controle, maar jij beheert GPU’s, modelserving, upgrades en capaciteit. Phala behoudt de API-workflow en voegt private uitvoering en verifieerbare runtime-status toe.

3

Hoe moeilijk is het om privé LLM's te integreren in mijn bestaande app?

Gebruik de OpenAI-compatibele API-vorm: wijzig de basis-URL, selecteer een private modelslug en houd je bestaande SDK of agentframework.

4

Welke modeltypen zijn beschikbaar?

De catalogus bevat coding-, reasoning-, algemene chat- en open-weight-modelfamilies van providers zoals DeepSeek, Qwen, Meta, Mistral, Google en OpenAI OSS.

5

Hoe kunnen klanten verifiëren dat gegevens beschermd waren?

Het Trust Center zet attestatierapporten om in een inspecteerbare weergave van hardware-, bron-, runtime- en netwerkverificatiestatus.

6

Wanneer moet ik een dedicated private stack gebruiken?

Gebruik een dedicated stack wanneer je custom modellen, gereserveerde GPU’s, klant-specifieke deployments of een sterkere compliance- en auditgrens nodig hebt dan shared inference biedt.

Begin met bouwen

Bouw AI die je kunt bewijzen.

Implementeer private workloads, verifieer uitvoering en schaal van modellen tot GPU-jobs.