Confidential AI Models

Private LLMs.
Verified results.

Name: Confidential AI Models
Brand: Phala
Price: 50.37 USD
Availability: InStock
Rating: 4.8 (127 reviews)

Frontier inference without exposing prompts, tools, or memory.

OpenAI-compatible APIs run inside hardware-backed TEEs and return proof of the runtime that handled the request.

Call a private LLM View models Talk to sales

AI-aanroepen dragen meer dan alleen een prompt.

TEE-grens

Phala private LLM

same SDK

TEE endpoint

hardwarebewijs

Private LLM catalog

Frontier models with private runtime.

OpenAI-compatible models with hardware-backed privacy and verification. Keep your SDK flow, change the endpoint, and copy the real call when you need it.

versleuteld

Z.ai: GLM 5.2

1.0M context

$1.40/M input

Bekijk details

versleuteld

Qwen: Qwen3.6 27B

262K context

$0.32/M input

Bekijk details

versleuteld

DeepSeek: DeepSeek V4 Flash

1.0M context

$0.20/M input

Bekijk details

versleuteld

Qwen: Qwen3.5-122B-A10B

262K context

$0.46/M input

Bekijk details

versleuteld

Qwen: Qwen3 32B

41K context

$0.12/M input

Bekijk details

versleuteld

Google: Gemma 4 31B

262K context

$0.15/M input

Bekijk details

versleuteld

Qwen: Qwen3.6 35B A3B

262K context

$0.20/M input

Bekijk details

versleuteld

DeepSeek: DeepSeek V4 Pro

800K context

$1.50/M input

Bekijk details

versleuteld

Phala: Gemma-4 26B-A4B Uncensored (Heretic)

66K context

$0.15/M input

Bekijk details

versleuteld

Phala: Qwen3.6 35B-A3B Uncensored (Aggressive)

131K context

$0.30/M input

Bekijk details

versleuteld

MoonshotAI: Kimi K2.6

262K context

$1.09/M input

Bekijk details

versleuteld

Z.ai: GLM 5.1

203K context

$1.21/M input

Bekijk details

Model requests are routed through confidential AI providers with TEE support.

Check all

Integrate in minutes

Same SDK, Change Endpoint, Verify E2EE.

Keep your OpenAI-compatible client. Point it at the private endpoint, choose a Phala model slug, and read the proof when the output needs an audit trail.

selected proof

Private LLM Gateway

The OpenAI-compatible endpoint terminates inside the verified gateway boundary.

reporttls_endpointreceiptgateway_app_idstatusverified

app_idlinked

endpointlinked

policylinked

app_certlinked

drag · zoom · click node

View Trust Center Read model docs

AI-oplossingspaden

Gebruik privé-modellen waar AI met geheimen werkt.

Het endpoint voor het privé-model is het eerste toegangspunt. Hetzelfde privacy-gebouwblok breidt zich uit naar agents, datastromen en training.

LLM API

Private AI-inference

Bied OpenAI-compatibele modelaanroepen aan waarbij prompts, outputs en klantcontext versleutelde-bij-gebruik bescherming nodig hebben.

Open oplossing

encrypted

DeepSeek V3.1

128K

$0.27/M input

encrypted

Qwen3 Coder

256K

$0.40/M input

encrypted

Llama 3.3 70B

128K

$0.15/M input

encrypted

GPT OSS 120B

128K

$0.10/M input

encrypted

Claude Sonnet 4.5

200K

$3.00/M input

encrypted

Gemini 2.5 Pro

$1.25/M input

Agents

Privé AI-agents

Laat agents draaien met sleutels, tools, geheugen en acties binnen een geverifieerde runtime in plaats van een zichtbare automation cloud.

Open oplossing

Training

Privémodeltraining

Pas modellen aan op propriëtaire data terwijl datasets, gradients, checkpoints en evaluatietraces binnen de grens blijven.

Open oplossing

private training run

Observe without exposing weights.

H100 CC

dataset

sealed

fine-tune

running

eval

private

checkpoint

verified

loss curve

proof attached

attestation.json

Data

Privé AI-data

Verplaats modellen naar gevoelige records en geef goedgekeurde outputs terug zonder ruwe data bloot te stellen aan de modeloperator.

Open oplossing

source

EHR data

source

Customer records

source

Internal docs

TEE clean room

query without raw access

approved output

aggregate only

no row exportproof linked

Vragen

Wat teams vragen voordat ze overstappen.

Private LLM's zijn niet zomaar een endpoint. Het is een keuze tussen SaaS-gemak en zelf beheerde AI-infrastructuur.

Waarin verschilt dit van een normale LLM API?

Een normale LLM API verwacht dat je de providergrens vertrouwt. Phala draait de modeloproep binnen hardware-ondersteunde TEE’s en kan runtime-bewijs toevoegen dat laat zien wat de aanvraag beschermde.

Hoe verschilt dit van modellen on-prem draaien?

On-prem geeft controle, maar jij beheert GPU’s, modelserving, upgrades en capaciteit. Phala behoudt de API-workflow en voegt private uitvoering en verifieerbare runtime-status toe.

Hoe moeilijk is het om privé LLM's te integreren in mijn bestaande app?

Gebruik de OpenAI-compatibele API-vorm: wijzig de basis-URL, selecteer een private modelslug en houd je bestaande SDK of agentframework.

Welke modeltypen zijn beschikbaar?

De catalogus bevat coding-, reasoning-, algemene chat- en open-weight-modelfamilies van providers zoals DeepSeek, Qwen, Meta, Mistral, Google en OpenAI OSS.

Hoe kunnen klanten verifiëren dat gegevens beschermd waren?

Het Trust Center zet attestatierapporten om in een inspecteerbare weergave van hardware-, bron-, runtime- en netwerkverificatiestatus.

Wanneer moet ik een dedicated private stack gebruiken?

Gebruik een dedicated stack wanneer je custom modellen, gereserveerde GPU’s, klant-specifieke deployments of een sterkere compliance- en auditgrens nodig hebt dan shared inference biedt.

Begin met bouwen

Bouw AI die je kunt bewijzen.

Implementeer private workloads, verifieer uitvoering en schaal van modellen tot GPU-jobs.

Begin met bouwen Dashboard openen Neem contact op met sales

Private uitvoering. Verifieerbare resultaten.

Nieuwsbrief

Private LLMs.Verified results.

AI-aanroepen dragen meer dan alleen een prompt.

Phala private LLM

Traditional AI

Confidential AI

Frontier models with private runtime.

Same SDK, Change Endpoint, Verify E2EE.

Private LLM Gateway

Private LLM Gateway

Gateway Code

Gateway Attestation

Event Logs for RTMRs

Key Management Service

KMS Code

Model Runtime

Response Receipt

Gebruik privé-modellen waar AI met geheimen werkt.

Private AI-inference

DeepSeek V3.1

Qwen3 Coder

Llama 3.3 70B

GPT OSS 120B

Claude Sonnet 4.5

Gemini 2.5 Pro

Privé AI-agents

Privémodeltraining

Observe without exposing weights.

dataset

fine-tune

eval

checkpoint

Privé AI-data

query without raw access

aggregate only

Wat teams vragen voordat ze overstappen.

Waarin verschilt dit van een normale LLM API?

Hoe verschilt dit van modellen on-prem draaien?

Hoe moeilijk is het om privé LLM's te integreren in mijn bestaande app?

Welke modeltypen zijn beschikbaar?

Hoe kunnen klanten verifiëren dat gegevens beschermd waren?

Wanneer moet ik een dedicated private stack gebruiken?

Bouw AI die je kunt bewijzen.

Private LLMs.
Verified results.