Confidential AI Models

Private LLMs.
Verified results.

Frontier inference without exposing prompts, tools, or memory.

OpenAI-compatible APIs run inside hardware-backed TEEs and return proof of the runtime that handled the request.

AI çağrıları yalnızca istemden ibaret değildir.

TEE sınırı

Phala özel LLM

same SDK
TEE endpoint
donanım makbuzu

Private AI calls prompts, keys, tools, and memory stay inside the runtime. providers route the request without becoming the trust boundary. Proof follows the answer. verify GPU, container, model route, and response. same API shape, hardware-backed receipt, private inference. streaming, tool calls, and agent memory keep their normal developer flow. auditors can inspect evidence without reading the prompt. users get answers plus runtime proof, not another black box.

Private LLM catalog

Frontier models with private runtime.

OpenAI-compatible models with hardware-backed privacy and verification. Keep your SDK flow, change the endpoint, and copy the real call when you need it.

şifreli

Qwen: Qwen3.5-122B-A10B

262K bağlam

$0.46/M input

Ayrıntıyı kontrol edin
şifreli

Qwen: Qwen3 32B

41K bağlam

$0.12/M input

Ayrıntıyı kontrol edin
şifreli

Google: Gemma 4 31B

262K bağlam

$0.15/M input

Ayrıntıyı kontrol edin
şifreli

Qwen: Qwen3.6 35B A3B

262K bağlam

$0.20/M input

Ayrıntıyı kontrol edin
şifreli

DeepSeek: DeepSeek V4 Pro

800K bağlam

$1.50/M input

Ayrıntıyı kontrol edin
şifreli

Phala: Gemma-4 26B-A4B Uncensored (Heretic)

66K bağlam

$0.15/M input

Ayrıntıyı kontrol edin
şifreli

Phala: Qwen3.6 35B-A3B Uncensored (Aggressive)

131K bağlam

$0.30/M input

Ayrıntıyı kontrol edin
şifreli

MoonshotAI: Kimi K2.6

262K bağlam

$1.09/M input

Ayrıntıyı kontrol edin
şifreli

Z.ai: GLM 5.1

203K bağlam

$1.21/M input

Ayrıntıyı kontrol edin
şifreli

Qwen: Qwen3.5-27B

262K bağlam

$0.30/M input

Ayrıntıyı kontrol edin
şifreli

Qwen: Qwen3.5 397B A17B

262K bağlam

$0.55/M input

Ayrıntıyı kontrol edin
şifreli

MiniMax: MiniMax M2.5

197K bağlam

$0.20/M input

Ayrıntıyı kontrol edin
Model requests are routed through confidential AI providers with TEE support.
Check all

Integrate in minutes

Same SDK, Change Endpoint, Verify E2EE.

Keep your OpenAI-compatible client. Point it at the private endpoint, choose a Phala model slug, and read the proof when the output needs an audit trail.

selected proof

Private LLM Gateway

The OpenAI-compatible endpoint terminates inside the verified gateway boundary.

reporttls_endpointreceiptgateway_app_idstatusverified
app_idlinked
endpointlinked
policylinked
app_certlinked
drag · zoom · click node

Yapay zeka çözüm yolları

Yapay zeka gizliliğe duyarlı verilere dokunduğunda özel modeller kullanın.

Özel model uç noktası ilk giriş noktasıdır. Aynı gizlilik ilkesi ajanlara, veri iş akışlarına ve eğitime de genişler.

LLM API

Özel AI çıkarımı

Promptların, çıktıların ve müşteri bağlamının kullanım sırasında şifreli korunması gereken OpenAI uyumlu model çağrılarını sunun.

Çözümü aç
encrypted

DeepSeek V3.1

128K

$0.27/M input

encrypted

Qwen3 Coder

256K

$0.40/M input

encrypted

Llama 3.3 70B

128K

$0.15/M input

encrypted

GPT OSS 120B

128K

$0.10/M input

encrypted

Claude Sonnet 4.5

200K

$3.00/M input

encrypted

Gemini 2.5 Pro

1M

$1.25/M input

Agents

Özel yapay zekâ temsilcileri

Ajanları, görülebilir bir otomasyon bulutu yerine anahtarlar, araçlar, bellek ve eylemlerle birlikte doğrulanmış bir çalışma zamanında çalıştırın.

Çözümü aç
Training

Özel model eğitimi

Veri kümelerini, gradyanları, checkpoint’leri ve değerlendirme izlerini sınırın içinde tutarken tescilli veriler üzerinde modelleri uyarlayın.

Çözümü aç

private training run

Observe without exposing weights.

H100 CC

01

dataset

sealed

02

fine-tune

running

03

eval

private

04

checkpoint

verified

loss curve

proof attached

attestation.json

Data

Private AI verisi

Modelleri hassas kayıtlara taşıyın ve ham veriyi model operatörüne açmadan onaylı çıktılar döndürün.

Çözümü aç

source

EHR data

source

Customer records

source

Internal docs

TEE clean room

query without raw access

approved output

aggregate only
no row exportproof linked

Sorular

Ekiplerin geçmeden önce sorduğu sorular.

Özel LLM’ler yalnızca bir başka endpoint değildir. SaaS kolaylığı ile kendi yönettiğiniz AI altyapısı arasında bir dağıtım tercihidır.

1

Bu, normal bir LLM API’den nasıl farklı?

Normal bir LLM API, sağlayıcı sınırına güvenmenizi ister. Phala model çağrısını donanım destekli TEE içinde çalıştırır ve isteği neyin koruduğunu gösteren çalışma zamanı kanıtı ekleyebilir.

2

Bu, modelleri kurum içinde çalıştırmaktan nasıl farklı?

On-prem kontrol sağlar, ancak GPU’ları, model servislerini, yükseltmeleri ve kapasiteyi siz işletirsiniz. Phala API iş akışını korurken private execution ve doğrulanabilir çalışma zamanı durumu ekler.

3

Mevcut uygulamama özel LLM’leri entegre etmek ne kadar zor?

OpenAI uyumlu API yapısını kullanın: temel URL'yi değiştirin, özel bir model slug'ı seçin ve mevcut SDK veya ajan çerçevenizi koruyun.

4

Hangi model türleri mevcut?

Katalog; DeepSeek, Qwen, Meta, Mistral, Google ve OpenAI OSS gibi sağlayıcılardan kodlama, akıl yürütme, genel sohbet ve açık ağırlıklı model ailelerini içerir.

5

Müşteriler verinin korunduğunu nasıl doğrulayabilir?

Trust Center, doğrulama raporlarını donanım, kaynak, çalışma zamanı ve ağ doğrulama durumunun incelenebilir bir görünümüne dönüştürür.

6

Özel bir private stack’i ne zaman kullanmalıyım?

Özel modeller, ayrılmış GPU’lar, müşteriye özel dağıtımlar veya paylaşımlı çıkarımdan daha güçlü bir uyumluluk ve denetim sınırı gerektiğinde özel bir stack kullanın.

Geliştirmeye başlayın

Kanıtlayabildiğiniz yapay zekayı geliştirin.

Özel iş yüklerini dağıtın, yürütmeyi doğrulayın ve modellerden GPU işlerine kadar ölçekleyin.