Özel Eğitim

Veri silodan hiç çıkmadan eğitim yapın.

SFT · DPO · RLHF · PEFT · sürekli ön eğitim. Yığınınız uçtan uca mühürlü. İmzalı manifesto dışarıda, tasarım gereği logsuz.

Eğitim dokümanlarını oku Uzmanlarla konuşun

6 taraf · 1 mühürlü model

Hospital AHospital BBank CLab DInsurer EResearch F

6 sealed parties

attested merge

1 signed model

Every phase of your training stack — sealed.

SFT, DPO, RLHF, LoRA / QLoRA / PEFT, continued pre-training, and multimodal extension. Run the pipeline you already use with TRL, Unsloth, and HuggingFace — on data that never leaves the silo.

training pipelines · single-tenant

fork · register · seal

phase

pipeline

base · method

hardware

status

SFT

Instruction-tuned assistant

Llama 3.1 8B
TRL · full SFT

H200 ×1

ready

DPO

Helpfulness preference align

Llama 3.1 8B-SFT
TRL DPOTrainer

H200 ×1

ready

RLHF

Safety reward + PPO

Mistral 7B-SFT
reward model + PPO

H200 ×2

busy

LoRA

Domain coding copilot

Qwen2.5-Coder 14B
PEFT · LoRA r=32

H200 ×2

ready

QLoRA

Medical chat (memory-fit)

Llama 3.1 70B
QLoRA 4-bit

H200 ×4

busy

Continued PT

Legal corpus adapter

Llama 3.1 8B
unsloth · 1.2B tokens

H100 ×4

ready

SFT

Domain RAG embedder

BGE-m3
contrastive · in-batch

H100 ×1

ready

Multimodal

Vision-language adapter

Llama 3.2 11B-V
projector + SFT

H200 ×2

forming

cross-silo consortia · multi-party

multi-sig · k-of-n unwrap

consortium

records

training method

status

Cardio-renal cohort

4 hospitals · EU + US

1.6M rows

SFT · risk classifier

live

Cross-bank fraud signals

6 banks · US + UK + SG

78M tx

RLHF preference · joint

live

Rare-disease genomics

3 research consortiums

54k samples

continued PT · embedder

live

Supply-chain risk benchmark

8 vendors · global

12M records

DPO · ranked outcomes

forming

Nasıl çalışır

Mühürlü bir eğitim çalıştırmasını uçtan uca takip edin.

Tam olarak her adımda hangi garantinin kaybolduğunu görmek için dstack'i kapatın.

TEE-GPU Kümesinde Korumalı Eğitim

SFT · DPO · RLHF · PEFT · devam eden PT — doğrulanmış H200 düğümleri arasında şifreli gradyanlar, imzalı manifesto çıkışı

aktif uçetkin değiladımda yeni

adım 1 of 5 · kaydırma duyarlı

Adım 1 / 5

Sahipler Veri Kümelerini Mühürler · Compose-Hash Kaydedildi

Her veri sahibi yerelde bir wrap key türetir: HKDF(kms_root_pubkey, training_app_id, training_compose_hash, owner_id), shard’ını şifreler ve ciphertext yayınlar. Training compose-hash, framework’ü, training script’ini ve hyperparameter dosyasını sabitler (TRL · Unsloth · HF Trainer). Onay, DstackApp.sol’a sahip olan çoklu imza ile zincir üzerinde birlikte kaydedilir.

With dstack: Sahipler, yalnızca inceledikleri gelecekteki attested build’e karşı mühürlenmiş ciphertext parçalarını serbest bırakır.

Her eğitim aşaması için bir pipeline. Zaten kullandığınız aynı stack.

Gözetimli ince ayar

TRL SFTTrainer veya Unsloth. unwrap_dataset(), dstack-guest-agent üzerinden her sahibi için anahtarları çeker — eğitim döngünüz değişmeden kalır. Çıktı: mühürlü bir checkpoint ve imzalı bir manifesto.

SFT

from trl import SFTTrainerds = unwrap_dataset("sealed/sft.tar")tr = SFTTrainer(model, tokenizer,train_dataset=ds, ...)tr.train()phala.sign_manifest(tr.state)

DPO · RLHF

from trl import DPOTrainerprefs = unwrap_dataset("sealed/prefs")tr = DPOTrainer(policy, ref,beta=0.1, train=prefs)tr.train()# → aligned policy + manifest

Tercih / RL hizalama

Tercih-çifti optimizasyonu için DPOTrainer / IPOTrainer veya reward model + PPO ile tam RLHF. Mühürlü istemler, mühürlü tercih verisi, doğrulanmış reward model.

PEFT · LoRA / QLoRA

HuggingFace PEFT. Dondurulmuş bir temel modele karşı düşük-rank adapter’lar eğitin; LoRA ağırlıkları compose-hash’e mühürlenir ve doğrulanmış yeniden türetmede birleştirilir. Bellek kısıtlı işler için 4-bit QLoRA.

LoRA · QLoRA

from peft import LoraConfigcfg = LoraConfig(r=32,target_modules="q,k,v,o")model = get_peft_model(base, cfg)trainer.train()# sealed adapters · 0.4% params

CONTINUED PT

$ phala deploy \-c docker-compose.yml \-n llama-cpt \-t h200.small --kms phala→ stream-unwrap in TDX memory✓ manifest · token-hashes signed

Sürekli ön eğitim

Sealed token korpusları üzerinde bir temel modeli alanınıza uyarlayın. Streaming dataloader, shard’ları TDX belleğinde açar; çalışma, token-hash’leri, hiperparametreleri ve son checkpoint’i kapsayan tek bir imzalı manifesto üretir.

sealed dataset · cohort-A.tar

1.6M rows

ownerhospital-Aanalysis-app-id0x4f6a…91c0analysis-compose-hash0xa42b…d1f3wrap-keyHKDF(kms, app, compose, owner)algoAES-256-GCM

SealedHIPAAGDPRnever-exits-silorecipe-bound

Kaynakta mühürlü · her sahib’e özel HKDF

Her sahibin sarmalama anahtarı HKDF(kms_root, app_id, compose_hash, owner_id) ile türetilir. Tarifi değiştirin → anahtar değişir, eski şifreli metin kalıcı olarak erişilemez olur. Sarmalama anahtarı yalnızca compose-hash’i eşleşen doğrulanmış bir CVM içinde yeniden türetilir.

training manifest · sign-rpc

signed

modelllama-3.1-8b · LoRA r=16datasets2 sealed · 1.23M rowsdataset_hashes0xab12…d5, 0x4ef3…21compose_hash0xa1b2…d1f3model_checksum0x9c1a…f7e2sigchains TDX root + on-chain

verify offlineregulator-grade artifact

İmzalı eğitim manifestosu = denetim artefaktı

Her çalıştırmadan çıkan çıktı: kodu, veri kümelerini, hiperparametreleri ve model checksum’unu zincir üstü compose-hash’e bağlayan bir Sign-RPC manifestosu. Düzenleyiciye model dosyasını değil, manifestoyu verin.

bugün üretimde

Mühürlü eğitim, üretimde.

Kapalı bir model gönderen tarife bağlı ince ayarlar. Manifestin, model dosyası değil, düzenleyici artefakt olduğu silo-ötesi eğitim.

01fine-tune · live

Sağlık teknolojisi · tıbbi sohbet

HIPAA seviyesinde · 13B QLoRA

“TDX + H200 üzerinde hasta konuşması ince ayarı. Ağırlıklar hiçbir zaman ne bizim bulutumuza ne de onlarınkine dokunur — reçeteye mühürlenir, KMS yalnızca doğrulanmış bir CVM içinde yeniden türetir.”

medical-chat v3

TDX + H200 · weights sealed

02multi-party · live

Kardiyo-böbrek kohort çalışması

4 hastane · AB + ABD + CH

“Her hastane kendi veri kümesini mühürler; KMS yalnızca onaylı compose için kilidi açar. Diğer tarafta: kodu, veri kümelerini ve model checksum’unu bağlayan imzalı bir manifest.”

1.6M records

multi-sig DstackApp · DP-aggregate out

03multi-party · live

Bankalar arası dolandırıcılık sinyalleri

6 banka · küresel

“Bir bankanın diğer bankanın defterini görmediği ortak AML modeli. Model dosyasını değil, manifesti düzenleyiciye verin.”

78M tx records

k-of-n quorum · sign-rpc manifest

HIPAA standartlarında

hasta verileri mühürlendi

GDPR / UK GDPR

veri yerleşimi korunur

PCI / FFIEC

çapraz banka birleşimleri kısıtlı

SOC 2 Type II

onaylanmış çalışma geçmişi

Yapay zeka çözüm yolları

Yapay zeka gizliliğe duyarlı verilere dokunduğunda özel modeller kullanın.

Özel model uç noktası ilk giriş noktasıdır. Aynı gizlilik ilkesi ajanlara, veri iş akışlarına ve eğitime de genişler.

LLM API

Özel AI çıkarımı

Promptların, çıktıların ve müşteri bağlamının kullanım sırasında şifreli korunması gereken OpenAI uyumlu model çağrılarını sunun.

Çözümü aç

encrypted

DeepSeek V3.1

128K

$0.27/M input

encrypted

Qwen3 Coder

256K

$0.40/M input

encrypted

Llama 3.3 70B

128K

$0.15/M input

encrypted

GPT OSS 120B

128K

$0.10/M input

encrypted

Claude Sonnet 4.5

200K

$3.00/M input

encrypted

Gemini 2.5 Pro

$1.25/M input

Agents

Özel yapay zekâ temsilcileri

Ajanları, görülebilir bir otomasyon bulutu yerine anahtarlar, araçlar, bellek ve eylemlerle birlikte doğrulanmış bir çalışma zamanında çalıştırın.

Çözümü aç

Data

Private AI verisi

Modelleri hassas kayıtlara taşıyın ve ham veriyi model operatörüne açmadan onaylı çıktılar döndürün.

Çözümü aç

source

EHR data

source

Customer records

source

Internal docs

TEE clean room

query without raw access

approved output

aggregate only

no row exportproof linked

Deploy private training

Mühürlenmiş veri üzerinde eğitin. Düzenleyiciye manifestoyu teslim edin.

Tek bir müşteri için ince ayar yapın veya silolar arasında birlikte eğitin. Sahip başına HKDF, çoklu imzalı DstackApp kapısı, kodu, veri kümelerini ve modeli bağlayan imzalı manifest. TDX + H100/H200.

View docs Satış ekibiyle görüşün

01LoRA / QLoRA via Unsloth
02Owner-side HKDF dataset sealing
03Multi-sig DstackApp co-approval
04Sign-RPC training manifest
05On-chain compose-hash revocation
06Combined CPU + GPU TEE attestation

Özel çalışma. Doğrulanabilir sonuçlar.

Bülten

Private Training — Fine-Tune on Sealed Data | Phala