Private training

Train op data die het silo nooit verlaat.

SFT · DPO · RLHF · PEFT · doorlopende pre-training. Je stack, end-to-end verzegeld. Ondertekend manifest eruit, geen logs by design.

Lees training docs Praat met experts

6 partijen · 1 afgeschermd model

Hospital AHospital BBank CLab DInsurer EResearch F

6 sealed parties

attested merge

1 signed model

Every phase of your training stack — sealed.

SFT, DPO, RLHF, LoRA / QLoRA / PEFT, continued pre-training, and multimodal extension. Run the pipeline you already use with TRL, Unsloth, and HuggingFace — on data that never leaves the silo.

training pipelines · single-tenant

fork · register · seal

phase

pipeline

base · method

hardware

status

SFT

Instruction-tuned assistant

Llama 3.1 8B
TRL · full SFT

H200 ×1

ready

DPO

Helpfulness preference align

Llama 3.1 8B-SFT
TRL DPOTrainer

H200 ×1

ready

RLHF

Safety reward + PPO

Mistral 7B-SFT
reward model + PPO

H200 ×2

busy

LoRA

Domain coding copilot

Qwen2.5-Coder 14B
PEFT · LoRA r=32

H200 ×2

ready

QLoRA

Medical chat (memory-fit)

Llama 3.1 70B
QLoRA 4-bit

H200 ×4

busy

Continued PT

Legal corpus adapter

Llama 3.1 8B
unsloth · 1.2B tokens

H100 ×4

ready

SFT

Domain RAG embedder

BGE-m3
contrastive · in-batch

H100 ×1

ready

Multimodal

Vision-language adapter

Llama 3.2 11B-V
projector + SFT

H200 ×2

forming

cross-silo consortia · multi-party

multi-sig · k-of-n unwrap

consortium

records

training method

status

Cardio-renal cohort

4 hospitals · EU + US

1.6M rows

SFT · risk classifier

live

Cross-bank fraud signals

6 banks · US + UK + SG

78M tx

RLHF preference · joint

live

Rare-disease genomics

3 research consortiums

54k samples

continued PT · embedder

live

Supply-chain risk benchmark

8 vendors · global

12M records

DPO · ranked outcomes

forming

Hoe het werkt

Loop een afgeschermde training run end-to-end door.

Schakel dstack uit om precies te zien welke garantie bij elke stap verdwijnt.

Afgeschermde training op een TEE-GPU-cluster

SFT · DPO · RLHF · PEFT · continued PT — versleutelde gradients over geattesteerde H200-nodes, signed manifest out

actieve edgeinactiefnieuw in stap

stap 1 of 5 · scroll-aware

Stap 1 / 5

Eigenaars verzegelen datasets · compose-hash geregistreerd

Elke data-eigenaar afleidt lokaal een wrap key: HKDF(kms_root_pubkey, training_app_id, training_compose_hash, owner_id), versleutelt zijn shard en publiceert de ciphertext. De training compose-hash legt het framework, het trainingsscript en het hyperparameterbestand vast (TRL · Unsloth · HF Trainer). Goedkeuring wordt on-chain hergeregistreerd via een multi-sig die eigenaar is van DstackApp.sol.

With dstack: Eigenaren geven alleen ciphertext vrij die is verzegeld tegen een toekomstige geattesteerde build die zij hebben beoordeeld.

Eén pipeline per trainingsfase. Dezelfde stack die je al gebruikt.

Supervised fine-tuning

TRL SFTTrainer of Unsloth. unwrap_dataset() haalt per-eigenaar sleutels op via dstack-guest-agent — je trainingsloop blijft ongewijzigd. Uitvoer: een verzegeld checkpoint plus een ondertekend manifest.

SFT

from trl import SFTTrainerds = unwrap_dataset("sealed/sft.tar")tr = SFTTrainer(model, tokenizer,train_dataset=ds, ...)tr.train()phala.sign_manifest(tr.state)

DPO · RLHF

from trl import DPOTrainerprefs = unwrap_dataset("sealed/prefs")tr = DPOTrainer(policy, ref,beta=0.1, train=prefs)tr.train()# → aligned policy + manifest

Preference / RL alignment

DPOTrainer / IPOTrainer voor optimalisatie van voorkeurspaar-combinaties, of volledige RLHF met een reward model + PPO. Verzegelde prompts, verzegelde voorkeursdata, geattesteerd reward model.

PEFT · LoRA / QLoRA

HuggingFace PEFT. Train low-rank adapters tegen een bevroren basismodel; de LoRA-gewichten worden verzegeld aan de compose-hash en samengevoegd bij geattesteerde herafleiding. 4-bit QLoRA voor geheugenbeperkte runs.

LoRA · QLoRA

from peft import LoraConfigcfg = LoraConfig(r=32,target_modules="q,k,v,o")model = get_peft_model(base, cfg)trainer.train()# sealed adapters · 0.4% params

CONTINUED PT

$ phala deploy \-c docker-compose.yml \-n llama-cpt \-t h200.small --kms phala→ stream-unwrap in TDX memory✓ manifest · token-hashes signed

Continued pre-training

Pas een basismodel aan op verzegelde token-corpora. De streaming-dataloader pakt shards uit in TDX-geheugen; de run produceert één ondertekend manifest met token-hashes, hyperparameters en het finale checkpoint.

sealed dataset · cohort-A.tar

1.6M rows

ownerhospital-Aanalysis-app-id0x4f6a…91c0analysis-compose-hash0xa42b…d1f3wrap-keyHKDF(kms, app, compose, owner)algoAES-256-GCM

SealedHIPAAGDPRnever-exits-silorecipe-bound

Verzegeld bij de bron · per eigenaar HKDF

De wrap key van elke eigenaar is HKDF(kms_root, app_id, compose_hash, owner_id). Verander de recipe → de sleutel verandert, en oude ciphertext wordt permanent uitgesloten. De wrap key wordt alleen opnieuw afgeleid binnen een geattesteerde CVM waarvan de compose-hash overeenkomt.

training manifest · sign-rpc

signed

modelllama-3.1-8b · LoRA r=16datasets2 sealed · 1.23M rowsdataset_hashes0xab12…d5, 0x4ef3…21compose_hash0xa1b2…d1f3model_checksum0x9c1a…f7e2sigchains TDX root + on-chain

verify offlineregulator-grade artifact

Ondertekend trainingsmanifest = auditartefact

Uit elke run komt een Sign-RPC-manifest dat code, datasets, hyperparameters en modelsamenvatting bindt aan de on-chain compose-hash. Geef de toezichthouder het manifest, niet het modelbestand.

vandaag in productie

Verzegelde training, in productie.

Fine-tunes gebonden aan een recept die een verzegeld model opleveren. Cross-silo training waarbij het manifest, niet het modelbestand, het artifact voor toezichthouders is.

01fine-tune · live

Gezondheidstechnologie · medisch chatten

HIPAA-niveau · 13B QLoRA

“Fine-tune voor patiëntgesprekken in TDX + H200. Gewichten raken nooit onze cloud of die van hen — verzegeld aan de recipe, KMS herleidt alleen binnen een geattesteerde CVM.”

medical-chat v3

TDX + H200 · weights verzegeld

02multi-party · live

Cardiorenale cohortstudie

4 ziekenhuizen · EU + US + CH

“Elk ziekenhuis verzegelt zijn dataset; KMS ontgrendelt alleen voor de goedgekeurde compose. Aan de andere kant: een ondertekend manifest dat code, datasets en model-checksum bindt.”

1.6M records

multi-sig DstackApp · DP-aggregate out

03multi-party · live

Fraudesignalen tussen banken

6 banken · wereldwijd

“Gezamenlijk AML-model getraind zonder dat een bank de grootboekgegevens van een andere bank ziet. Geef de toezichthouder het manifest, niet het modelbestand.”

78M tx records

k-van-n quorum · sign-rpc-manifest

HIPAA-waardig

patiëntdata verzegeld

GDPR / UK GDPR

dataresidentie behouden

PCI / FFIEC

grensoverschrijdende joins afgeschermd

SOC 2 Type II

gevalideerde uitvoeringshistorie

AI-oplossingspaden

Gebruik privé-modellen waar AI met geheimen werkt.

Het endpoint voor het privé-model is het eerste toegangspunt. Hetzelfde privacy-gebouwblok breidt zich uit naar agents, datastromen en training.

LLM API

Private AI-inference

Bied OpenAI-compatibele modelaanroepen aan waarbij prompts, outputs en klantcontext versleutelde-bij-gebruik bescherming nodig hebben.

Open oplossing

encrypted

DeepSeek V3.1

128K

$0.27/M input

encrypted

Qwen3 Coder

256K

$0.40/M input

encrypted

Llama 3.3 70B

128K

$0.15/M input

encrypted

GPT OSS 120B

128K

$0.10/M input

encrypted

Claude Sonnet 4.5

200K

$3.00/M input

encrypted

Gemini 2.5 Pro

$1.25/M input

Agents

Privé AI-agents

Laat agents draaien met sleutels, tools, geheugen en acties binnen een geverifieerde runtime in plaats van een zichtbare automation cloud.

Open oplossing

Data

Privé AI-data

Verplaats modellen naar gevoelige records en geef goedgekeurde outputs terug zonder ruwe data bloot te stellen aan de modeloperator.

Open oplossing

source

EHR data

source

Customer records

source

Internal docs

TEE clean room

query without raw access

approved output

aggregate only

no row exportproof linked

Deploy private training

Train op verzegelde data. Geef een toezichthouder het manifest.

Fine-tune voor één klant of train gezamenlijk over silo’s heen. Per-eigenaar HKDF, multi-sig DstackApp-poort, ondertekende manifestbinding van code, datasets en model. TDX + H100/H200.

View docs Neem contact op met sales

01LoRA / QLoRA via Unsloth
02Owner-side HKDF dataset sealing
03Multi-sig DstackApp co-approval
04Sign-RPC training manifest
05On-chain compose-hash revocation
06Combined CPU + GPU TEE attestation

Private uitvoering. Verifieerbare resultaten.

Nieuwsbrief

Private Training — Fine-Tune on Sealed Data | Phala