Entraînement privé

Entraînez-vous sur des données qui ne quittent jamais le silo.

SFT · DPO · RLHF · PEFT · pré-entraînement continu. Votre stack, scellée de bout en bout. Manifeste signé en sortie, aucun journal par conception.

6 parties · 1 modèle scellé
Hospital AHospital BBank CLab DInsurer EResearch F
6 sealed parties
attested merge
1 signed model

Every phase of your training stack — sealed.

SFT, DPO, RLHF, LoRA / QLoRA / PEFT, continued pre-training, and multimodal extension. Run the pipeline you already use with TRL, Unsloth, and HuggingFace — on data that never leaves the silo.

training pipelines · single-tenant

fork · register · seal

phase

pipeline

base · method

hardware

status

SFT
Instruction-tuned assistant
Llama 3.1 8B
TRL · full SFT
H200 ×1
ready
DPO
Helpfulness preference align
Llama 3.1 8B-SFT
TRL DPOTrainer
H200 ×1
ready
RLHF
Safety reward + PPO
Mistral 7B-SFT
reward model + PPO
H200 ×2
busy
LoRA
Domain coding copilot
Qwen2.5-Coder 14B
PEFT · LoRA r=32
H200 ×2
ready
QLoRA
Medical chat (memory-fit)
Llama 3.1 70B
QLoRA 4-bit
H200 ×4
busy
Continued PT
Legal corpus adapter
Llama 3.1 8B
unsloth · 1.2B tokens
H100 ×4
ready
SFT
Domain RAG embedder
BGE-m3
contrastive · in-batch
H100 ×1
ready
Multimodal
Vision-language adapter
Llama 3.2 11B-V
projector + SFT
H200 ×2
forming

cross-silo consortia · multi-party

multi-sig · k-of-n unwrap

consortium

records

training method

status

Cardio-renal cohort

4 hospitals · EU + US

1.6M rows
SFT · risk classifier
live

Cross-bank fraud signals

6 banks · US + UK + SG

78M tx
RLHF preference · joint
live

Rare-disease genomics

3 research consortiums

54k samples
continued PT · embedder
live

Supply-chain risk benchmark

8 vendors · global

12M records
DPO · ranked outcomes
forming
Fonctionnement

Suivez une exécution d’entraînement scellée de bout en bout.

Désactivez dstack pour voir exactement quelle garantie disparaît à chaque étape.

Entraînement scellé sur un cluster TEE-GPU

SFT · DPO · RLHF · PEFT · PT continu — gradients chiffrés sur des nœuds H200 attestés, manifeste signé en sortie

1
Étape 1 / 5

Propriétaires scellent les ensembles de données · Compose-Hash enregistré

Chaque propriétaire de données dérive localement une clé d’enveloppement : HKDF(kms_root_pubkey, training_app_id, training_compose_hash, owner_id), chiffre son shard et publie le chiffré. Le training compose-hash fige le framework, le script d’entraînement et le fichier d’hyperparamètres (TRL · Unsloth · HF Trainer). L’approbation est enregistrée on-chain via un multi-sig qui possède DstackApp.sol.

With dstack: Les propriétaires ne remettent que des ciphertexts scellés contre une future build attestée qu’ils ont validée.

Un pipeline par phase d’entraînement. La même stack que vous utilisez déjà.

Ajustement supervisé

TRL SFTTrainer ou Unsloth. unwrap_dataset() récupère les clés par propriétaire via dstack-guest-agent — votre boucle d’entraînement reste inchangée. Résultat : un checkpoint scellé et un manifeste signé.

SFT
from trl import SFTTrainerds = unwrap_dataset("sealed/sft.tar")tr = SFTTrainer(model, tokenizer,train_dataset=ds, ...)tr.train()phala.sign_manifest(tr.state)
DPO · RLHF
from trl import DPOTrainerprefs = unwrap_dataset("sealed/prefs")tr = DPOTrainer(policy, ref,beta=0.1, train=prefs)tr.train()# → aligned policy + manifest

Alignement par préférence / RL

DPOTrainer / IPOTrainer pour l’optimisation sur paires de préférences, ou RLHF complet avec un reward model + PPO. Prompts scellés, données de préférence scellées, reward model attesté.

PEFT · LoRA / QLoRA

HuggingFace PEFT. Entraînez des adaptateurs de faible rang sur une base figée ; les poids LoRA sont scellés au compose-hash et fusionnés lors d’une re-génération attestée. QLoRA 4 bits pour les exécutions limitées en mémoire.

LoRA · QLoRA
from peft import LoraConfigcfg = LoraConfig(r=32,target_modules="q,k,v,o")model = get_peft_model(base, cfg)trainer.train()# sealed adapters · 0.4% params
CONTINUED PT
$ phala deploy \-c docker-compose.yml \-n llama-cpt \-t h200.small --kms phala→ stream-unwrap in TDX memory✓ manifest · token-hashes signed

Pré-entraînement continu

Adaptez un modèle de base à un domaine sur des corpus de jetons scellés. Le dataloader en streaming décompresse les shards dans la mémoire TDX ; l’exécution émet un manifeste signé unique couvrant les token-hashes, les hyperparamètres et le checkpoint final.

sealed dataset · cohort-A.tar

1.6M rows

ownerhospital-Aanalysis-app-id0x4f6a…91c0analysis-compose-hash0xa42b…d1f3wrap-keyHKDF(kms, app, compose, owner)algoAES-256-GCM
SealedHIPAAGDPRnever-exits-silorecipe-bound

Scellé à la source · HKDF par propriétaire

La clé d’enveloppement de chaque propriétaire est HKDF(kms_root, app_id, compose_hash, owner_id). Changez la recette → la clé change, l’ancien ciphertext est définitivement inaccessible. La clé d’enveloppement n’est recalculée que dans une CVM attestée dont le compose-hash correspond.

training manifest · sign-rpc

signed
modelllama-3.1-8b · LoRA r=16datasets2 sealed · 1.23M rowsdataset_hashes0xab12…d5, 0x4ef3…21compose_hash0xa1b2…d1f3model_checksum0x9c1a…f7e2sigchains TDX root + on-chain
verify offlineregulator-grade artifact

Manifeste d’entraînement signé = artefact d’audit

À chaque exécution : un manifeste Sign-RPC lie le code, les jeux de données, les hyperparamètres et le checksum du modèle au compose-hash on-chain. Remettez au régulateur le manifeste, pas le fichier du modèle.

en production aujourd’hui

Entraînement scellé, en production.

Fine-tunes liés à une recette qui livrent un modèle scellé. Entraînement inter-silos où le manifeste, et non le fichier modèle, est l’artefact réglementaire.

01fine-tune · live

Health tech · chat médical

HIPAA-grade · 13B QLoRA

Fine-tuning de conversations patients dans TDX + H200. Les poids ne touchent jamais notre cloud ni le leur — scellés à la recette, KMS ne les reconstitue qu’à l’intérieur d’une CVM attestée.

medical-chat v3

TDX + H200 · poids scellés

02multi-party · live

Étude de cohorte cardio-rénale

4 hôpitaux · UE + US + CH

Chaque hôpital scelle son dataset ; KMS ne déverrouille que pour la composition approuvée. À la sortie : un manifeste signé qui lie le code, les datasets et le checksum du modèle.

1.6M records

multi-sig DstackApp · DP-aggregate out

03multi-party · live

Signaux de fraude interbancaires

6 banques · mondial

Modèle AML conjoint entraîné sans qu’aucune banque ne voie le grand livre d’une autre banque. Remettez au régulateur le manifeste, pas le fichier du modèle.

78M tx records

quorum k-of-n · manifeste sign-rpc

niveau HIPAA

données patient chiffrées

RGPD / RGPD britannique

résidence des données préservée

PCI / FFIEC

jointures interbanques validées

SOC 2 Type II

historique d’exécution attesté

Parcours de solution IA

Utilisez des modèles privés lorsque l’IA accède à des secrets.

Le point de terminaison du modèle privé est le premier point d’entrée. Le même principe de confidentialité s’étend aux agents, aux workflows de données et à l’entraînement.

LLM API

Inférence IA privée

Diffuser des appels de modèles compatibles OpenAI où les prompts, sorties et le contexte client nécessitent une protection chiffrée en cours d’utilisation.

Ouvrir la solution
encrypted

DeepSeek V3.1

128K

$0.27/M input

encrypted

Qwen3 Coder

256K

$0.40/M input

encrypted

Llama 3.3 70B

128K

$0.15/M input

encrypted

GPT OSS 120B

128K

$0.10/M input

encrypted

Claude Sonnet 4.5

200K

$3.00/M input

encrypted

Gemini 2.5 Pro

1M

$1.25/M input

Agents

Agents IA privés

Exécutez des agents avec clés, outils, mémoire et actions dans un runtime vérifié au lieu d’un cloud d’automatisation visible.

Ouvrir la solution
Data

Données d’IA privées

Déplacez les modèles vers des dossiers sensibles et renvoyez des résultats approuvés sans exposer les données brutes à l’opérateur du modèle.

Ouvrir la solution

source

EHR data

source

Customer records

source

Internal docs

TEE clean room

query without raw access

approved output

aggregate only
no row exportproof linked

Deploy private training

Entraînez-vous sur des données scellées. Remettez le manifeste à un régulateur.

Affinez pour un client ou co-entraînez à travers des silos. HKDF par propriétaire, porte DstackApp multi-sig, manifeste signé liant code, jeux de données et modèle. TDX + H100/H200.

View docsParler aux ventes
  • 01LoRA / QLoRA via Unsloth
  • 02Owner-side HKDF dataset sealing
  • 03Multi-sig DstackApp co-approval
  • 04Sign-RPC training manifest
  • 05On-chain compose-hash revocation
  • 06Combined CPU + GPU TEE attestation
Private Training — Fine-Tune on Sealed Data | Phala