Entraînement privé

Entraînez-vous sur des données qui ne quittent jamais le silo.

SFT · DPO · RLHF · PEFT · pré-entraînement continu. Votre stack, scellée de bout en bout. Manifeste signé en sortie, aucun journal par conception.

Lire la documentation de formation Parler à des experts

6 parties · 1 modèle scellé

Hospital AHospital BBank CLab DInsurer EResearch F

6 sealed parties

attested merge

1 signed model

Every phase of your training stack — sealed.

SFT, DPO, RLHF, LoRA / QLoRA / PEFT, continued pre-training, and multimodal extension. Run the pipeline you already use with TRL, Unsloth, and HuggingFace — on data that never leaves the silo.

training pipelines · single-tenant

fork · register · seal

phase

pipeline

base · method

hardware

status

SFT

Instruction-tuned assistant

Llama 3.1 8B
TRL · full SFT

H200 ×1

ready

DPO

Helpfulness preference align

Llama 3.1 8B-SFT
TRL DPOTrainer

H200 ×1

ready

RLHF

Safety reward + PPO

Mistral 7B-SFT
reward model + PPO

H200 ×2

busy

LoRA

Domain coding copilot

Qwen2.5-Coder 14B
PEFT · LoRA r=32

H200 ×2

ready

QLoRA

Medical chat (memory-fit)

Llama 3.1 70B
QLoRA 4-bit

H200 ×4

busy

Continued PT

Legal corpus adapter

Llama 3.1 8B
unsloth · 1.2B tokens

H100 ×4

ready

SFT

Domain RAG embedder

BGE-m3
contrastive · in-batch

H100 ×1

ready

Multimodal

Vision-language adapter

Llama 3.2 11B-V
projector + SFT

H200 ×2

forming

cross-silo consortia · multi-party

multi-sig · k-of-n unwrap

consortium

records

training method

status

Cardio-renal cohort

4 hospitals · EU + US

1.6M rows

SFT · risk classifier

live

Cross-bank fraud signals

6 banks · US + UK + SG

78M tx

RLHF preference · joint

live

Rare-disease genomics

3 research consortiums

54k samples

continued PT · embedder

live

Supply-chain risk benchmark

8 vendors · global

12M records

DPO · ranked outcomes

forming

Fonctionnement

Suivez une exécution d’entraînement scellée de bout en bout.

Désactivez dstack pour voir exactement quelle garantie disparaît à chaque étape.

Entraînement scellé sur un cluster TEE-GPU

SFT · DPO · RLHF · PEFT · PT continu — gradients chiffrés sur des nœuds H200 attestés, manifeste signé en sortie

edge actifinactifnouveau dans l’étape

étape 1 of 5 · sensible au défilement

Étape 1 / 5

Propriétaires scellent les ensembles de données · Compose-Hash enregistré

Chaque propriétaire de données dérive localement une clé d’enveloppement : HKDF(kms_root_pubkey, training_app_id, training_compose_hash, owner_id), chiffre son shard et publie le chiffré. Le training compose-hash fige le framework, le script d’entraînement et le fichier d’hyperparamètres (TRL · Unsloth · HF Trainer). L’approbation est enregistrée on-chain via un multi-sig qui possède DstackApp.sol.

With dstack: Les propriétaires ne remettent que des ciphertexts scellés contre une future build attestée qu’ils ont validée.

Un pipeline par phase d’entraînement. La même stack que vous utilisez déjà.

Ajustement supervisé

TRL SFTTrainer ou Unsloth. unwrap_dataset() récupère les clés par propriétaire via dstack-guest-agent — votre boucle d’entraînement reste inchangée. Résultat : un checkpoint scellé et un manifeste signé.

SFT

from trl import SFTTrainerds = unwrap_dataset("sealed/sft.tar")tr = SFTTrainer(model, tokenizer,train_dataset=ds, ...)tr.train()phala.sign_manifest(tr.state)

DPO · RLHF

from trl import DPOTrainerprefs = unwrap_dataset("sealed/prefs")tr = DPOTrainer(policy, ref,beta=0.1, train=prefs)tr.train()# → aligned policy + manifest

Alignement par préférence / RL

DPOTrainer / IPOTrainer pour l’optimisation sur paires de préférences, ou RLHF complet avec un reward model + PPO. Prompts scellés, données de préférence scellées, reward model attesté.

PEFT · LoRA / QLoRA

HuggingFace PEFT. Entraînez des adaptateurs de faible rang sur une base figée ; les poids LoRA sont scellés au compose-hash et fusionnés lors d’une re-génération attestée. QLoRA 4 bits pour les exécutions limitées en mémoire.

LoRA · QLoRA

from peft import LoraConfigcfg = LoraConfig(r=32,target_modules="q,k,v,o")model = get_peft_model(base, cfg)trainer.train()# sealed adapters · 0.4% params

CONTINUED PT

$ phala deploy \-c docker-compose.yml \-n llama-cpt \-t h200.small --kms phala→ stream-unwrap in TDX memory✓ manifest · token-hashes signed

Pré-entraînement continu

Adaptez un modèle de base à un domaine sur des corpus de jetons scellés. Le dataloader en streaming décompresse les shards dans la mémoire TDX ; l’exécution émet un manifeste signé unique couvrant les token-hashes, les hyperparamètres et le checkpoint final.

sealed dataset · cohort-A.tar

1.6M rows

ownerhospital-Aanalysis-app-id0x4f6a…91c0analysis-compose-hash0xa42b…d1f3wrap-keyHKDF(kms, app, compose, owner)algoAES-256-GCM

SealedHIPAAGDPRnever-exits-silorecipe-bound

Scellé à la source · HKDF par propriétaire

La clé d’enveloppement de chaque propriétaire est HKDF(kms_root, app_id, compose_hash, owner_id). Changez la recette → la clé change, l’ancien ciphertext est définitivement inaccessible. La clé d’enveloppement n’est recalculée que dans une CVM attestée dont le compose-hash correspond.

training manifest · sign-rpc

signed

modelllama-3.1-8b · LoRA r=16datasets2 sealed · 1.23M rowsdataset_hashes0xab12…d5, 0x4ef3…21compose_hash0xa1b2…d1f3model_checksum0x9c1a…f7e2sigchains TDX root + on-chain

verify offlineregulator-grade artifact

Manifeste d’entraînement signé = artefact d’audit

À chaque exécution : un manifeste Sign-RPC lie le code, les jeux de données, les hyperparamètres et le checksum du modèle au compose-hash on-chain. Remettez au régulateur le manifeste, pas le fichier du modèle.

en production aujourd’hui

Entraînement scellé, en production.

Fine-tunes liés à une recette qui livrent un modèle scellé. Entraînement inter-silos où le manifeste, et non le fichier modèle, est l’artefact réglementaire.

01fine-tune · live

Health tech · chat médical

HIPAA-grade · 13B QLoRA

“Fine-tuning de conversations patients dans TDX + H200. Les poids ne touchent jamais notre cloud ni le leur — scellés à la recette, KMS ne les reconstitue qu’à l’intérieur d’une CVM attestée.”

medical-chat v3

TDX + H200 · poids scellés

02multi-party · live

Étude de cohorte cardio-rénale

4 hôpitaux · UE + US + CH

“Chaque hôpital scelle son dataset ; KMS ne déverrouille que pour la composition approuvée. À la sortie : un manifeste signé qui lie le code, les datasets et le checksum du modèle.”

1.6M records

multi-sig DstackApp · DP-aggregate out

03multi-party · live

Signaux de fraude interbancaires

6 banques · mondial

“Modèle AML conjoint entraîné sans qu’aucune banque ne voie le grand livre d’une autre banque. Remettez au régulateur le manifeste, pas le fichier du modèle.”

78M tx records

quorum k-of-n · manifeste sign-rpc

niveau HIPAA

données patient chiffrées

RGPD / RGPD britannique

résidence des données préservée

PCI / FFIEC

jointures interbanques validées

SOC 2 Type II

historique d’exécution attesté

Parcours de solution IA

Utilisez des modèles privés lorsque l’IA accède à des secrets.

Le point de terminaison du modèle privé est le premier point d’entrée. Le même principe de confidentialité s’étend aux agents, aux workflows de données et à l’entraînement.

LLM API

Inférence IA privée

Diffuser des appels de modèles compatibles OpenAI où les prompts, sorties et le contexte client nécessitent une protection chiffrée en cours d’utilisation.

Ouvrir la solution

encrypted

DeepSeek V3.1

128K

$0.27/M input

encrypted

Qwen3 Coder

256K

$0.40/M input

encrypted

Llama 3.3 70B

128K

$0.15/M input

encrypted

GPT OSS 120B

128K

$0.10/M input

encrypted

Claude Sonnet 4.5

200K

$3.00/M input

encrypted

Gemini 2.5 Pro

$1.25/M input

Agents

Agents IA privés

Exécutez des agents avec clés, outils, mémoire et actions dans un runtime vérifié au lieu d’un cloud d’automatisation visible.

Ouvrir la solution

Data

Données d’IA privées

Déplacez les modèles vers des dossiers sensibles et renvoyez des résultats approuvés sans exposer les données brutes à l’opérateur du modèle.

Ouvrir la solution

source

EHR data

source

Customer records

source

Internal docs

TEE clean room

query without raw access

approved output

aggregate only

no row exportproof linked

Deploy private training

Entraînez-vous sur des données scellées. Remettez le manifeste à un régulateur.

Affinez pour un client ou co-entraînez à travers des silos. HKDF par propriétaire, porte DstackApp multi-sig, manifeste signé liant code, jeux de données et modèle. TDX + H100/H200.

View docs Parler aux ventes

01LoRA / QLoRA via Unsloth
02Owner-side HKDF dataset sealing
03Multi-sig DstackApp co-approval
04Sign-RPC training manifest
05On-chain compose-hash revocation
06Combined CPU + GPU TEE attestation

Exécution privée. Résultats vérifiables.

Newsletter

Private Training — Fine-Tune on Sealed Data | Phala