NVIDIA H200 GPU TEE

适用于隐私模型的 H200 插槽。

更大规模 LLM 服务、微调和受保护批处理任务所需的高内存 H200 容量。

H200 TEE capacity with 141GB HBM3e memory, confidential GPU mode, CVM runtime, and TEE operations.

容量单元

资源位已就绪
NVIDIA H200 chipNVIDIA H200 chipNVIDIA H200 chip

hardware proof rail

这块 GPU 走的是同一条可验证 GPU 证明路径。

GPU TEE

H200

GPU TEE

141GB HBM3e

GPU TEE

TEE proof

内存

141GB HBM3e

带宽

4.8 TB/s

区域

美国西部 / 印度

扩展

1-8 块 GPU

GPU 买家信息

不只是 GPU 报价。

GPU 卖家通常只说明价格和可用性。此页面将额外的 TEE 要求透明化:运行时边界、隐私 GPU 模式、证明和运维。

最佳匹配

GPU 工作负载形态

01大模型推理服务
02微调窗口
03高显存批处理任务

访问

1-8 个 GPU 资源位

承诺

预留 H200 容量

企业版

多节点隐私模型集群

TEE 准备清单

01

容量

GPU 显存、带宽、区域和规模在销售电话前就可见。

02

云路径

通过机密 VM、裸金属路径或企业部署运行。

03

TEE 就绪

Intel TDX、NVIDIA 隐私计算、驱动、BIOS 和验证器就绪状态由 Phala 统一处理。

04

采购模式

从 24 小时试用开始,预留资源,或为专属集群获取报价。

GPU 技术画像

当内存是瓶颈时,使用 H200。

H200 更适合更大规模的 LLM 服务、长上下文推理、受保护的批处理任务,以及需要更多模型或 KV-cache 内存、但还不必切换到 Blackwell 集群的调优运行。

内存

141GB HBM3e 为更大的模型和更长的上下文在切分前留出更多空间。

带宽

4.8TB/s 内存带宽有助于支撑高显存推理和调优任务。

扩展

使用 1–8 个 GPU 插槽用于预留运行、基准测试窗口或生产级隐私模型服务。

TEE 层

Phala 将 GPU 容量与 CVM 隔离、双重证据和感知 TEE 的运维结合起来。

用于隐私 AI GPU 规划的性能指标

relative index

1x

H100

1.9x

H200

LLM 推理

model + KV cache

80GB

H100

141GB

H200

GPU 内存

feed batches

3.35TB/s

H100

4.8TB/s

H200

内存带宽

NVIDIA H100 chip

NVIDIA H100

80GB HBM3

NVIDIA H200 chip

NVIDIA H200

141GB HBM3e

性能对比

NVIDIA H200 vs NVIDIA H100

H100 是机密 GPU 试验的实用起点。H200 为更大的模型和更长的上下文留出更多空间,再进行切分。

用这个对比来判断工作负载需要短期 H100 验证窗口,还是预留的 H200 高显存容量。

GPU 采购路径

选择适合该任务的采购路径。

先试单机,报价预留插槽;当工作负载升级为生产基础设施后,再迁移到专属集群。

01 / 按需

24 小时内试用机密 GPU。

供构建者验证隐私推理、模型服务或证明生成的短时测试窗口。

02 / 席位

在下一次运行前预留容量。

为持续训练、微调和基准测试窗口提供可预测的 GPU 访问。

03 / 企业版

具备 TEE 操作的专用集群。

支持 TEE 感知基础设施和部署规划的定制 H100、H200 或 B300 合作方案。

证明路径

这块 GPU 有用,因为它可验证。

GPU 不以原始硬件形式出售,而是通过具备 GPU 机密计算和双重证明的机密 VM 路径交付。

cvm-enclave · 80×24 · 24fpsdensity: .:-=+*#%@

01

CVM 运行时

Docker 工作负载在带 GPU 直通的 Intel TDX 机密虚拟机中运行。运行时在工作负载启动前会被封存以对抗操作员,并由固件度量。

gpu-cc · 80×22 · 24fpsdensity: .:-=+*#%@

02

GPU CC 模式

NVIDIA Confidential Computing 将模型权重、激活值和 KV cache 封装在受保护的 GPU 内存中。GPU 与 CPU TEE 一起执行计算隔离。

dual-attestation · 80×20 · 24fpsdensity: .:-=+*#%@

03

双重证明

Intel TDX 和 NVIDIA 都会输出签名 quote。Phala 将两者收集并通过一个验证器对外呈现,让 CVM 和 GPU 一起证明自身。

其他机密 GPU

比较下一条容量路径。

在 H100、H200 和 B300 上使用同一套市场模型:容量、价格、区域和证明状态保持可见。

H200 GPU TEE — 141GB HBM3e Confidential AI | Phala