NVIDIA H100 GPU TEE

用于隐私 AI 的 H100 试用机器。

CVM 内机密推理、微调和 GPU 工具的 H100 能力已得到验证。

H100 TEE capacity with 80GB HBM3 memory, Intel TDX runtime, NVIDIA confidential computing, and dual attestation.

容量单元

可试用
NVIDIA H100 chipNVIDIA H100 chipNVIDIA H100 chip

hardware proof rail

这块 GPU 走的是同一条可验证 GPU 证明路径。

GPU TEE

H100

GPU TEE

80GB HBM3

GPU TEE

TEE proof

内存

80GB HBM3

带宽

3.35 TB/s

区域

美国西部

扩展

1-2 张 GPU

GPU 买家信息

不只是 GPU 报价。

GPU 卖家通常只说明价格和可用性。此页面将额外的 TEE 要求透明化:运行时边界、隐私 GPU 模式、证明和运维。

最佳匹配

GPU 工作负载形态

01隐私推理试用
02智能体 GPU 工具
03证明生成

访问

24 小时试用机器

承诺

预留 H100 资源位

企业版

小型受保护集群

TEE 准备清单

01

容量

GPU 显存、带宽、区域和规模在销售电话前就可见。

02

云路径

通过机密 VM、裸金属路径或企业部署运行。

03

TEE 就绪

Intel TDX、NVIDIA 隐私计算、驱动、BIOS 和验证器就绪状态由 Phala 统一处理。

04

采购模式

从 24 小时试用开始,预留资源,或为专属集群获取报价。

GPU 技术画像

当工作负载需要快速的隐私测试路径时,使用 H100。

H100 是隐私推理试验、智能体 GPU 工具和证明流水线的实用起点;24 小时机器即可在预留更大容量前验证工作负载。

内存

80GB HBM3,用于隐私推理、证明任务和小规模微调窗口。

性能

面向需要立即获得可靠隐私 GPU 访问的团队的成熟 Hopper 路径。

扩展

先从 1-2 块 GPU 开始,之后当显存或集群规模成为瓶颈时再迁移到 H200 或 B300。

TEE 层

CVM 运行时、NVIDIA CC 模式、证明和固件就绪状态统一处理。

用于隐私 AI GPU 规划的性能指标

relative index

1x

H100

1.9x

H200

LLM 推理

model + KV cache

80GB

H100

141GB

H200

GPU 内存

feed batches

3.35TB/s

H100

4.8TB/s

H200

内存带宽

NVIDIA H100 chip

NVIDIA H100

80GB HBM3

NVIDIA H200 chip

NVIDIA H200

141GB HBM3e

性能对比

NVIDIA H200 vs NVIDIA H100

H100 是机密 GPU 试验的实用起点。H200 为更大的模型和更长的上下文留出更多空间,再进行切分。

用这个对比来判断工作负载需要短期 H100 验证窗口,还是预留的 H200 高显存容量。

GPU 采购路径

选择适合该任务的采购路径。

先试单机,报价预留插槽;当工作负载升级为生产基础设施后,再迁移到专属集群。

01 / 按需

24 小时内试用机密 GPU。

供构建者验证隐私推理、模型服务或证明生成的短时测试窗口。

02 / 席位

在下一次运行前预留容量。

为持续训练、微调和基准测试窗口提供可预测的 GPU 访问。

03 / 企业版

具备 TEE 操作的专用集群。

支持 TEE 感知基础设施和部署规划的定制 H100、H200 或 B300 合作方案。

证明路径

这块 GPU 有用,因为它可验证。

GPU 不以原始硬件形式出售,而是通过具备 GPU 机密计算和双重证明的机密 VM 路径交付。

cvm-enclave · 80×24 · 24fpsdensity: .:-=+*#%@

01

CVM 运行时

Docker 工作负载在带 GPU 直通的 Intel TDX 机密虚拟机中运行。运行时在工作负载启动前会被封存以对抗操作员,并由固件度量。

gpu-cc · 80×22 · 24fpsdensity: .:-=+*#%@

02

GPU CC 模式

NVIDIA Confidential Computing 将模型权重、激活值和 KV cache 封装在受保护的 GPU 内存中。GPU 与 CPU TEE 一起执行计算隔离。

dual-attestation · 80×20 · 24fpsdensity: .:-=+*#%@

03

双重证明

Intel TDX 和 NVIDIA 都会输出签名 quote。Phala 将两者收集并通过一个验证器对外呈现,让 CVM 和 GPU 一起证明自身。

其他机密 GPU

比较下一条容量路径。

在 H100、H200 和 B300 上使用同一套市场模型:容量、价格、区域和证明状态保持可见。

H100 GPU TEE — Confidential AI on 80GB HBM3 | Phala