US11822491B2: Fabric Attached Memory

NVIDIA Corporation | 机架级 Fabric 附加内存架构 | 授权日 2023-11-21

解析生成
2026-04-20
6
技术章节
FAM Architecture Address Swizzling Address Spraying Address Compaction Floor-Swept GPU Rack-Scale Memory

原文链接

US11822491B2 - Techniques for an efficient fabric attached memory

核心问题

传统 GPU 集群中,每个 GPU 只能访问本地显存(通常 80GB HBM),跨 GPU 内存访问需要通过 NVLink 或 PCIe,延迟高且带宽受限。如何构建机架级共享内存池,让所有 GPU 都能高效访问大容量内存?

FAM 架构总览

Fabric Attached Memory (FAM) 提出一种机架级内存架构,通过 NVSwitch Fabric 将多个 GPU 的内存池化,形成统一的超大内存空间。核心创新包括地址 SwizzlingSprayingCompaction 三项技术。

FAM Architecture - FIG.2 from US11822491B2

图 1: FAM 架构总览 (专利原图 FIG.2) — 左侧为 CPU + NVSwitch Fabric,中间为 Donor GPU 节点,右侧为 FAM 内存节点,通过 NVSwitch 互联

FAM 三级地址转换机制 虚拟地址 (VA) GPU 程序使用的地址 64-bit 虚拟地址空间 Swizzled 地址 地址重排,避免 Bank 冲突 XOR 哈希分散访问 物理地址 (PA) FAM 内存条上的实际地址 Sprayed + Compacted FAM Controller Address Mapper Request Router Data Mover Error Handler FAM Node 0 32x DDR5 (512GB) FAM Node 1 32x DDR5 (512GB) FAM Node N 32x DDR5 (512GB) ...

图 2: FAM 三级地址转换流程 — VA → Swizzled → Physical,通过 FAM Controller 统一管理

Address Swizzling

通过 XOR 哈希将连续虚拟地址分散到不同内存 Bank,避免 Bank 冲突,提升并行访问带宽。

Address Spraying

将地址空间均匀分布到多个 FAM 节点,实现负载均衡,避免热点节点成为瓶颈。

Address Compaction

对于未使用的地址区域进行压缩,减少地址映射表大小,提高 TLB 缓存效率。