Insight 研究报告

GPU 架构、并行计算、内存系统深度解析

NVIDIA GPU MMU 专利详解

US20240202136A1 / US9514559B2 / US11620256B2 / LATPC 论文深度解读,含 5 个 SVG 示意图

MMU / 地址翻译 / TLB

Fabric Attached Memory 专利详解

US11822491B2 机架级 FAM 架构,地址 Swizzling/Spraying/Compaction 技术,含专利原图

FAM / NVSwitch / 内存池化

FlashOverlap 论文详解

EUROSYS '26 信号驱动计算通信重叠,含 5 张论文原图展示重排模式

通信重叠 / GEMM / NCCL

LLM 分布式混合并行论文详解

arXiv:2602.09109 DP/PP/TP/CP/EP 全策略分析,含 MFU 实验对比图

并行策略 / MFU / Ascend NPU

本周专利研究周报

NVIDIA / AMD / Intel / 华为等公司通信、MMU、内存专利周度追踪

周报 / 专利追踪

通信算法周报

集合通信算法、NCCL、DeepEP 等通信库周度更新

周报 / 通信算法

Open GPU Kernel 详解

NVIDIA 开源 GPU 内核驱动 NVLink/NVSwitch/MMU 模块解析

Open Driver / NVLink