Ascend NPU集合通信库 — Plan Compilation + Hardware Exploitation
Plan + Communication + Link — 为Ascend NPU上PanGu大模型全栈特化的集合通信库。
如同Planck常数定义了物理学的最小量子,Planck把通信优化做到最小粒度——chunk-level pipeline,编译期确定一切。
独立通信库(类NCCL),通过AOT Plan Compilation实现跨操作全局优化,同时面向训练和推理。
三层竞争壁垒(相乘关系):
| 层 | 技术 | 用途 |
|---|---|---|
| Rust | petgraph, PyO3 | Plan Compiler (决策, 编译期) |
| C++20 | AscendC, ACL Runtime | Custom Ops + Executor (运行期) |
| Python | torchair, pytest | Graph pass + PyO3 bindings |
Plan IR三层设计: CommGraph(做什么) → LogicalPlan(怎么分解) → ExecutionPlan(怎么执行)。 9条单边原语,6个编译Pass(算法选择 → 分块流水 → Buffer规划 → 依赖细化 → 指令融合 → 内联变换)。
Phase A (Rust + Python, macOS, 无硬件依赖) 已完成: