UEC规范

有关 UltraEthernetConsortium 的更多信息,请访问:https://ultraethernet.org

UEC规范v1.0 – 1.简介_整体架构_软硬件分层-腾讯云开发者社区-腾讯云

《UEC 规范 v1.0 – 1. 简介_整体架构_软硬件分层》的技术文档,主要介绍了超级以太网联盟(UEC)及其规范,涉及 UEC 的背景、组织架构、传输配置文件、规范约定、系统视图、术语、软件和网络架构、各层功能等内容,旨在提升以太网在 AI 和 HPC 中的性能与互操作性,推动相关领域网络技术发展。以下是详细总结:

一、UEC 概述

  • 组织定位:UEC 是隶属于 Linux 基金会的标准组织,致力于定义和推广适用于现代计算环境的高性能以太网技术,成员包括超大规模计算厂商、系统供应商、芯片供应商等。
  • 核心使命:增强以太网在人工智能(AI)和高性能计算(HPC)中的应用,提高相关应用的性能、功能和互操作性。
  • 规范范围:涵盖从物理层到软件层的多层架构,包括传输协议、API 接口、网络管理等,支持 AI 训练、推理、HPC 及客户端 / 服务器等工作负载。

二、UEC 架构与关键概念

(一)整体架构

  • 分层结构:参考 ISO/OSI 模型,涵盖物理层、链路层、网络层、传输层及软件层,各层由不同工作组负责(如管理工作组、合规性工作组等)。
  • 传输配置文件:定义三种配置文件以适配不同工作负载:
  • AI Base:满足基础 AI 应用的高性能、低成本需求。
  • AI Full:在 AI Base 基础上增加可延迟发送、精确匹配等功能。
  • HPC:作为 AI Full 的超集,满足高性能计算需求。

(二)系统视图与术语

  • 核心组件
  • 前端端点(FEP):逻辑可寻址实体,分配 IP 地址,支持 UE 传输协议,连接计算节点与网络结构。
  • 交换矩阵(Fabric):由交换机和链路组成,分为控制平面、数据平面和管理平面,实现数据包转发与管理。
  • 节点与集群:节点是包含 FEP 的计算设备,集群由节点通过交换矩阵连接而成,支持并行作业和客户端 / 服务器两种计算模型。
  • 寻址模式
  • 相对寻址:用于并行作业,通过 JobID、PIDonFEP 等标识进程,支持大规模扩展。
  • 绝对寻址:用于客户端 / 服务器模型,通过 IP 地址、PIDonFEP 和资源索引(RI)定位服务。

(三)工作负载类型

  • AI 训练(AIT):以三维并行(数据并行、流水线并行、算子并行)为特征,需高带宽、中等延迟,消息大小通常为兆字节级。
  • AI 推理(AII):类似 AI 训练但无数据并行,批次小,延迟敏感,消息大小多为千字节级。
  • HPC:分为低深度(LD,高并行、低延迟敏感)和高深度(HD,长依赖链、高延迟敏感),消息大小差异大。
  • 客户端 / 服务器:如存储流量,请求拆分为小消息,可能出现随机拥塞。

三、软件与网络架构

(一)软件层

  • API 接口:支持 libfabric v2.0 API,与 AI 框架(如 TensorFlow、PyTorch)和 HPC 库无缝集成,无需应用程序修改。
  • 终端软件栈:FEP 上的软件栈包括语义子层、数据包传送子层(PDS)、拥塞管理子层(CMS)等,实现消息处理与传输。
  • 交换机软件栈:基于现有以太网交换机(如 SONiC、FBOSS),通过扩展支持 UE 功能(如数据包修剪),利用交换机抽象接口(SAI)与硬件交互。

(二)网络层

  • 网络分类
  • 前端网络:连接数据中心与外部,承载南北向(NS)和东西向(EW)流量,需高可用性和复杂功能(如安全策略)。
  • 后端横向扩展网络:专用高性能网络,支持 HPC 和 AI 训练,与前端网络分离,优化集体操作和低延迟。
  • 纵向扩展网络:短距离互连(如 GPU 间 NVLINK),支持内存语义和亚微秒级延迟。
  • 传输目标(UET):聚焦 RDMA 服务,优化 AI/HPC 工作负载,支持多路径、拥塞控制和端到端可靠性,兼容尽力而为和无损网络。
  • 拥塞管理:基于流量类别(TC)和显式拥塞通知(ECN),结合数据包修剪(可选)机制,减少丢包和延迟。

四、协议层规范

(一)传输层

  • 子层功能
  • 语义层(SES):通过 libfabric 集成应用框架,定义消息寻址与操作协议,支持零拷贝技术。
  • PDS 子层:提供可靠 / 不可靠、有序 / 无序数据包传送模式,适配不同应用需求。
  • CMS 子层:通过流量类别和多路径负载均衡实现拥塞控制,避免热点,提升网络利用率。
  • TSS 子层(可选):提供加密和密钥管理,保障 AI/HPC 作业数据安全。

(二)网络层(可选)

  • ECN 与数据包修剪:扩展 ECN 标记机制,允许交换机修剪竞争数据包并传递拥塞信号,FEP 强制支持接收修剪数据包。

(三)链路层(可选)

  • 链路层重试(LLR):减少端到端重传压力,提升延迟敏感型工作负载性能。
  • 基于信用的流量控制(CBFC):优化链路资源分配,可选支持部分工作负载。
  • 功能协商:通过 LLDP 等机制发现网络实体功能,确保互操作性。

(四)物理层

  • 标准遵循:基于 IEEE 802.3 100G 每通道信令,支持前向纠错(FEC),通过 FEC 统计预测链路质量,识别异常链路。

五、合规与互操作性

  • 合规要求:实现需满足规范中的强制性要求,可选功能若实现则需遵循定义。
  • 互操作性:通过配置文件、流量类别映射和功能协商机制,确保不同供应商设备的互操作性。

六、总结

UEC 规范通过分层架构和多维度优化,旨在解决 AI 和 HPC 领域对高性能网络的需求,在兼容现有以太网生态的基础上,提升带宽、降低延迟,并增强可扩展性和安全性,为大规模集群计算提供高效的网络解决方案。

此条目发表在未分类分类目录。将固定链接加入收藏夹。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注