發佈於:

2026年5月1日

Amazon Elastic Kubernetes Service(Amazon EKS)現在支持 Elastic Fabric Adapter(EFA)使用動態資源分配(DRA)功能,從而簡化了人工智能、機器學習和高性能計算(HPC)工作負載的高性能節點間通信及遠程直接內存訪問(RDMA)。EFA DRA 驅動程序基於上游 DRANET 項目構建,可為在 Kubernetes 上運行的工作負載提供 EFA 接口共享和拓撲感知分配功能。

藉助 EFA DRA 驅動程序,您可以分配共享同一 PCIe 根設備或設備組的 EFA 接口和加速器設備,確保節點間流量通過距離節點上每個 NVIDIA GPU、AWS Trainium 或 AWS Inferentia 設備最近的網絡接口進行傳輸。EFA DRA 驅動程序還支持在同一節點上的不同工作負載之間共享 EFA 接口,以最大限度地提高 EFA 接口的利用率。

對於在運行 Kubernetes 1.34 或更高版本的 Amazon EKS 集群上進行的新部署,無論使用的是 EKS 託管節點組還是自主管理節點,均建議使用 EFA DRA 驅動程序。EFA DRA 驅動程序現已在所有提供 Amazon EKS 的 AWS 區域推出。EFA 設備插件仍受支持,建議與 Karpenter 和 Amazon EKS 自動模式配合使用。

如需瞭解更多信息,請參閱“Amazon EKS 用戶指南”中的在 Amazon EKS 上管理 EFA 設備