惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

SecWiki News
SecWiki News
I
InfoQ
The Cloudflare Blog
人人都是产品经理
人人都是产品经理
博客园 - Franky
T
Tailwind CSS Blog
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
量子位
博客园_首页
罗磊的独立博客
V
V2EX
李成银的技术随笔
大猫的无限游戏
大猫的无限游戏
钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
T
True Tiger Recordings
Vercel News
Vercel News
Cyberwarzone
Cyberwarzone
Cisco Talos Blog
Cisco Talos Blog
F
Fox-IT International blog
D
Darknet – Hacking Tools, Hacker News & Cyber Security
M
Microsoft Research Blog - Microsoft Research
Know Your Adversary
Know Your Adversary
爱范儿
爱范儿
The Register - Security
The Register - Security
G
Google Developers Blog
The Hacker News
The Hacker News
Malwarebytes
Malwarebytes
S
Securelist
博客园 - 三生石上(FineUI控件)
Jina AI
Jina AI
T
Threat Research - Cisco Blogs
T
The Exploit Database - CXSecurity.com
S
SegmentFault 最新的问题
博客园 - 叶小钗
F
Fortinet All Blogs
Apple Machine Learning Research
Apple Machine Learning Research
宝玉的分享
宝玉的分享
博客园 - 聂微东
T
Threatpost
博客园 - 【当耐特】
D
Docker
P
Privacy & Cybersecurity Law Blog
www.infosecurity-magazine.com
www.infosecurity-magazine.com
G
GRAHAM CLULEY
V
Visual Studio Blog
C
Cisco Blogs
IT之家
IT之家
S
Security Archives - TechRepublic
Latest news
Latest news
阮一峰的网络日志
阮一峰的网络日志

陈少文的网站

容器化部署 Hermes Agent 部署 JuiceFS CSI Driver 使用 A2A Gateway 打通多 OpenClaw Loggie 部署与配置 OpenClaw 运维 - 让飞轮转起来 你也可以这样落地 AI Agent - SOPS 篇 AGFS 文件系统性能测试 面向 AI Agent 的文件系统 - AGFS OpenViking 使用与 OpenClaw 集成 如何远程给OpenClaw发送消息 容器化部署 OpenClaw 使用 Skills 和 MCP 扩展 OpenClaw OpenClaw 安装与配置 LVM 日常运维 MinIO 基础设施选型与优化 容器部署 ClickHouse 容器化部署 Redis 容器部署中间件 容器部署多节点 FoundationDB 及运维 使用 HAProxy 代理 MinIO 及性能测试 多机多盘 MinIO 集群在不同纠删码配置下的性能测试 多机多盘 minio 集群不同纠删码配置在 IPoIB 下的性能测试 MinIO 多节点多盘部署与运维 Cursor 之下,何以立足 你也可以这样落地 AI Agent - MCP 篇 阿里云 eRDMA 测试及 PD 分离应用部署 你也可以这样落地 AI Agent - 运维事件篇 常见的几种 LLM Agent 架构 你也可以这样落地 AI Agent - 案例篇 ext4、xfs、zfs、btrfs 在 RAID6 下的性能测试 RAID 下 ZFS 运维操作 RAID 下 XFS 运维操作 RAID 下 Btrfs 运维操作 xfs 在各种 RAID 下的性能测试 RAID 存储技术 使用 LLaMA-Factory 微调 Qwen3 模型 vLLM 部署 PD 分离应用 使用 lmcache 能显著改善模型推理的 TTFT 什么是 Prefix Cache NVIDIA RTX 5090 推理测试 什么是模型量化 Kubernetes 基础环境要求 如何升级 Kubernetes 节点的 cgroup 版本 在服务器上使用 claude-code 常用 NPU 运维及故障处理 NVIDIA DCGM 使用指南 如何清理僵尸进程 使用 VLLM Benchmark 进行模型性能测试 眼看他拔地起,眼看他化作泥 - KubeSphere 在 Kubernetes 集群部署 Dragonfly history 命令使用 AI 相关论文 在服务器上使用 Gemini CLI Ascend DMI 工具使用指南 Kubernetes 下开源的 GPU 虚拟化项目 FoundationDB 数据备份与恢复 认知觉醒 给 Node Exporter 添加抓取凭证 部署 smokeping-prober 探测网络质量 Opscli 支持 MCP 提供 Cline\Cursor 集成 kube-proxy 异常导致节点上的 Pod 无法访问 Service 为什么 NFS Over RDMA 比 NFS 的 FIO 大块读性能好很多 3FS 关键技术和设计 DeepSeek 3FS 运维指南 容器化部署 DeepSeek 3FS 存储系统 3FS 的一些性能测试 在 Kubernetes 中使用 Fluid 挂载 3FS 存储及性能测试 NFS Over RDMA kubectl logs 无法查看 Pod 日志报错 NotFound 使用 Dante 提供 SOCKS5 转发 使用 Calico 限制 Pod 的带宽 分布式计算框架 Ray 以 Qwen 为例,学习大模型的结构 NVIDIA 环境变量配置 Ascend 环境变量配置 Fluid 下的 Juicefs 企业版维护 使用 vLLM 进行模型推理 使用 Nerdctl 构建多架构镜像 使用 vLLM 应用验证推理节点 AI 应用开发技术栈 在 Kubernetes 部署 Jumpserver 跳板机 使用 Ops 项目查看并监控集群事件 使用 Fluid 和 S3FS 对接 S3 存储及性能测试 使用 Fluid 对接 S3 存储及性能测试 使用 TensorBoard 可视化 PyTorch 训练过程 使用 PyTorch 在 MNIST 数据集训练模型 Ubuntu 切换指定版本的内核 MPI 通信原语及 Python 编程使用 Ops 发布 v1.0.0 版本 RDMA 技术 SR-IOV 技术 InfiniBand 网络及常用命令 使用 Fluid 对接 OBS 存储及性能测试 使用 Iceberg 和 Spark 在 Kubernetes 上处理数据 GPU 主机如何开启 GDS 什么是 Token 什么是 FLOPs 什么是 PD 分离 Kubernetes 下的 DLRover 工作流程分析 NVIDIA GPU 核心与架构演进史
常见的几种网络拓扑结构
2024-11-06 · via 陈少文的网站

Please enable Javascript to view the contents

常见的几种网络拓扑结构

1. Fat-Tree

1985 年 麻省理工学院的 Charles E. Leiserson 发明了 Fat-Tree 胖树网络。如下图,胖树网络是一颗二叉树,从更节点到叶子节点带宽逐步增加。

2008 年 8 月,加州大学圣地亚哥分校的一组计算机科学家发表了一个可扩展的网络架构设计,该设计采用受胖树拓扑启发的拓扑结构,实现了比以前的分层网络扩展性更好的网络。

Fat-Tree 网络的优势:

  • 负载均衡
  • 低延迟

Fat-Tree 网络的劣势:

  • 规模受到核心交换机端口数量限制
  • 底层容错性能差
  • 不能很好适应 one-to-all、all-to-all 的通信模式

2. Spine-Leaf

Spine-Leaf(脊叶)网络是一种常见的数据中心网络架构。不同于传统的分层网络结构,Spine-Leaf 网络在两个级别上实现了均衡的拓扑结构:Spine 层和 Leaf 层。Leaf 层的交换机连接服务器,而 Spine 层的交换机则负责连接 Leaf 层的交换机。每个 Leaf 交换机连接到每个 Spine 交换机,从而提供了高带宽和低延迟的通信路径。

Spine-Leaf 网络的优势:

  • 横向扩展性好:可以通过增加 Spine 和 Leaf 层的交换机数量来增加网络容量
  • 高可靠性:支持多路径,可以有效避免单点故障
  • 低延迟:采用等距的多路径连接,数据传输路径简洁稳定

Spine-Leaf 网络的劣势:

  • 成本较高:每个 Leaf 交换机需要连接到所有 Spine 交换机,导致连接数量大
  • 配置复杂:需要精心规划交换机之间的连接,以保持网络对称性
  • 适应性有限:在特定应用场景下可能需要对 Leaf 层的连接方式进行调整

3. Dragonfly

Dragonfly 网络是由 John Kim 等人于 2008 年提出的一种高效的网络拓扑结构,最早应用于高性能计算(HPC)集群。该结构主要解决了传统胖树网络架构中带宽和成本的矛盾,特别适合大规模并行计算和数据密集型任务。Dragonfly 网络通过分层级的交换机和链路,将网络划分为多个群组(group),每个群组包含多个路由器或交换机,并且群组之间通过相对少的跨群组链路互联。

Dragonfly 网络的优势:

  • 高带宽利用率:通过本地和全局连接实现有效的数据传输
  • 网络直径小:较短的跳数提升了数据传输速度,减少了延迟
  • 成本低:通过有效的连接方式降低了整体布线和硬件成本

Dragonfly 网络的劣势:

  • 路由复杂性高:全局连接需要较为复杂的路由算法
  • 容错性一般:故障可能会影响较大范围的连接
  • 不适合小规模网络:在小规模部署中,Dragonfly 的结构可能导致资源浪费

4. Torus

Torus(环形网络)是一种在高性能计算(HPC)和分布式系统中常见的拓扑结构,最早由计算机科学家在 20 世纪 80 年代提出并应用于并行计算架构。

Torus 网络是一种多维的网格结构,边界节点通过额外的连接形成闭环,使得每个节点的连接更加对称。

Torus 网络的优势

  • 良好的负载均衡:各节点连接均衡,能有效分散通信负载
  • 低网络延迟:由于闭环连接,每个节点到其他节点的距离较短,通信延迟低
  • 高容错性:多路径连接使得网络能在单点故障下维持通信

Torus 网络的劣势

  • 扩展性有限:在高维情况下,网格边界和节点数量会大幅增长,硬件复杂度增加
  • 布线复杂:特别是在三维及更高维度时,布线和节点连接变得困难
  • 不适合广播通信:对于 one-to-all 和 all-to-all 通信模式,Torus 的拓扑结构表现较差,广播效率低

微信公众号

作者

微信公众号