惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

钛媒体:引领未来商业与生活新知
钛媒体:引领未来商业与生活新知
Help Net Security
Help Net Security
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
T
Threat Research - Cisco Blogs
T
The Exploit Database - CXSecurity.com
P
Privacy International News Feed
T
Threatpost
T
Tor Project blog
AWS News Blog
AWS News Blog
S
Schneier on Security
Cyberwarzone
Cyberwarzone
The Hacker News
The Hacker News
Scott Helme
Scott Helme
C
Cybersecurity and Infrastructure Security Agency CISA
Application and Cybersecurity Blog
Application and Cybersecurity Blog
Cyber Security Advisories - MS-ISAC
Cyber Security Advisories - MS-ISAC
P
Palo Alto Networks Blog
P
Proofpoint News Feed
Vercel News
Vercel News
Recent Commits to openclaw:main
Recent Commits to openclaw:main
V
V2EX
腾讯CDC
C
CERT Recently Published Vulnerability Notes
www.infosecurity-magazine.com
www.infosecurity-magazine.com
V2EX - 技术
V2EX - 技术
C
Cyber Attacks, Cyber Crime and Cyber Security
MyScale Blog
MyScale Blog
博客园 - 三生石上(FineUI控件)
有赞技术团队
有赞技术团队
D
Docker
Security Latest
Security Latest
云风的 BLOG
云风的 BLOG
G
Google Developers Blog
Know Your Adversary
Know Your Adversary
宝玉的分享
宝玉的分享
爱范儿
爱范儿
Simon Willison's Weblog
Simon Willison's Weblog
N
News | PayPal Newsroom
Recent Announcements
Recent Announcements
小众软件
小众软件
Project Zero
Project Zero
SecWiki News
SecWiki News
Microsoft Azure Blog
Microsoft Azure Blog
月光博客
月光博客
Cloudbric
Cloudbric
博客园 - Franky
Forbes - Security
Forbes - Security
C
Cisco Blogs
Webroot Blog
Webroot Blog
H
Help Net Security

博客园_首页

Plist 二进制格式 Milvus 和 PGVector,哪个更好? OpenClaw 已过时?在 VS Code 中运行 Hermes Agent! 第30篇文章:一个大三计科生的自白 Manim如何在数学公式中完美显示中文? Docker 部署 RocketMQ 5 并发编程核心概念辨析 C#事务处理最佳实践:别再让“主表存了、明细丢了”的破事发生 CLI 是什么?为什么大厂突然集体卷命令行? 【从0到1构建一个ClaudeAgent】协作-自主Agent UIImageView 设置图片不生效的原因排查 最小二乘问题详解20:无先验约束下的增量式SFM自由网平差 痞子衡嵌入式:大话双核i.MXRT1180之XIP应用里借助MU实现可靠Flash IAP的方法 AI Chat 封装, SemanticKerne.AiProvider.Unified 已发布 Windows下右键编辑js文件无法打开记事本——在注册表中使用环境变量 在后台服务中使用 Scoped 服务,为什么总是报错? H200 安装驱动并使用sglang启动模型 wireshark 抓包Trap上报告警内容 我用 AI 辅助开发了一系列小工具(2):图片压缩工具 [A Primer On MC and CC] 2.1 Memory Consistency 1 - 指令重排序和 SC 模型 Oracle数据库SCN推进技术详解与实践指南 玩转控件:封装个带图片的Label控件 Claude Code 4.7 真正该升级的不是模型,而是你的工作流 前端小白一句话,AI 帮我做了个颜值拉满的桌面媒体播放器。当代码不再是门槛,一句话编程就是现实。 5. WorkBuddy: 小龙虾的灵魂三件套,让你的小龙虾不只是工具 SQLite 分片方案实战:三种分片策略的深度对比 告别简陋 UI!一款基于 Fluent Design 和基于 WinUI 的开源免费、现代化的 Avalonia UI 控件库 关于二进制排列组合枚举的总结 AI开发-python-LangGraph框架(3-27-LangGraph从零实现大模型智能决策工作流) ElasticSearch主分片和副本分片概念详解 【002】HTTPS 粗解:证书、TLS 握手与对后端配置的影响 Hermes Agent 一周暴涨五万 Star,但我劝你别急着追 明明连接的是Redis的DB0,为什么能查到DB3的数据? 【从0到1构建一个ClaudeAgent】协作-Agent团队 熟悉电子元器件之后,电子小白下一步该怎么走? MAF快速入门(23)通过C#类定义Skills .NET 高级开发 | 手写一个对象映射框架 FastAPI数据库ORM怎么选?我肝了三个Demo后,终于不再纠结了 mysqldump 参数拾遗:在遗忘与铭记之间 C# .NET 周刊|2026年3月5期 Claude code入门 - 陈彦斌 一文学习入门 ThingsBoard 开源物联网平台 GitHub 热门项目 | 2026年04月16日 如何为GIT设置全局勾子,为每次提交追加信息 Number.isFinite和isFinite与isNaN()和Number.isNaN的区别 PortSwigger SQL注入LAB2 推荐一个测试人必备的Skills,从功能到性能全搞定(附详细实操和安装下载方式) 筑基期:掌握Odoo基础核心知识点02(Odoo XML 开发方式详解) GLM模型这么火,咱们用vllm也咧一个呗! 深入理解 AbortController:从底层原理到跨语言设计哲学 字符串学习笔记 多租户系统框架的基础模块设计和分析设计 Apache SeaTunnel Zeta 为什么能做到“又快又稳”? AI开发-python-LangGraph框架(3-26-LangGraph基本概念及第一个简单样例) Vue 3 组件通信,别只会用 Props 和 Emits 了,这几个狠活儿你得看看 ElasticSearch7.X版本配置密码 用Manim实现动态交点计算--从一个动点问题说起 团结引擎+Addressable+Instant Game打包抖音小游戏 function call 实战:让 LLM 自动判断 pod 异常、调用日志工具并完成故障分析 bubseek —— 让 Agent 的足迹,变成团队的洞察 通过 C# 读取并导出 PDF 书签 如何用 GitHub Actions 实现 Steam 自动化发布 【从0到1构建一个ClaudeAgent】并发-后台任务 .NET 高级开发 | 定制 ASP.NET Core 框架 电子小白:什么是运算放大器(运放) zero2Agent:面向大厂面试的 Agent 工程教程,从概念到生产的完整学习路线 堆上的ORW HC32F460 USB CDC通信异常:非对齐访问异常排查 20260413-Hyperbridge 攻击事件:发生在默克尔山上的验证绕过 那些喊着AI 要淘汰你的人,正在靠你的焦虑赚大钱! 深度学习进阶(八)Swin Transformer 最小二乘问题详解19:带先验约束的增量式SFM优化与实现 SnapTranslate 3.0 正式发布:全局划词翻译 + 完整英语学习闭环,一站式搞定查词、记词、复习 工作的意义、工作的困难认知再思考 .NET + AI 进阶实战:基于类的技能开发 - 打造可治理的 Agent 能力模块 【从0到1构建一个ClaudeAgent】规划与协调-技能 上周热点回顾(4.6-4.12) 电子小白的工具三件套:面包板、杜邦线、万能板 单表五亿数据的查询优化 | Mysql、StarRocks 2. WorkBuddy:从“我是谁”到“帮我干活” C# 如何减少代码运行时间:7 个实战技巧 基于HelixToolkit.SharpDX 渲染3D模型 - 笺上知微 从零开始的双臂具身VLA起源及现阶段发展综述 - SkyXZ 记对 xonsh shell 的使用, 脚本编写, 迁移及调优 - pluvium27 受够了Vibe Coding的失控?换个起点,让AI事半功倍 从开始配置漏洞环境到漏洞复现流程 - 難しい 关于10年工作经验的程序员对OpenClaw的实战经验分享以及看法 - 虚无境 Any metadata 的内存布局 C# .NET 周刊|2026年3月2期 - InCerry 我帮你测过了,测试圈排名第二的 Skill 依然很牛逼 Skill Discovery | 无监督技能发现的经典工作总结 - MoonOut 上下文工程是什么?过时了么?一文讲明白! - 一枫说码 开了 TUN 模式还是直连?90% 的人都踩过这个坑 AScript扩展多种脚本语言 - rockey627 AI 学习笔记:Agent 的记忆机制 你能被装进一个文件里吗?——7 万人把同事"蒸馏"成了 AI - 我没有三颗心脏 Claude Code 通关手册(七):给 AI 装上技能包——Skills 完全指南 - 暮色之狐 在浏览器中快速编辑代码:VSCode Web 集成实践 - Newbe36524 蒸馏自己 skill?基于 Deepseek 的蒸馏器,丐版蒸馏方式,简单便捷 - To_Carpe_Diem Spring AI Aliababa和AgentScope,哪个更好? - 苏三说技术
Zabbix、Prometheus、Grafana、Nightingale,四个监控如何选型?
IT运维监控 · 2026-06-25 · via 博客园_首页

调研监控系统的时候,通常会看到这四个产品:Prometheus、Grafana、Zabbix、Nightingale,对新手而言,是个选型难题。本文尝试分别解释其适用场景和优缺点,当然了,每个人的认知都有局限,仅供大家参考。

Zabbix

在这里插入图片描述

Zabbix 是老牌监控产品,主要用于资产设备监控,比如监控网络设备、服务器,Zabbix 要求用户在 UI 上主动添加设备,填写连接地址、认证信息。是典型的资产式管理逻辑。

Zabbix 也可以监控 MySQL、Redis、Postgres、Kubernetes 等各类开源组件,但这不是它的长处,采集的指标偏少、海量指标不方便检索。

对于微服务指标监控,Zabbix 就更加不擅长了,这是 Prometheus 生态的天下。

Zabbix 产品经过多年打磨,产品完成度极高,体现在:

  • 沉淀了大量的模板,可以开箱即用监控各类网络设备
  • 数据采集时的 ETL 处理很完备,因为 SNMP 数据很不规整,促使 Zabbix 沉淀了很多预处理器
  • 告警事件的发送链路也有不错的抽象,多种媒介的适配、灵活的消息模板
  • 对各类老旧设备的兼容性很好,比如 AIX

Zabbix 仍然服役于大量企业,主要是解决设备监控的场景。

Prometheus

在这里插入图片描述

Prometheus 是模仿 Borgmon 诞生的,可谓师出名门,专门为时序数据研发了 TSDB(Time series database),简洁的查询语法、时序数据定义方式,已然成为业内事实标准。

Prometheus 社区有非常多的 Exporter,就是监控采集器,可以采集机器、数据库、中间件等各类监控数据,不同的 Exporter 通常是不同的社区贡献者维护的,所以实际使用时是要部署很多二进制。

可视化方面,Prometheus 仅提供实时 Ad-hoc 查询探索,不提供仪表盘能力,Prometheus 通常和 Grafana 配合使用,由 Grafana 提供仪表盘能力。

告警方面,Prometheus 提供的是 Yaml 文件方式来配置告警规则,没有提供 UI。Prometheus 是单点架构,进程里内置告警引擎,周期性查询自身的监控数据,产生告警事件,告警事件推给 Alertmanager 做后续的去重、静默、抑制、路由、发送。

Prometheus 生态非常开放,吸引了广大贡献者,Prometheus 是当前世界上最流行的监控生态。

实际在落地的时候,如果你们担心单点架构不可靠,或者你们数据量比较大,更建议使用 VictoriaMetrics,VictoriaMetrics 和 Prometheus 接口、协议兼容,姑且可以看作是分布式的 Prometheus。

Prometheus 社区也提供了 SNMP Exporter,也可以监控网络设备,不过相比 Zabbix 的开箱即用,要折腾得多,如果追求统一化平台,可以用 Prometheus 这套体系监控所有数据,如果想追求设备监控的开箱即用,可以两个产品配合使用。

Grafana

Grafana 的用户量是监控、可观测性领域最大的,因为它是可视化领域的老大。虽然 AI 发展迅猛,但是 AI 更擅长的是实时分析、推理,Grafana 不会被 AI 替代,Grafana 相当于是承接了 AI 生成的可视化数据。

Grafana 可以对接多种数据源,最丝滑的是 Prometheus、Mimir、VictoriaMetrics、Tempo、Loki,即:跟自己的产品对接最为丝滑。

Grafana 除了可以对接 Prometheus 查看数据,实际也可以对接 Zabbix 查看,有些人不喜欢 Zabbix 上个时代的 UI 风格,觉得 Grafana 更好看,实际从功能体验来看,我感觉 Zabbix 自身的数据就在 Zabbix 里看图就足够了。

Grafana 实际也可以做告警引擎,对不同的数据源配置告警规则,优点是可以联动多种数据源,缺点是对事件的 Pipeline 处理支持有限,国内使用 Grafana Alerting 的公司比较少。

Nightingale

Nightingale

夜莺项目(Nightingale)类似 Grafana 可以对接多种数据源,不过侧重在告警。如果你们有多套 Prometheus、多套 ElasticSearch,还有 ClickHouse、Loki 的数据需要做告警,还想使用 UI 管理告警规则,那夜莺是合适的。

如果你们只有少量 Prometheus,也能接受使用 Yaml 管理告警规则,那夜莺就有点重了。

夜莺提供了事件 Pipeline 的能力要着力说一下,这个能力可以对告警事件做一系列处理,并且可以对接自己的系统,比如告警产生之后,想要调用自己的系统补充上一些关键字段(Enrichment),或者调用自己的 AI 做个 Summary,或者把符合某类条件的告警 Drop 掉,或者做一下 Relabel,都可以使用 Pipeline 机制。

夜莺社区提供了一个采集器叫 Categraf,姑且可以理解为是把各类 Exporter 整合成了一个二进制,如果你不想部署这么多 Exporter,想用一个进程打天下,Categraf 是可以考虑的。

总结

我看到社区里很多人是组合方案,看图使用 Grafana,告警使用 Nightingale,TSDB 使用 VictoriaMetrics,日志库使用 ElasticSearch 或者 VictoriaLogs,让每个项目只工作在自己最擅长的领域,或许就是企业落地的最佳实践。