惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

G
GRAHAM CLULEY
让小产品的独立变现更简单 - ezindie.com
让小产品的独立变现更简单 - ezindie.com
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
奇客Solidot–传递最新科技情报
奇客Solidot–传递最新科技情报
U
Unit 42
Google DeepMind News
Google DeepMind News
GbyAI
GbyAI
T
Tailwind CSS Blog
博客园 - 司徒正美
The Cloudflare Blog
有赞技术团队
有赞技术团队
罗磊的独立博客
MyScale Blog
MyScale Blog
V
V2EX
T
Tor Project blog
C
Check Point Blog
B
Blog
月光博客
月光博客
Last Week in AI
Last Week in AI
www.infosecurity-magazine.com
www.infosecurity-magazine.com
A
About on SuperTechFans
Hugging Face - Blog
Hugging Face - Blog
P
Privacy & Cybersecurity Law Blog
Simon Willison's Weblog
Simon Willison's Weblog
博客园 - 【当耐特】
J
Java Code Geeks
L
Lohrmann on Cybersecurity
D
DataBreaches.Net
T
Threatpost
AWS News Blog
AWS News Blog
L
LINUX DO - 热门话题
Blog — PlanetScale
Blog — PlanetScale
Microsoft Azure Blog
Microsoft Azure Blog
H
Hackread – Cybersecurity News, Data Breaches, AI and More
S
Securelist
I
Intezer
酷 壳 – CoolShell
酷 壳 – CoolShell
Y
Y Combinator Blog
Spread Privacy
Spread Privacy
腾讯CDC
Jina AI
Jina AI
博客园 - 叶小钗
C
Cisco Blogs
Project Zero
Project Zero
Apple Machine Learning Research
Apple Machine Learning Research
P
Privacy International News Feed
P
Proofpoint News Feed
Martin Fowler
Martin Fowler
F
Fortinet All Blogs
K
Kaspersky official blog

Docker

Homelab 部署的服务用 latest 还是固定版本? - V2EX 有啥基于 docker 的类似于微信文件传输助手的东西吗? 有没有什么比较优雅且轻量化的 web 端微信解决方案? V2EX 请问 OrbStack 界面下不能修改参数吗? - V2EX V2EX mac 上面的 docker desktop 都更新些啥啊 - V2EX 阿里云轻量服务器中拉取 Docker 镜像问题 - V2EX 现在大家如何拉取 Docker 镜像? - V2EX 轻量级 OCR 文字识别服务 netnr/liteocr - V2EX 现在官方 docker 拉镜像必须 TUN+全局了吗 - V2EX 请教一下佬们,在使用 1panel 的情况下,有没有必要再部署 Traefik 作为 Docker 统一网关? - V2EX 创建 docker 镜像时为了防止结束,运行 sleep infinity 和 tail -f /dev/null 哪个更好 - V2EX 2025 年了,大家公司的服务器用的是 debian 还是 ubuntu 呀 - V2EX Watchtower 停止维护 - V2EX NAS 上部署自制 docker 程序发生网络连接相关问题 - V2EX 请问下现代的 docker 版本,是无法再使用 centos6.8 这类容器了么? - V2EX 现在是不推荐使用 阿里云或腾讯云或高校的 dokcer 镜像源吗? 为什么? 一直挂梯子用 docker, 不了解现在的情况了 - V2EX 私有化部署了一套公司的系统,如何有效保护容器里面的文件不被客户拿到 - V2EX Docker 29.1 不能解析外部 dns - V2EX 求助 docker 中安装 portainer 不能连接 docker.sock - V2EX 公司禁用 Docker - V2EX V2EX macos 下使用 orbstack 如何才能不挂载目录? - V2EX Docker 镜像的 UID、GID 管理都这么阴间的么? - V2EX 请教一个 Docker/Traefik 的网路问题 - V2EX docker compose 在生产上用的多吗,小规模 - V2EX 2025 年了,感觉 podman 已经比 docker 好用太多了,就差一个杀手级的 GUI 配置了 - V2EX ttl.sh 被阿里做掉了,怎么办? - V2EX 万物皆 docker 部署,真的有必要吗? - V2EX 只做镜像 harbor nexus 两个软件对比选择哪个呢? - V2EX 在容器里运行 VPN,如何接管其他容器的流量作为默认出口? - V2EX docker 重磅安全漏洞 - V2EX 请教一个关于 docker 间的通信问题 - V2EX [求助] Debian12 修改 docker 的 daemon.json 文件后不生效 - V2EX docker compose 那个内部 DNS 到底是怎么工作的 - V2EX 小白求助, Docker 报错 132 是什么问题呢? - V2EX 自己搭建一个 docker 镜像站 - V2EX WSL 中无法访问 registry-1.docker.io/v2/,没法用 docker 拉取 image,试了很多方法都不行,累了 - V2EX 怎么对 docker 的容器限速 - V2EX V2EX 请教大家一个关于 docker 网络的问题 - V2EX 为什么国内镜像源都不更新国外的镜像? - V2EX 请问 docker 镜像是否存在版本兼容问题? - V2EX 有没有可行的 reproducible 容器环境方案? - V2EX 不安装 docker 有办法直接下载镜像 tar 包吗? - V2EX 在国内服务器上使用 sing-box 方便的拉取 docker 镜像 - V2EX 有没有带权限的 docker 管理工具 - V2EX Openp2p 远程访问飞牛 NAS 内应用不成功,请有经验的老铁指教。 - V2EX 有没有让 docker 容器休眠的方法 - V2EX 生产环境部署疑问 运行 docker 容器需要指定一个版本吗 - V2EX
docker ps 显示正在运行,但是服务已经 down 了 - V2EX
c4923 · 2025-11-03 · via Docker

c4923

 

c4923 · 2025 年 11 月 3 日 · 3834 次点击

这是一个创建于 223 天前的主题,其中的信息可能已经有所发展或是发生改变。

这段时间我们这边服务经常遇到一个诡异的问题。

服务在容器中正常运行了 2-3 周,期间没有人管过。某一天后端服务突然挂掉不再提供服务了。

排查性能相关,cpu ,磁盘,内存都是正常的,docker ps 也显示正常没有重启之类的情况。但是 docker logs 日志停止输出。必须手动 docker restart 才能恢复服务,文件描述符数量也正常,容器日志也不存在写满的情况。因为要优先恢复服务可用性,所以没办法再排查更加细致的内容,有没有大佬遇到过类似的问题?或者说有大佬能提供一下下次出现类似情况的排查思路吗?

docker 版本是 23.0.6

defunct9

1

defunct9      2025 年 11 月 3 日   ❤️ 4

开 ssh ,让我上去看看

finab

2

finab      2025 年 11 月 3 日   ❤️ 1

你 docker 运行的不是提供服务本身的那个进程吧?

log4j

5

log4j      2025 年 11 月 3 日   ❤️ 2

有没有可能你服务的进程不是 0 号?这种情况它异常退出后 docker 是不知道

v2er4241

6

v2er4241      2025 年 11 月 3 日   ❤️ 1

多半是自己程序的 bug ,异常终止了。docker logs 的输出内容是可以通过程序修改的,所以如果程序自己崩了,没有弹出异常,docker 容器也不知道发生了什么。检查一下程序有没有 bug 吧。

c4923

7

c4923      2025 年 11 月 3 日

@klo424 目前初步怀疑确实是程序本身的问题,但因为不好排查所以无法判断,而且同一个版本下使用 Windows 的二进制运行的没有出现过类似的问题

c4923

8

c4923      2025 年 11 月 3 日

@log4j 看了下,服务本身确实不是 0 号进程,0 号进程是一个启动脚本。那就更可能是服务本身出现了问题。

taohua1c

10

taohua1c      2025 年 11 月 3 日

写个定时任务,每晚重启下 docker 服务,先跑着

johnbobby

13

johnbobby      2025 年 11 月 3 日

dockerfile 有问题吧,就像楼上说的不是 0 号进程

deplives

15

deplives      2025 年 11 月 3 日

盲猜 dockerfile 有问题,容器内启动的进程不是 0 导致即使服务挂了 docker 也认为没有问题一切正常

xzysaber

16

xzysaber      2025 年 11 月 3 日

这就是为什么 Docker 推荐一个容器一个进程,即使多个进程也要有成熟的进程管理工具。

newaccount

17

newaccount      2025 年 11 月 3 日

你有请求日志吧?把那些重放一遍看能重现出来不,不然等 2-3 周实在没法弄

TeeMoCode

18

TeeMoCode      2025 年 11 月 3 日

脚本中启动服务的命令是用的 exec 么?

laminux29

19

laminux29      2025 年 11 月 3 日

如果把容器实例当成物理宿主机,虽然里面的服务进程挂起,但物理宿主机是仍然在运行的,因此你用 docker ps 显示容器实例正在运行,是正常现象。至于 docker log 无输出,是因为 docker log 可能绑定到服务进程的 log 输出,由于服务进程挂起,无 log 输出,所以你用 docker log 也无输出了。

c4923

21

c4923      2025 年 11 月 3 日

@johnbobby dockerfile 没有改动过,之前从来没遇到过这种问题。

fds

24

fds      2025 年 11 月 3 日   ❤️ 1

保留现场,根据是什么语言,用相应工具提取一下 stack 看看卡在哪里了。
软件 bug 很常见的,特别是有些异常输入之类的。大概率不是 docker 的问题。
你要保证可用性,建议前面加个负载均衡之类的服务,这样一个停了,可以直接启动另外一个,然后分析前一个的状态。

hefish

25

hefish      2025 年 11 月 3 日

多数是服务停了,但是启动服务的 shell 还活着。在等待控制台的输入。

MineDog

26

MineDog      2025 年 11 月 3 日

从来都是 pid=1 的进程吧,0 号进程是什么

TeeMoCode

27

TeeMoCode      2025 年 11 月 3 日

@c4923 脚本里面用 exec 启动服务,pid=1 的就是你的服务进程。执行 docker ps 看状态是 up ,那说明 pid=1 还活着。 用 docker exec 进容器执行 ps -p 1 -o stat,rss,vsz,cmd,wchan 看进程状态如何呢

yinmin

28

yinmin      2025 年 11 月 3 日 via iPhone

大概率是服务程序的代码 bug ,或者程序引入模块的 bug 。有些服务架构是有外部调用多少次就重启一个新进程,可以规避长时间运行不稳定的情况。

julyclyde

29

julyclyde      2025 年 11 月 5 日

我猜你是用脚本启动的服务进程然后在脚本里做了无限等待吧