Docker容器反复重启？别急着重启，先学会用`docker logs`和`docker stats`揪出真凶（以MongoDB为例）

张

张建站

2026/4/24 16:23:42

10分钟阅读

Docker容器反复重启？别急着重启，先学会用`docker logs`和`docker stats`揪出真凶（以MongoDB为例）

Docker容器反复重启用docker logs和docker stats定位问题根源当你兴冲冲地部署了一个MongoDB容器却发现它像中了邪一样不断重启那种挫败感我太熟悉了。大多数人的第一反应是反复执行docker restart但这就像给发烧病人不停吃退烧药却不查病因——治标不治本。今天我想分享一套系统性的排查方法论让你像侦探破案一样通过docker logs、docker stats等工具组合揪出容器反复重启的真凶。1. 为什么容器会反复重启容器反复重启通常不是Docker本身的问题而是内部应用崩溃导致的连锁反应。就像一栋大楼频繁停电可能是内部电路过载而非供电局的问题。常见原因包括资源不足内存耗尽、CPU过载、磁盘空间不足配置错误环境变量缺失、端口冲突、挂载路径错误应用崩溃未捕获的异常、依赖缺失、版本不兼容健康检查失败自定义的健康检查脚本返回非零状态典型症状执行docker ps会看到容器的STATUS在Restarting和Exited之间快速切换就像这样CONTAINER ID IMAGE COMMAND STATUS PORTS NAMES 53e19ff18138 mongo:6.0 docker-entrypoint.s… Restarting (1) 2 seconds ago mongodb2. 第一步查看应用日志docker logs当容器反复重启时docker logs是你的第一把手术刀。它能直接输出容器内应用的标准输出和错误流相当于病人的主诉。2.1 基础用法docker logs 容器ID或名称 # 查看最新日志 docker logs --tail100 容器ID # 只看最后100行 docker logs -f 容器ID # 实时跟踪日志(类似tail -f)2.2 分析MongoDB崩溃日志以原始内容中的MongoDB崩溃为例关键错误信息是std::system_error: Operation not permitted这行报错就像犯罪现场的指纹告诉我们异常类型std::system_error系统级错误具体原因Operation not permitted操作被拒绝深度解读这类错误通常发生在容器试图执行某些需要特权的系统调用时可能是ulimit设置过低、内核权限不足或seccomp安全策略限制MongoDB在启动时需要创建线程如果线程数受限就会抛出此异常2.3 日志分析技巧时间过滤用--since和--until缩小排查范围docker logs --since 2024-01-01T00:00:00 容器IDJSON格式化对结构化日志使用jq工具docker logs 容器ID | jq .多容器对比当有多个实例时比较它们的日志差异提示如果容器启动太快就崩溃可以尝试docker logs --details获取更详细的上下文信息。3. 第二步监控资源使用docker stats如果说日志告诉我们发生了什么那么docker stats则揭示为什么会发生。它是诊断资源问题的听诊器。3.1 实时资源监控docker stats 容器ID输出示例CONTAINER ID NAME CPU % MEM USAGE / LIMIT MEM % NET I/O BLOCK I/O PIDS 53e19ff18138 mongo 150% 2.5GiB / 3GiB 83.33% 1.2MB/3.4MB 0B/0B 45关键指标解读指标正常范围危险信号可能问题CPU %70%持续90%计算密集型任务或死循环MEM USAGE80%限制接近或达到限制内存泄漏或配置不足MEM %90%100%OOM Killer可能介入PIDS视应用而定异常增长进程泄漏或fork炸弹3.2 资源问题解决方案如果发现资源瓶颈CPU过高docker update --cpus 2 容器ID # 限制CPU核心数内存不足docker update -m 4g --memory-swap 4g 容器ID # 设置内存上限磁盘IOdocker run --device-write-bps /dev/sda:10mb 镜像 # 限制写入速度4. 第三步深入容器内部docker inspect当日志和资源监控仍不能定位问题时docker inspect就像CT扫描能查看容器的完整配置和状态。4.1 获取完整配置docker inspect 容器ID | less # 分页查看全部信息重点关注这些字段State容器的退出代码和错误信息HostConfig资源限制、重启策略等Mounts卷挂载是否正确NetworkSettings端口映射和IP配置4.2 解析重启原因一个典型的崩溃状态如下State: { Status: exited, Running: false, Paused: false, Restarting: false, OOMKilled: false, Dead: false, Pid: 0, ExitCode: 137, Error: , StartedAt: 2024-03-01T08:00:00Z, FinishedAt: 2024-03-01T08:00:05Z }关键退出码解读退出码含义常见原因0正常退出应用自行退出1一般错误未捕获异常或配置错误137SIGKILL (被强制终止)OOM Killer或手动kill143SIGTERM (优雅终止)收到停止信号4.3 检查重启策略查看容器的重启策略也很重要docker inspect -f {{.HostConfig.RestartPolicy.Name}} 容器ID可能的策略no不自动重启默认on-failure非零退出时重启always总是重启unless-stopped除非手动停止否则总是重启注意不合理的重启策略可能掩盖根本问题导致容器陷入崩溃-重启的死循环。5. 高级诊断技巧5.1 进入崩溃的容器对于快速崩溃的容器可以尝试在启动时覆盖入口点docker run -it --entrypoint /bin/sh mongo:6.0然后手动执行原启动命令观察实时输出。5.2 使用docker events监控docker events --filter eventdie --filter container容器ID这会输出容器的死亡事件及退出码适合诊断间歇性崩溃。5.3 内核日志分析有时需要查看宿主机的内核日志journalctl -k | grep -i oom # 查找OOM事件 dmesg | grep -i docker # 查找Docker相关内核消息5.4 资源限制检查检查系统级资源限制ulimit -a # 显示当前用户限制 cat /proc/$(docker inspect -f {{.State.Pid}} 容器ID)/limits # 查看容器进程限制6. MongoDB特定问题排查回到最初的MongoDB案例结合所有工具的分析我们可以构建完整的诊断流程日志分析发现Operation not permitted错误资源检查确认内存和CPU充足权限验证检查容器是否以--privileged运行线程限制检查ulimit的nproc设置版本测试尝试不同MongoDB版本最终解决方案可能是docker run -d --name mongo \ --ulimit nofile64000:64000 \ --ulimit nproc64000:64000 \ -m 4g \ mongo:6.0或者使用更适合资源受限环境的MongoDB版本docker run -d --name mongo mongo:5.0

浏览器音频解密实战：Unlock Music项目技术深度解析

浏览器音频解密实战：Unlock Music项目技术深度解析【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库： 1. https://github.com/unlock-music/unlock-music ；2. https://git.unlock-music.dev/um/web 项目地址: https://…...

2026/4/24 16:23:39 阅读更多 →

2026届最火的十大降AI率神器推荐

Ai论文网站排名（开题报告、文献综述、降aigc率、降重综合对比） TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 由于人工智能生成内容变得越来越普遍，在学术范畴之内，对于AI代写论文…...

2026/4/24 16:15:35 阅读更多 →

深入理解Java虚拟机内存管理机制

深入理解Java虚拟机内存管理机制 Java虚拟机（JVM）作为Java程序运行的核心环境，其内存管理机制直接影响程序的性能和稳定性。理解JVM内存管理不仅有助于优化代码，还能有效避免内存泄漏和溢出等问题。本文将深入探讨JVM内存管理的核…...

2026/4/24 16:13:27 阅读更多 →

背靠背VSC直流母线电压控制与同步发电机并网发散问题：原理、分析与解决方案

背靠背VSC直流母线电压控制与同步发电机并网发散问题：原理、分析与解决方案摘要背靠背电压源换流器（Back-to-Back VSC）是现代柔性直流输电和新能源并网系统的核心设备。在实际工程调试中，经常出现一个令人困扰的现象：当采用“三相电源-VSC-直流母线-VSC-三相电源”的背…...

2026/4/24 1:12:17 阅读更多 →

5分钟搞定抖音素材批量下载：douyin-downloader让你的创作效率翻倍

5分钟搞定抖音素材批量下载：douyin-downloader让你的创作效率翻倍【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fal…...

2026/4/24 0:38:32 阅读更多 →