适合对象:准备落地平台、负责环境联调、排查故障的测试工程师、研发工程师、平台工程师。一、为什么部署与排障是这套平台最后也是最重要的一环前面的文章讲了采集、传输、覆盖率、快照、版本和智能分析,但这些能力都建立在一个前提上:系统必须先稳定跑起来。实际落地时,失败往往不出在业务逻辑,而出在这些地方:依赖服务没启动;网络没打通;启动顺序不对;探针参数有误;平台能起但关键子能力不可用;某些模块看似正常,实际链路已经断裂。所以部署篇的重点不是“怎么敲命令”,而是“怎样保证整条能力链真正连通”。二、部署前至少要确认哪些前提这类平台在运行前,通常至少依赖四类基础条件:目标应用允许接入运行时探针;服务端依赖的中间件可用;代码仓库或代码缓存路径可访问;平台与目标应用之间网络可互通。如果缺少其中任何一项,平台都可能表现为“部分能用、部分失效”。例如:服务端能启动,但取不到链路数据;快照能保存,但覆盖率无法生成;页面能打开,但增量分析始终失败;探针已注入,但服务端收不到任何上报。图 1:部署前提