故障记录
support 服务自动化部署无法启动
- support 服务自动化部署节点掉线
- 使用鲁班启动节点功能,无法启动
- 登录服务器,发现部署用户 appuser 线程数满
- 使用
/proc/PID_NUM/status
发现 support 服务下有10000个线程 - 使用
jstack
打印进程的栈信息 - 发现线程主要是 druid 线程池的创建和销毁线程
- 服务加 druid 可视化监控
- 发现在执行数据同步的时候,会生成新的 druid 线程池,并且线程池不会销毁
- 排查代码,发现创建的 dataSource 没有被关闭
- 将 dataSource 放入 try-resource 中,问题解决