故障记录

support 服务自动化部署无法启动

  • support 服务自动化部署节点掉线
  • 使用鲁班启动节点功能,无法启动
  • 登录服务器,发现部署用户 appuser 线程数满
  • 使用 /proc/PID_NUM/status发现 support 服务下有10000个线程
  • 使用 jstack 打印进程的栈信息
  • 发现线程主要是 druid 线程池的创建和销毁线程
  • 服务加 druid 可视化监控
  • 发现在执行数据同步的时候,会生成新的 druid 线程池,并且线程池不会销毁
  • 排查代码,发现创建的 dataSource 没有被关闭
  • 将 dataSource 放入 try-resource 中,问题解决