日常巡检

最近更新时间: 2024-12-19 17:12:00

1 服务可用性检测

根据架构图找到各服务模块,通过对服务的域名+端口进行curl,验证系统各模块是否正常,例如:

  1. kg tcloud-tcenter-platform-cloudtrail,找到容器IP,比如: 192.168.241.175 curl -v -d '' http://192.168.241.175:50030 header 状态码返回 200,则表明访问服务正常。

  2. tcloud-tcenter-platform-cloudtraillog,找到容器IP,比如:192.168.239.227 curl -v -d '' http://192.168.239.227:50031 header 状态码返回 200,则表明访问服务正常。

2 服务健康性检测

登录租户端,进入到控制台云审计页面,查看是否有数据,数据时间是否及操作是否正常,点击加载更多,是否可以看到更多合法数据。等待5分钟后,再次点击加载更多,观察是否返回异常,异常是符合预期的应答,因为数据快照过期了。

3 服务工作状态检查

执行ps aux | grep QC, 观察master进程和worker进程是否正常运行,worker进程的数据是否符合预期。

4 审计日志生成检查

  1. 进入cloudtrail_log服务
  2. cd /data/log/cloudtrail_log/ca
  3. 打开当前时间的文件,观察是否有新数据产生