1 服务可用性检测
根据架构图找到各服务模块,通过对服务的域名+端口进行curl,验证系统各模块是否正常,例如:
kg tcloud-tcenter-platform-cloudtrail,找到容器IP,比如: 192.168.241.175 curl -v -d '' http://192.168.241.175:50030 header 状态码返回 200,则表明访问服务正常。
tcloud-tcenter-platform-cloudtraillog,找到容器IP,比如:192.168.239.227 curl -v -d '' http://192.168.239.227:50031 header 状态码返回 200,则表明访问服务正常。
2 服务健康性检测
登录租户端,进入到控制台云审计页面,查看是否有数据,数据时间是否及操作是否正常,点击加载更多,是否可以看到更多合法数据。等待5分钟后,再次点击加载更多,观察是否返回异常,异常是符合预期的应答,因为数据快照过期了。
3 服务工作状态检查
执行ps aux | grep QC
, 观察master进程和worker进程是否正常运行,worker进程的数据是否符合预期。
4 审计日志生成检查
- 进入cloudtrail_log服务
- cd /data/log/cloudtrail_log/ca
- 打开当前时间的文件,观察是否有新数据产生