1.问题描述:
客户备机设备没有流量,但是在整点时刻CPU突然增高;
2.故障原因分析:
2.1CPU统计信息
近一天CPU波动显示:
近三小时CPU波动显示:
九点整左右CPU增高期间的CPU波动:
2.2Top输出
从上文第三张图可以看到客户的CPU增高主要在09:01:00到09:01:30这段时间内,在客户提供的此期间收集的top输出可以看到,在09:01:07 OpenSSL进程占用core 3的CPU最高,在09:01:26时OpenSSL进程占用core 1 的CPU最高,而且在此期间内均是OpenSSL进程占用CPU最高。
3.解决方案:
参考:K63120332:CPU 使用率每小时飙升 https://support.f5.com/csp/article/K63120332
Description
CPU 使用率每小时激增一次,只有奇数内核受到影响(控制平面)。
Cause
行为是设计使然。BIG-IP 系统每小时生成新的 Diffie-Hellman (DH) 参数。
有关详细信息,请参阅: K14818:每小时生成新的 Diffie-Hellman 参数。
To determine the cause:
4.操作步骤:
收集top输出
修改top输出的格式
1、run top command
2、press "1"、press "f" then "j", then press Enter
3、上下键移动,空格选择,将P列添加进去
4、按ESC建退出,然后按shift+W保存修改的top输出格式
通过以下命令收集top输出
以 2 秒的间隔收集10分钟的top输出
top -b -d 2 -n 300 > /var/tmp/top-output.txt &
-d 间隔秒数
-n 收集次数
这个命令会在后台运行,命令:ps -ef | grep top查看进程;
关闭top收集参考命令:killall top
5.参考文件:(ASK或网页链接)
K63120332:CPU 使用率每小时飙升
https://support.f5.com/csp/article/K63120332
K16739:了解 BIG-IP 系统上的“top”输出
https://support.f5.com/csp/article/K16739