HPE iLO NMI 看门狗驱动程序

适用于基于 iLO 的 ProLiant 服务器

上次审核时间:08/20/2018

HPE iLO NMI 看门狗驱动程序是一个内核模块,它为 iLO“向系统生成 NMI”虚拟按钮提供基本的看门狗功能和处理程序。

本文档中所有对 iLO 的引用都意味着它也适用于 iLO2 和所有后续世代。

与其他常见的看门狗驱动程序一样,启用看门狗功能。 也就是说,需要启动一个应用程序来启动看门狗定时器。 tools/testing/selftests/watchdog/ 中存在一个名为 watchdog-test.c 的基本应用程序。 只需编译 C 文件并启动它。 如果系统进入错误状态并挂起,HPE ProLiant iLO 定时器寄存器将不会及时更新,并且会发生硬件系统重置(也称为自动服务器恢复 (ASR))事件。

hpwdt 驱动程序还具有以下模块参数

soft_margin

允许用户设置看门狗定时器值。 默认值为 30 秒。

timeout

soft_margin 的别名。

pretimeout

允许用户设置看门狗预超时值。 这是在超时前多少秒将 NMI 传递给系统。 将该值设置为零会禁用预超时 NMI。 默认值为 9 秒。

nowayout

基本的看门狗参数,不允许重新启动定时器或逃避即将发生的 ASR。 默认值在编译内核时设置。 如果设置为“Y”,则一旦启动看门狗,就无法禁用它。

kdumptimeout

调用 panic 之前,收到 NMI 后应用的最小超时时间(以秒为单位)。 (-1) 禁用看门狗。 当该值 > 0 时,定时器将使用值或当前超时值的较大者重新编程。

注意

有关看门狗驱动程序的一般信息,包括 /dev/watchdog 的 ioctl 接口,请参见Linux 看门狗驱动程序 APILinux IPMI 驱动程序

由于 iLO 硬件的限制,如果启用了 NMI 预超时,则只能将其设置为 9 秒。 尝试将预超时设置为其他非零值将被四舍五入,可能为零。 用户应在尝试设置预超时或超时后验证预超时值。

收到来自 iLO 的 NMI 后,hpwdt 驱动程序将启动 panic。 这是为了允许收集崩溃转储。 用户有责任正确配置系统以进行 kdump。

panic 时的默认 Linux 内核行为是打印内核墓碑并永远循环。 这通常不是看门狗用户想要的。

对于那些希望了解更多信息的人,请参阅

如果 hpwdt 没有收到与过期定时器关联的 NMI,如果定时器没有更新,iLO 将在超时时继续重置系统。

--

HPE iLO NMI 看门狗驱动程序和文档最初由 Tom Mingarelli 开发。