HPE iLO NMI 看门狗驱动程序¶
适用于基于 iLO 的 ProLiant 服务器¶
上次审核时间:08/20/2018
HPE iLO NMI 看门狗驱动程序是一个内核模块,它为 iLO“向系统生成 NMI”虚拟按钮提供基本的看门狗功能和处理程序。
本文档中所有对 iLO 的引用都意味着它也适用于 iLO2 和所有后续世代。
与其他常见的看门狗驱动程序一样,启用看门狗功能。 也就是说,需要启动一个应用程序来启动看门狗定时器。 tools/testing/selftests/watchdog/ 中存在一个名为 watchdog-test.c 的基本应用程序。 只需编译 C 文件并启动它。 如果系统进入错误状态并挂起,HPE ProLiant iLO 定时器寄存器将不会及时更新,并且会发生硬件系统重置(也称为自动服务器恢复 (ASR))事件。
hpwdt 驱动程序还具有以下模块参数
soft_margin
允许用户设置看门狗定时器值。 默认值为 30 秒。
timeout
soft_margin 的别名。
pretimeout
允许用户设置看门狗预超时值。 这是在超时前多少秒将 NMI 传递给系统。 将该值设置为零会禁用预超时 NMI。 默认值为 9 秒。
nowayout
基本的看门狗参数,不允许重新启动定时器或逃避即将发生的 ASR。 默认值在编译内核时设置。 如果设置为“Y”,则一旦启动看门狗,就无法禁用它。
kdumptimeout
调用 panic 之前,收到 NMI 后应用的最小超时时间(以秒为单位)。 (-1) 禁用看门狗。 当该值 > 0 时,定时器将使用值或当前超时值的较大者重新编程。
- 注意
有关看门狗驱动程序的一般信息,包括 /dev/watchdog 的 ioctl 接口,请参见Linux 看门狗驱动程序 API和Linux IPMI 驱动程序
由于 iLO 硬件的限制,如果启用了 NMI 预超时,则只能将其设置为 9 秒。 尝试将预超时设置为其他非零值将被四舍五入,可能为零。 用户应在尝试设置预超时或超时后验证预超时值。
收到来自 iLO 的 NMI 后,hpwdt 驱动程序将启动 panic。 这是为了允许收集崩溃转储。 用户有责任正确配置系统以进行 kdump。
panic 时的默认 Linux 内核行为是打印内核墓碑并永远循环。 这通常不是看门狗用户想要的。
- 对于那些希望了解更多信息的人,请参阅
内核的命令行参数 (panic=)
您的 Linux 发行版特定文档。
如果 hpwdt 没有收到与过期定时器关联的 NMI,如果定时器没有更新,iLO 将在超时时继续重置系统。
--
HPE iLO NMI 看门狗驱动程序和文档最初由 Tom Mingarelli 开发。