29.6. x86-64 机器检查代码的可配置 sysfs 参数¶
机器检查报告 CPU 检测到的内部硬件错误情况。未纠正的错误通常会导致机器检查(通常伴有 panic),已纠正的错误会导致机器检查日志条目。
机器检查被组织成 banks(通常与硬件子系统相关联)和 bank 中的子事件。 banks 和子事件的确切含义是 CPU 特定的。
mcelog 知道如何解码它们。
当你在系统日志中看到“Machine check errors logged”消息时,mcelog 应该运行以从 /dev/mcelog 收集和解码机器检查条目。通常,mcelog 应该从 cronjob 定期运行。
每个 CPU 在 /sys/devices/system/machinecheck/machinecheckN (N = CPU 编号) 中都有一个目录。
该目录包含一些可配置的条目。有关更多详细信息,请参阅 ABI 文件测试/sysfs-mce。
TBD 文档条目用于 AMD 阈值中断配置
有关 x86 机器检查架构的更多详细信息,请参阅 Intel 和 AMD 架构手册(来自其开发者网站)。
有关架构的更多详细信息,请参阅 http://one.firstfloor.org/~andi/mce.pdf