“mce::记录的机器检查事件”出现在syslog中。 我该怎么办?

我已经安装了最新版本的OSSEC (2.8.1),我也启用了电子邮件通知。 我收到大量这些通知,说有硬件错误和mce有关:

OSSEC HIDS Notification. 2015 Apr 04 20:09:22 Received From: Bath-Towel->/var/log/syslog Rule: 1002 fired (level 2) -> "Unknown problem somewhere in the system." Portion of the log(s): Apr 4 20:09:21 Bath-Towel kernel: [ 1873.680872] mce: [Hardware Error]: Machine check events logged --END OF NOTIFICATION 

那究竟是什么意思呢? mce代表什么? 这是明显的硬件错误吗?我应该担心什么?


OS信息:

 Description: Ubuntu 14.10 Release: 14.10 

机器检查例外 :

机器检查exception(MCE)是计算机中央处理单元检测到硬件问题时发生的一种计算机硬件错误。

您的计算机遇到硬件错误,内核在缓冲区中记录了一个事件。 您可以使用mcelog记录和查看计算机检查事件。 从mcelog页 :

X86 CPU将CPU检测到的错误报告为机器检查事件(MCE)。 这些可能是在CPU高速缓存中检测到的数据损坏,在主存储器中由集成的存储器控​​制器检测到的数据损坏,前端总线或CPU互连上的数据传输错误或其他内部错误。 可能的原因可能是宇宙辐射,不稳定的电源,冷却问题,硬件损坏,运行系统超出规范或运气不好。

CPU可以通过内部纠错机制纠正大多数错误。 未修正的错误会导致机器检查exception,这可能会导致进程中断或机器发生混乱。 少数纠正的错误通常不会引起担忧,但是大量错误可能表明未来的失败。

当发生纠正或恢复的错误时,x86内核会将描述MCE的记录写入通过/ dev / mcelog设备可用的内部环形缓冲区。 mcelog从/ dev / mcelog检索错误,将它们解码为人类可读的格式,并将它们打印在标准输出上或者可选地打印到系统日志中。

如果您没有注意到任何崩溃,可能是错误已成功更正。 不过,我建议你安装mcelog来跟踪这些事件:

 sudo apt-get install mcelog 

事件将记录到/var/log/mcelog 。 你也可以运行:

 sudo mcelog --client 

查询mcelog守护程序以查找错误。