英特尔Apollo Lake(J3455)在启动时随机频繁冻结UI和MCE错误

我遇到运行Ubuntu 16.10的 华擎J3455-ITX的问题。

第一个值得注意的问题与系统中的随机冻结有关。 它们肯定更容易重现,例如在Chrome中打开多个标签,但有时也可能遇到终端运行apt update (在Unity中)。 冻结会使整个系统无法响应(在大多数情况下,键盘和鼠标仍可正常工作,但有时甚至会停止响应)。

在进一步调查时,我注意到了一次dmesg

mce: [Hardware Error]: Machine check events logged

我安装了mcelog ,现在可以在/var/log/mcelog看到以下/var/log/mcelog

 mcelog: failed to prefill DIMM database from DMI data mcelog: Family 6 Model 92 CPU: only decoding architectural errors Hardware event. This is not a software error. MCE 0 CPU 0 BANK 4 ADDR fef13b80 TIME 1484930342 Fri Jan 20 17:39:02 2017 MCG status: MCi status: Uncorrected error MCi_ADDR register valid Processor context corrupt MCA: Internal unclassified error: 408 Running trigger `unknown-error-trigger' STATUS a600000000020408 MCGSTATUS 0 MCGCAP c07 APICID 0 SOCKETID 0 CPUID Vendor Intel Family 6 Model 92 

有趣的是,像这样的错误只在启动时发生在我身上(但它在每次启动时都会不断重复) – 但是当系统已经运行时(即使我遇到提到的随机冻结),它们没有任何迹象。

你有谁知道怎么回事? mcelog的错误是否清楚表明我有某种硬件问题? 或者它是由内核,驱动程序,固件,微代码等混合引起的错误?

使用运行Ubuntu 16.10的华擎J4205-ITX,我和你在同一条船上。 mcelog输出与你的相同,但我在系统运行时没有遇到冻结,可能是因为我将它用作无头服务器。

但是,在使用连接的监视器启动时,gpu似乎存在随机问题。 Ubuntu启动很好,系统可以通过ssh访问,但连接的监视器不显示任何东西(没有启动消息和没有shell登录)。 我玩grub参数,但它仍然是一个命中和错过。

它可能与内核相关或者是硬件错误。 不幸的是,这是我能告诉你的全部内容。

尝试将BIOS更新为1.20:

http://asrock.com/mb/Intel/J3455-ITX/?cat=Download&os=BIOS

原始的1.0 bios非常不稳定。