神秘的几分钟系统冻结

我目前正在经历很长一段时间(一次约5分钟),在此期间我的笔记本电脑冻结了。 我已经拍摄了这种情况的图像来指出一些症状(由于冻结而无法截取屏幕截图)。

这是图像: 在此处输入图像描述

那么,冻结了什么:

  • VM冻结(右侧),正在关闭
  • 网站无法加载(背景)
  • 无法ping网站(终端窗口),一段时间后,也无法在终端窗口中输入文本(注意’打开矩形’文本光标)
  • 文件浏览器冻结,不显示文件夹内容(Dolphin窗口)
  • 无法打开Dash主页

什么不冻结:

  • 仍然可以移动鼠标
  • 仍然可以把重点放在窗口上
  • 仍然可以使用altctrlf1进入终端

附加信息:

  • 似乎有两个阶段,其中一个阶段我仍然可以打开新程序,例如,其中一个阶段甚至不再可能。 我怀疑第二阶段是在我尝试查看主文件夹( ~ )的内容时开始的,但我可能完全没有。

  • 大约5分钟后,系统解冻,好像什么都没发生过一样。

  • 它每天发生几次。 重启不会让它消失。

  • 在至少一种情况下(我将继续尝试更多),切换到不同的WiFi网络立即解决问题。 切换回原始网络不会导致问题重新出现(立即)。

我不知道从哪里开始寻找,但四处阅读表明dmesg输出可能是一个好地方。 它的内容可以在这里找到。 可以在此处找到/var/log/syslog的(相关部分)内容。 在两者中,都提到了[3125.851869]的固件崩溃,即1月9日19:24:03。

我在新的戴尔XPS 13 Kaby Lake上运行16.10。 如果我能提供更多信息,请告诉我。


编辑

dmesg日志现在提到了硬件错误:

 [ 38.276956] Key type id_legacy registered [ 300.462458] mce: [Hardware Error]: Machine check events logged [ 311.013944] SUPR0GipMap: fGetGipCpu=0x3 [ 311.521449] vboxdrv: ffffffffc0000020 VMMR0.r0 [ 311.706008] vboxdrv: ffffffffc0102020 VBoxDDR0.r0 [ 311.799288] vboxdrv: ffffffffc0122020 VBoxEhciR0.r0 [ 327.508305] wlp58s0: AP 88:03:55:f4:9c:e8 changed bandwidth, new config is 2462 MHz, width 1 (2462/0 MHz) [ 404.851340] vboxdrv: ffffffffc0000020 VMMR0.r0 [ 404.984658] vboxdrv: ffffffffc0102020 VBoxDDR0.r0 [ 746.410756] hrtimer: interrupt took 9058 ns 

/var/log/mcelog内容可在此pastebin中找到。


编辑

有一些建议认为问题可能与硬盘有关,所以让我提供一些相关的信息。

系统运行在加密的ssd(不仅仅是主文件夹)上,这可能是它没有出现在/dev/sda ,而是/dev/mapper/ubuntu--vg-root 。 如果它有任何帮助, df -l的整个输出是:

 Filesystem 1K-blocks Used Available Use% Mounted on udev 4003752 0 4003752 0% /dev tmpfs 805328 10204 795124 2% /run /dev/mapper/ubuntu--vg-root 235927440 214041380 9831944 96% / tmpfs 4026636 292 4026344 1% /dev/shm tmpfs 5120 4 5116 1% /run/lock tmpfs 4026636 0 4026636 0% /sys/fs/cgroup /dev/loop2 77952 77952 0 100% /snap/ubuntu-core/1357 /dev/loop0 76800 76800 0 100% /snap/ubuntu-core/423 /dev/loop1 131968 131968 0 100% /snap/arduino-mhall119/3 /dev/nvme0n1p2 483946 136447 322514 30% /boot /dev/nvme0n1p1 523248 3676 519572 1% /boot/efi tmpfs 805324 140 805184 1% /run/user/1000 

试图找到一些健康信息,运行gsmartcontrol ,“基本健康检查”是“未知”,并查看输出,最后一行读取Read NVMe SMART/Health Information failed: NVMe Status 0x4002

运行sudo smartctl -a /dev/nvme0n1时,我得到相同的输出:

 smartctl 6.6 2016-05-31 r4324 [x86_64-linux-4.8.0-34-generic] (local build) Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org === START OF INFORMATION SECTION === Model Number: THNSN5256GPUK NVMe TOSHIBA 256GB Serial Number: X64S14LCT18T Firmware Version: 5KDA4101 PCI Vendor/Subsystem ID: 0x1179 IEEE OUI Identifier: 0x00080d Controller ID: 0 Number of Namespaces: 1 Namespace 1 Size/Capacity: 256,060,514,304 [256 GB] Namespace 1 Formatted LBA Size: 512 Local Time is: Fri Jan 13 19:05:21 2017 CET Firmware Updates (0x02): 1 Slot Optional Admin Commands (0x0017): Security Format Frmw_DL *Other* Optional NVM Commands (0x001e): Wr_Unc DS_Mngmt Wr_Zero Sav/Sel_Feat Warning Comp. Temp. Threshold: 78 Celsius Critical Comp. Temp. Threshold: 82 Celsius Supported Power States St Op Max Active Idle RL RT WL WT Ent_Lat Ex_Lat 0 + 6.00W - - 0 0 0 0 0 0 1 + 2.40W - - 1 1 1 1 0 0 2 + 1.90W - - 2 2 2 2 0 0 3 - 0.0120W - - 3 3 3 3 5000 25000 4 - 0.0060W - - 4 4 4 4 100000 70000 Supported LBA Sizes (NSID 0x1) Id Fmt Data Metadt Rel_Perf 0 + 512 0 2 1 - 4096 0 1 === START OF SMART DATA SECTION === Read NVMe SMART/Health Information failed: NVMe Status 0x4002 

我没有找到有关此状态的任何信息。