如何监视和记录服务器硬件温度和负载

我正在寻找一种方法来记录和监控我的服务器硬件温度和负载(如CPU或RAM)。 我怎么能这样做?

目标是:

  • 确保硬件不会升温
  • 确定应升级的内容和超出的内容(例如,或许要学习可能不会获得如此优秀的CPU)

好吧,我可以使用任务栏中的一个小程序,但是记录呢?

如果你想要一些不依赖于桌面的东西

看看lm-sensors 安装lm-sensors 。 从描述:

  Lm-sensors是Linux的硬件健康监控包。 它允许 
您可以从温度,电压和风扇速度访问信息 
传感器。 它适用于大多数较新的系统。

该软件包包含帮助您设置和读取数据的程序
 LM-传感器。 

从他们的项目页面 (2016编辑:项目已经死了。 我们自己的wiki有一些信息 ):

  • 无人值守的高端服务器,路由器或其他任务关键型机器自动监控。 轻松创建一个cron作业来查询硬件状态,并在问题变得严重之前通过电子邮件发送给您。 这样,您可以在发生故障的关键组件(如电源,风扇,其他冷却机制)的几秒钟内收到警报,甚至可以检测是否已打开机箱。
  • 运行Linux的嵌入式系统。 这些可以使用该软件包来监控电压,温度,风扇速度等,使用现成的组件并利用一系列总线接口(例如ISA,SMBus,I2C或SPI)。
  • 更一般地说,数据采集。 使用便宜的现成零件轻松测量各种类型的数据(转速,电压,温度等)。 对系统自动化非常有用(在家庭,车间,气象站,你可以命名)。

lm-sensors有一个名为sensord的守护进程,它使用RRDtool作为“时间序列数据的数据记录和图形系统”。 所以它包括这样的图形,可以通过网络服务器显示:

IM1

(摘自lm-sensors项目页面)。

要安装sensord守护程序,您可能需要安装sensord软件包。

我的笔记本示例:

IM2

其配置文件位于/etc/sensors3.conf

lm-sensors是任何温度测量的基础。 桌面项目很可能从此包中获取信息。 示例如果您需要依赖桌面的东西

psensor。

  • 主板和CPU传感器( 需要安装lm传感器 )。
  • NVidia GPU
  • 硬盘驱动器(需要安装hddtemp)。
  • 风扇速度(同样需要安装lm传感器)。

通过添加PPA进行安装:
sudo add-apt-repository ppa:jfi/ppa
sudo apt-get update && sudo apt-get install psensor

(Oneiric将包括psensor)

来自ubuntugeek.com的 (旧)示例: IM6

如果像Cacti这样的程序太多,那么有一个脚本只能在白天记录到文本文件 – 用crontab运行它。 但需要安装lm-sensors程序。

 #!/bin/bash _now=$(date +"%Y_%m_%d") _file="temp_log_$_now.txt" (date; sensors; echo '-----------') | cat >> "/var/log/temperatures/$_file" 

为了记录 服务器上的cpu / ram / temperature / traffic,我推荐了Cacti 。 它被宣传为“ RRDtool的完整前端”,并且可以具有多个数据源,例如lm-sensors,SNMP甚至自定义脚本。 数据存储在RRD中,用于创建每日,每周,每月和每年的图表。

有关更多详细信息, 屏幕截图和实时示例站点的链接,请访问Cacti网站 。 设置第一次可能很棘手,但最终还是值得的。

我使用zenoss在我的办公室监控大约70个unix和windows服务器。 我们还监控所有网络设备,甚至监控服务器机房中的恒温器。 大多数是通过SNMP。 (但是,我们使用一些自定义编写的脚本来监视某些应用程序性能)

大多数服务器(例如dell和hp)都有内部温度传感器,您可以使用SNMP进行查询。 您还可以监控进程,CPU利用率,网络吞吐量等。如果服务器脱机,或者开始使用过多的CPU,或者关键进程出现故障,我会收到警报。

说真的,我不能催促看看像zenoss , hyperic和nagios这样的东西! 免费版本可以监控多个系统,但它们也可以监控多个系统。 它们有助于排除故障,并在发生问题时找出服务器在凌晨2点正在做什么。

检查此链接: https : //launchpad.net/indicator-sysmonitor

IM1

(来自OMG Ubuntu )

安装:

sudo add-apt-repository ppa:alexeftimie/ppa
sudo apt-get update && sudo apt-get install indicator-sysmonitor

备注:仅适用于Natty / 11.04

我一直在使用pandora fms来监控我公司及其网页上的大约40台服务器和100台计算机系统。 您可能会发现在服务器上安装软件代理并设置本地模块以监控所需内容非常有用。 如果您想在此处尝试,可以访问潘多拉网页: Panndora FMS统一监控工具

问候

伊沃·约尔多夫

检查包munin ,它几乎可以监控所有内容。

https://help.ubuntu.com/lts/serverguide/munin.html https://wiki.ubuntuusers.de/munin

 sudo apt-get install apache2 sudo apt-get install munin-node` sudo systemctl enable munin-node sudo a2enconf munin 

检查/etc/apache2/conf-enabled/munin.conf中的访问权限,如下所示:

  Require all granted AllowOverride None Order Allow,Deny Allow from all Options None   Require all granted  SetHandler fcgid-script   SetHandler cgi-script   

重启apache2:

 sudo apache2ctl restart 

将您的浏览器激活到: http:// localhost / munin – 享受。

查看/ etc / munin以获取更多选项。