<div dir="ltr"><div dir="ltr"><br></div><br><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">

After some time, I decided to learn some powerful, popular monitoring system that could automatically alert me about these kinds of problems. There <br>
would be some learning curve due to time-series databases etc., but it would be worth it. My very simple and common PC health checks will surely be <br>
built-in, ready to use. So I chose Prometheus to start with.<br></blockquote><div><br></div><div>You can go down this road of course, but then you will have to adjust Prometheus to "trigger" alerts when certain thresholds are reached. <br></div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">

The advice I am looking for here is not actually specific to Prometheus. The main problem is that I am not familiar with the S.M.A.R.T. values. What <br>
is the difference between "raw value" and "value"? Which one do I need to compare against "threshold"? Should that be <, <=, > or >= ?<br></blockquote><div><br></div><div>This is where this gets tricky. Not all disks have the same SMART attributes. Sometimes the names differ, the attribute ID might be different and the thresholds might also be different. <br></div><div>Even if all your computers run the same drive models, certain attributes can be "ignored", while others have to be taken more serious. <br></div><div><br></div><div>While Prometheus is very helpful for performance measuring and graph comparison, alerting is not its strong suit. I'd personally go with a monitoring system which is built for alerting, such as Nagios and forks, Icinga or Sensu. <br></div><div>You can use the already existing <a href="http://check_smart.pl">check_smart.pl</a> (perl) monitoring script -> <a href="https://www.claudiokuenzler.com/monitoring-plugins/check_smart.php">https://www.claudiokuenzler.com/monitoring-plugins/check_smart.php</a> . <br></div><div>Problem here though is most likely that, if I understood correctly, you refer to Windows machines as the PCs you are monitoring? This means you will have to install smartmontools (if not already done) on Windows and also Perl to be able to launch the monitoring plugin. And you will have to install a monitoring agent (Icinga, NSClient to name two) to integrate these PCs into the monitoring software and remotely execute check_smart.<br></div><div><br></div><div>So both ways (Prometheus or classical monitoring) are possible - but both require you to do some workarounds and adjustments. <br></div><div> <br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
<br>
(Get-WmiObject -Namespace root\wmi –Class MSStorageDriver_FailurePredictStatus).PredictFailure<br></blockquote><div><br></div><div>Using WMI is a good idea but I've personally never used it for drive monitoring. Maybe it works for you :-)<br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
<br>
Is there a way to generate such a simple indicator with smartmontools? I could then run a script at regular intervals, and feed the result to Prometheus. <br></blockquote><div><br></div><div>Or you use the previously mentioned <a href="http://check_smart.pl">check_smart.pl</a> plugin to run it at regular intervals and feed the result to Prometheus. check_smart does use smartmontools in the background, just handles the thresholds and creates an alert to the user. I've not seen that combo with Prometheus yet though. But I guess it should be possible, as performance data from check_smart could be parsed and forwarded to Prometheus exporter. However, that's yet another workaround.<br></div><div><br></div><div>Maybe there are other (commercial) alternatives around, but I personally focus on open source solutions. The other mailing list members might have other/additional ideas or solutions.</div><div><br></div><div>cheers,</div><div>ck<br></div><br></div></div>