0DD2FBBC92FE475FA750DB68782D7E33
  • Thomas Pollinger
  • 02.04.2018
  • DE

HealthChecks.io: Wie benutzedefinierte Aufträge einen Systemstatus pflegen.

Die Information über einen Systemzustand ist in der heutigen IT und im täglichen Arbeiten nicht mehr wegzudenken. Daher ist es umso wichtiger geworden, dass man zeitnah relevante Statusänderungen mitbekommt und somit direkt automatisch oder manuell reagieren zu können.

Der Management-Server hat, wenn man mehr als einen Server in einem Verbund nutzt, schon einen eingebauten Healthcheck. Jedoch sendet dieser, sofern alles korrekt eingestellt ist, nur eine E-Mail als Benachrichtigung. Das ist auch soweit okay, jedoch auf eine E-Mail kann man im allgemeinen nur manuell reagieren.

Daher sind wir auf die Suche gegangen und mein Kollege ist fündig geworden. HealthChecks.io wurde bei uns die Antwort auf alles, was regelmäßig bestimmte Aktionen überwachen soll.

Die primäre Aufgabe von HealthChecks.io ist es, CronJobs zu überwachen und zu signalisieren wenn ein Job nicht wie erwartet ausgeführt wurde.

Jedoch kann man das auch sehr elegant für eine Art "HeartBeat-Check" für Systeme nutzen. Indem man einfach in bestimmten Intervallen eine dafür zuvor eingerichtete URL aufruft. Wenn dies nicht innerhalb einer bestimmten Zeitspanne passiert, wird der HealthCheck in den s.g. WARNING-State gesetzt. Sobald dann noch die s.g. Grace Time abgelaufen ist, wird eine Störung in Form eines Alarms gemeldet.

Dieses HealthChecks kann man dann wiederrum mit anderen Tools abfragen oder sich per SMS bzw. weiteren Möglichkeiten informieren lassen.

HealthChecks.io ist leicht integrierbar, in einer Basis-Version mit einer eingeschränken Anzahl von Überwachungen auch gratis. Das schöne daran ist, man ist in der Lage alles, ob nun Applikationen, Tools, Skripte oder CronJobs mühelos zu überwachen.

Im Falle des Web Site Management Server, kann man dies mit einem einfachen s.g. benutzerdefinierten Auftrag lösen. Welcher einfach regelmäßig ausgeführt wird und sollte dies mal nicht der Fall sein, dann kann man fast davon ausgehen, dass der Server nicht mehr korrekt arbeitet.

Probiert es mal aus, es lohnt sich ;)


Über den Autor:
Thomas Pollinger

... ist Senior Site Reliability Engineer bei der Vodafone GmbH in Düsseldorf. Seit dem Jahr 2007 betreut er zusammen mit seinen Kollegen die OpenText- (vormals RedDot-) Plattform Web Site Management für die deutsche Konzernzentrale.

Er entwickelt Erweiterungen in Form von Plug-Ins und PowerShell Skripten. Seit den Anfängen in 2001 (RedDot CMS 4.0) kennt er sich speziell mit der Arbeitweise und den Funktionen des Management Server aus.