„Überwachung“ / Monitoring

Ziele und Metriken

💬 Wofür wird Monitoring benötigt?

Welche Metriken kennen Sie?

Verfügbarkeit, Wirtschaftlichkeit, Sicherheit, Skalierbarkeit, Administrierbarkeit
Erkennung von Ereignissen vor Schadenseintritt
- Mangel an Ressourcen
  - verbleibende freie Festplattenkapazität
- „Health“ von Festplatten
  - SMART-Daten
    - Self-Monitoring, Analysis and Reporting Technology
- Informationen von Netzwerkgeräten
  - SNMP
    - Simple Network Management Protocol
- Kostenkontrolle
  - API-Nutzung
- Ablauf von SSL-Zertifikaten
Schnelle Benachrichtigung im Problemfall
- Ausfall von Diensten
- Ausfall von RAID-Platten
- Swap-Nutzung
Erkennung von Tendenzen
- zunehmender Arbeitsspeicherverbrauch
  - Speicherleak
- Netzwerklatenzen & Jitter
Beobachtung, Kontrolle & Dokumentation von Angriffen
- Verbindungsaufbau/Minute
- Loginversuche/Minute
Optimierung von Ressourcen
- Langzeitauswertung
  - CPU-Auslastung (load)
- Erkennung von Mustern
  - Auslastung nach Wochentag/Uhrzeit
Debugging
- Mit welchen Logdaten korrelieren unerwartete Metriken?

z.B.

sinnvoller Weise Round-Robin-Database
- Aggregation für nächst niedrigere Zeitauflösung

z.B. per Mail, SMS, IM, Chat, Pager, Desktop-/Push-Notification

	Remote (Monitoringserver)	auf überwachtem „Client“
Wo wird Check ausgeführt?	für Netzwerkdienste	für Ressourcenauslastung
Wer triggert Aufruf zur Erhebung?	(x)	(x)
Wo werden Daten gespeichert?	(x)
Wo/Wann werden Daten ausgewertet?	(x)

Wie werden Daten übermittelt?