Aufgaben
- Entwicklung eines vollständigen Monitoringkonzepts für Netzwerk- und Firewall-Umgebungen
- Aufbau einer skalierbaren IT-Monitoring-Architektur inkl. Datenquellen, Event-Flows und Tool-Integrationen
- Definition komplexer Schwellenwerte, Korrelationen und Konsolidierungslogiken zur Alarmreduktion
- Erstellung der KPI-Struktur für MTTR, Alarmqualität und SLA-abhängige Serviceparameter
- Architekturplanung für Event- und Alarm-Flows zwischen CheckMK, Splunk, EMDB, BSP und ServiceNow
- Implementierung der Monitoring-Regelwerke, Metriken und Alarmierungslogiken in CheckMK, Splunk und EMDB
- Aufbau von Monitoring für CRC, Errors, MAC-Flapping, WAN-Quality, Bandwidth und Device-Health
- Entwicklung von Monitoring-Konzepten für Layer-3-Routing, Firewalls und Redundanz/Split-Brain-Szenarien
- Implementierung eines End-to-End-Monitorings für RAS-Zugriffe und kritische Security-Events
- Erstellung von SOPs sowie Schulung und Übergabe der Monitoring-Umgebung an Betrieb und Support
Profil
- Fundierte Erfahrung im Aufbau und Management komplexer IT-Monitoring-Umgebungen (z.B. NOC)
- Fundierte Expertise in Architektur, Design und Skalierung von Monitoring-Systemen
- Tiefes technisches Verständnis moderner Netzwerke, Routing, Switching und Firewall-Technologien
- Sehr gute Kenntnisse in Event- und Alarm-Management-Methoden sowie deren Optimierung
- Expertise im Einsatz von CheckMK, Splunk, ServiceNow, BSP und EMDB inklusive Schnittstellenintegration.
- Erfahrung im Design und Betrieb von Schwellenwerten, Korrelationen und Konsolidierungslogiken
- Sicherer Umgang mit PDCA-Methodik und ITIL im gesamten Monitoring-Lifecycle
- Kenntnisse in WAN-Monitoring, Bandbreiten-Analyse, Device-Health-Überwachung und Performance-Metriken
- Erfahrung im Monitoring von Firewall-Clustern und Redundanzstrukturen (Fortinet, Check Point, F5, Cisco)
- Starkes Verständnis für OPEX-Optimierung, Alarmqualität und effiziente Betriebsprozesse
Benefits
- Dynamisches Projektumfeld