Confidence with Chaos for your Kubernetes Observability (ENG)

Kube-prometheus hat den Kubernetes Observability Stack mit Prometheus erfolgreich implementiert, und die Dashboards bieten viele interessante Einblicke. Was kommt als Nächstes? Alles ist überwältigend und Ihre Teams ertrinken in Warnmeldungen. Sie müssen modifiziert werden, die Dashboards benötigen feinkörnigere Diagramme und Ihr Team diskutiert Service Level Objectives (SLO). Dokumentation und Aktionspunkte für Ihre SRE- und DevOps-Teams sind ebenfalls erforderlich. Simulieren Sie einen Produktionsvorfall, um zu sehen, ob die SLOs erfüllt oder Alarme ausgelöst werden. Gibt es eine Möglichkeit, die bereitgestellte Anwendung zu beobachten und herauszufinden, ob sie im Chaos versinkt?

Nehmen Sie an diesem Vortrag teil, um in das Cloud-native Chaos-Engineering, die Instrumentierung von Anwendungen und das verteilte Tracing einzutauchen und mehr über Produktionsvorfälle mit fehlgeschlagenen SLOs zu erfahren. Gewinnen Sie Sicherheit im Umgang mit Chaos als SRE und als Entwickler, der den Wert von Observability erkennt. Willkommen zu Tag 2 DevOps.

Michael Friedrich

Michael Friedrich ist Senior Developer Evangelist bei GitLab mit Fokus auf Observability, SRE und Ops. Er absolvierte ein Studium in Hardware/Software Systems Engineering an der Fachhochschule Hagenberg in Österreich, und arbeitete in DNS- und Monitoring-Projekten an der Universität Wien mit, unter anderem bei ACO.net der Österreichischen Forschungs- und Bildungsplattform. Vor seinem Wechsel zu GitLab war Michael Friedrich 11 Jahre lang Maintainer der Open-Source-Monitoring-Software Icinga. Er hat das Technologie-Meetup “#EveryoneCanContribute cafe” gegründet um gemeinsam Cloud-Native und DevOps zu lernen. Michael ist Polynaut Advisor bei Polywork, hat die Observability-Learnplattform o11y.love ins Leben gerufen, und schreibt über Erfahrungen und Neuigkeiten im opsindev.news Newsletter.

This post is also available in: Englisch