SRE Yanıltan Veriler

Ortalama değerleri boşver genelde yanıltıyor.

Loglardan nefret ederim dürüst olmak gerekirse, anlamlı bilgi çok az, maliyet yüksek. Depolama ve performanstan.

SRE de genelden birime giden bir hiyerarşi var. Örneğin; Sorun ne zaman olmuş, öncesinden deploy olmuş mu, makine de bir anormallik var mı? Loglama. En kestirme metriklere bakmalıyız. Ortalama değil ama.

Etiketleme

Pull, pull servislerden metrikleri çekiyor.

Push, sizin uygulamanız monitoring sistemine data gönderiyor.

Promethous, metrik tabanlı alert sistemi, database

alert fatigue

spent a lot of time writing and maintaining tests that don't really give them the return-on-investment in terms of

Firstly, you should avoid using local simulators