Reply condivide le sue best practice riguardo alla cultura dell’observability, offrendo un approccio olistico per il monitoraggio dei sistemi che include l’integrazione di piattaforme di observability e la creazione di team esperti in tema di observability.
Mentre sistemi distribuiti, container e micro-servizi diventano sempre più comuni nelle aziende evolute, aumenta anche il bisogno di osservare il comportamento dell’intero sistema. Gli approcci di monitoraggio tradizionali non producono il livello di introspezione necessario a ridurre il mean time per rilevare, riparare e correggere le anomalie; inoltre, rimangono con focus limitato, non considerando come la User Experience possa essere influenzata da questi fatti.
Da un approccio ”black box” a un approccio ”white box”
Il principale cambiamento nei modelli di observability più innovativi è un approccio strutturato al monitoraggio. Prima il sistema veniva considerato come una “black box”, con un contenuto interno inaccessibile. Il monitoraggio era quindi incentrato su segnali ed effetti chiari che potevano essere raccolti e valutati dall’esterno della scatola. Ora l’obiettivo è rendere questa scatola completamente trasparente: una “white box” che consenta di vedere all’interno del sistema.
Tre tipi essenziali di dati fondamentali per l’observability devono essere raccolti con strumenti capaci di recuperare, correlare e mostrare i dati in modo significativo, usando una piattaforma facilmente configurabile e utilizzabile da tutti gli stakeholder.
Record marcati temporalmente e immutabili degli eventi discreti avvenuti nel tempo in un ambiente software.
Rappresentazioni numeriche dei vari aspetti riguardanti lo stato del sistema.
Rappresentazioni di eventi e delle loro relazioni causali nel flusso end-to-end di una richiesta in un sistema distribuito.
Gli ingegneri dell’affidabilità mirano a realizzare sistemi affidabili e scalabili automatizzando i task di amministrazione in misura sufficiente da focalizzarsi sulle priorità, per esempio identificare guasti o modi di migliorare l’infrastruttura. SRE e Observability lavorano insieme per ridurre lo sforzo umano, gli errori umani e la latenza umana.
Hanno ruoli complementari, in quanto i team di SRE indicano quali siano gli elementi rilevanti da osservare e i team di observability garantiscono che essi siano resi osservabili e che i dati siano resi disponibili a tutti gli stakeholder, coordinandosi inoltre con i team di business & DevOps affinché l’observability sia inclusa nelle fasi di sviluppo.
Le competenze di Reply, basate su una consolidata esperienza sul campo in vari settori industriali, ci permettono di offrire spunti distintivi nelle progettualità dei clienti, sia nella scelta delle soluzioni tecnologiche affidabili (ovvero piattaforme di observability) più adatte, sia nel supporto nella progettazione e nell’implementazione di soluzioni di observability.