Diventa Autore per CoreTech | Scopri di più
22/02/23 CoreTech Blog
Bene? Male? Nella media?
Senza numeri non vuol dire niente... sono solo sensazioni e domani mattina si potrebbe cambiare idea.
Un tecnico un giorno ha un qualsiasi problema con un Backup e decide di andare dal suo capo a dire che la soluzione non funziona e bisogna cambiarla.
E così si entra nel loop "vediamo se trovo una soluzione che funziona meglio!"
Ma meglio di cosa? A parte un confronto di features quali sono i parametri per dire meglio o peggio?
Altro elemento fondamentale è "li sto configurando correttamente i backup?" Servono dati oggettivi e bisogna mettere da parte il nerdismo da tecnici
Siamo andati a controllare cosa dicono i dati prendendo un set abbastanza ampio da poter dire "OK, questi dati hanno un valore statistico abbastanza decente da poter essere condivisi" oltre 7 milioni di job di backup sono un set abbastanza ampio.
I job di backup che hanno girato su una tipologia variegata di End Point Agent quali server, pc e Nas. I job di backup possono aver riguardato backup di file system, database, system state , virtual machine vmware o hyper-v, caselle office 365 ed altre tipologie.
Un job è in pratica un backup che ha girato ad un dato orario. Di solito un job di backup gira una volta al giorno per ogni agent installato. Ci sono certamente agent che hanno configurazioni per cui i backup girano più volte al giorno. Per le considerazioni nelle stime che seguono, semplifichiamo i ragionamenti considerando 1 job di backup al giorno per ogni end point/agent.
I dati relative alle medie si basano su 7.230.000 job di backup che hanno girato su una tipologia variegata di End Point Agent quali server, pc e Nas. I job di backup possono aver riguardato backup di file system, database, system state, virtual machine vmware o hyper-v, caselle office 365 ed altre tipologie
Un job è in pratica un backup che è girato ad un dato orario. Di solito un job di backup gira una volta al giorno per ogni agent installato.
Ci sono certamente agent che hanno configurazioni per cui i backup girano più volte al giorno. Per le considerazione nelle stime che seguono, semplifichiamo i ragionamenti considerando 1 job di backup al giorno per ogni end point/agent
Possiamo quindi immaginare che questa analisi riguardi circa 20.000 agenti di backup che hanno girato in 365 giorni
Un dato molto interessante è la percentuale di restore sul totale job di backup. Quante restore sono state eseguite su oltre 7 milioni di backup? Le restore di dati sono state 4348 ovvero lo 0,06% di restore su oltre 7 milioni di job di backup
Questo numero si può leggere anche in maniera differente considerando il numero di restore 4348, sul totale agenti di backup, 20.000.
In tal caso la percentuale diventa più significativa, ovvero il 21,7% e ci dice che dato un arco temporale abbastanza lungo come 1 anno, ogni 5 agenti di backup configurati almeno 1 richiede una restore nello stesso periodo di tempo.
Vediamo ora come vanno mediamente i backup e quanto lavoro di controllo è richiesto.
Su oltre 7 milioni di backup, mediamente il 78% di job di backup termina con successo, senza warning o errori. Sono job di backup sul cui esito un sistemista può prestare un controllo minimo.
Analizzando alcuni partner con centinaia di agent e job di backup giornalieri è emerso che alcuni hanno una percentuale maggiore sino al 93%, altri invece arrivano ad un 48%.
CoreTech si assesta ad un 82%
Da cosa dipende questa differenza?
A fare da discriminante maggiore sono i backup che pur essendo pianificati non sono partiti. Questa situazione è abbastanza normale la dove gli agenti di backup sono installati su PC che ad esempio la sera al termine dell’orario d’ufficio vengono spenti, impedendo al backup di partire.
Questi job di backup segnalati come errore variano dai casi migliori di un 3,5% ai casi dove si ha il 18% che pesa molto sul lavoro di controllo giornaliero.
CoreTech come caso si assesta un 7,5% di backup Missed. Da notare che per questioni di Test e Sviluppo abbiamo diversi agenti installati su VM che possono essere spente per lunghi periodi. Non abbiamo escluso dal conteggio questi casi
La media dei Job Missed sui 7 milioni di job di backup è del 8,4%
Un numero sopra questa media richiede di rivedere la pianificazione dei backup.
JOB BACKUP SUCCESS con WARNING
Se un backup gira ma non vengono salvati file perchè nulla è stata creato, modificato o cancellato, il sistema è “tarato” per dare un Warning perchè il job è partito ma ha lasciato tutta la situazione invariata.
Considerare come Backup Success un job che magari gira tutti i giorni e non salva niente è una scelta rischiosa.
A nostro avviso un controllo che il job sia configurato con il salvataggio ad esempio delle cartelle giuste è il caso di farlo.
Qui le percentuali medie sono del 3,22%.
Se i backup girano anche sabato e domenica è probabile che in molti agent restituiscano Backup Success con Warning perchè nel fine settimana potrebbero non essere stati movimentati dati
Se sommiamo i Backup Success e i Backup Success con Warning abbiamo 78+3,2 = 81,2% di Backup Success che richiedono pochi secondo per essere “convalidati” e certificati con la funziona Job Check di 1Backup.
Maggiore attenzione va prestata ai backup che sono andati correttamente ma hanno presentato un errore durante l’esecuzione
I valori medi rilevati sono del 5,68%.
Altre casistiche sono meno rilevanti numericamente e dipendono da diversi fattori.
Infatti ci sono backup che vengono fermati manualmente dall’utente oppure vengono stoppati dallo schedulatore dell’agent perchè è andato oltre il tempo impostato altre casistiche particolari