Manutenzione e monitoraggio
Obiettivi: Gestire e manutenere le infrastrutture basate su GNU/Linux e Unix, integrando le applicazioni, i servizi, i server e la rete, ed effettuando le necessarie attività di monitoraggio e telecontrollo, di gestione degli allarmi e delle notifiche.
Perché: Per garantire la continuità dei servizi e per reagire ai cambiamenti necessari, imposti dall'accadere di errori, di guasti, di imprevisti e di cambi di contesto (ad esempio, per gestire l'evoluzione di un sistema di e-commerce al crescere del volume di affari) è necessario che ogni componente dell'infrastruttura sia gestita: il nostro approccio si riassume nello slogan M.A.N.I.: Misurare - Analizzare - Notificare - Investigare.
Come: Usiamo Nagios, Icinga, Check_MK e Shinken come sistemi di allarmistica, e per fornire dashboard di alto livello, Graphite, Collectd e Stastd per raccogliere ogni tipo di metrica necessaria, Graylog2, Logstash ed Elasticsearch, per realizzare sistemi centralizzati di analisi dei log. Abbiamo inoltre esperienza nella costruzione di motori di ricerca "locali" con prodotti come Solr e Nutch e un'ampia esperienza nell'uso di sistemi di versionameno distribuiti e non, per gestire le configurazioni di sistema (Etckeeper, Git, Mercurial, Subversion).