Jaka jest strategia wykrywania przesunięcia czasu w centrum danych opartym na systemie Linux?

14

Jaka jest strategia wykrywania przesunięcia czasu we wszystkich centrach danych opartych na systemie Linux? Jest to trudniejszy problem, niż się wydaje.

Przesunięcie czasu może powodować poważne problemy w niektórych aplikacjach i często, mimo że NTP jest zainstalowany, możliwe jest niepowodzenie z następujących (i wielu innych) powodów:

  • NTP nie został poprawnie skonfigurowany do automatycznego ponownego uruchamiania przy ponownym uruchomieniu.
  • Ustawienia na serwerze są nieprawidłowe, więc serwer czasu, na który wskazuje, jest nieosiągalny lub niedokładny.
  • Główny serwer czasu jest nieosiągalny i wszystkie serwery synchronizują się z nim, teraz synchronizują się z niewiarygodnym źródłem.

Chciałbym sprawdzić, czy wszystkie poszczególne serwery są poprawne. Pamiętaj, że serwer ze skryptem testowym / aplikacją może być nieprawidłowy.

Stuart Woodward
źródło
6
Myślę, że twoje powody są fałszywe, operacyjny NTP ma kluczowe znaczenie dla farmy. Upewnij się, który NTP działa poprawnie. Wdróż także lokalny zegar główny.
user539484
NTP działa od razu po wyjęciu z pudełka wielu dystrybucji Linuksa z rozsądnymi ustawieniami domyślnymi. Teraz jest to prawie żaden problem.
Mat.

Odpowiedzi:

20

Łatwo to kontrolować. Zarządzanie konfiguracją jest kluczem ...

Upewnij się, że usługa NTTP jest uruchomiona i skonfigurowana ...

Na przykład użycie Monit do upewnienia się, że ntpddziała i zrestartowanie go, jeśli się nie powiedzie, jest łatwym podejściem ... Może być sensowne dodanie crona i innych niezbędnych demonów do tego rodzaju kontroli.

Inną opcją jest użycie narzędzia do zarządzania konfiguracją , takiego jak Puppet, do wymuszenia tego samego pliku ntpd.conf na serwerach i upewnienia się, że plik ntpd jest zainstalowany, skonfigurowany i uruchomiony.

W protokole NTP jest wystarczająca ilość redundancji, aby poradzić sobie z przypadkiem, gdy serwer czasu jest nieosiągalny. Określ wiele źródeł.

ewwhite
źródło
3
Muszę powtórzyć ten sentyment. Zarządzanie konfiguracją i wiele serwerów NTP to całkiem podstawowa część infrastruktury we wszystkim, co zbliża się do „centrum danych”. Średnie lub większe centrum danych powinno mieć zegar sprzętowy. Źródła czasu GPS można kupić za kilkaset, a jeśli masz lutownicę <100 USD.
Chris S
to rozwiązanie + nagios
ten facet stamtąd
4
Pamiętaj, że sposób sprawdzania ntpdstatusu jest bardzo ważny. Nie chcesz po prostu powiedzieć „ntpd działa. Wszystko świetnie!”. Musisz faktycznie sprawdzić, czy twój system synchronizuje się i ma funkcjonalny element równorzędny, lub czy przesunięcie czasu jest minimalne między hostem a polem monitorowania . Nagios ma check_ntp_peeri check_ntp_timektóre to obsługują, jeśli chcesz korzystać z Nagios.
voretaq7
ntpq, aby sprawdzić status
kubańczyk
10

Istnieje wiele wtyczek check_ntp dla Nagios tam.

Tu jest jeden:

http://nagiosplugins.org/man/check_ntp

Dodaj tę opcję do swojego hosta nagios i otrzymuj powiadomienia, jeśli coś pójdzie nie tak.

dmourati
źródło
Tak, po prostu skonfiguruj system monitorowania, aby sprawdzić, czy czas jest prawidłowy, lub przynajmniej przesunięcie względem systemu monitorowania jest minimalne.
Zoredache,