Po zimnym rozruchu serwera Debian 6.0.8 (HP ProLiant), ntpd
grała spustoszenie z czasem systemowym: przesunięciem i fluktuacją w stosunku do zwykłych i niezawodnych serwerów czasu odniesienia rosnących bez ograniczeń. (Zauważ, że bliźniaczy identyczny serwer w ogóle nie miał problemu.) Po wielu nieudanych próbach rozwiązania problemu po ntpd
stronie postanowiłem spróbować ponownie uruchomić komputer i wszystko poszło dobrze.
W celu zbadania problemu znalazłem tę rozbieżność, która mogłaby wyjaśnić moje problemy z zegarem:
root@n1:~# zgrep Detected /var/log/dmesg*
/var/log/dmesg:[ 0.004000] Detected 2400.110 MHz processor.
/var/log/dmesg.0:[ 0.004000] Detected 2383.579 MHz processor.
/var/log/dmesg.1.gz:[ 0.004000] Detected 2400.036 MHz processor.
/var/log/dmesg.2.gz:[ 0.004000] Detected 2400.298 MHz processor.
/var/log/dmesg.3.gz:[ 0.004000] Detected 2400.165 MHz processor.
/var/log/dmesg.4.gz:[ 0.004000] Detected 2400.410 MHz processor.
Zauważ, że w drugim ostatnim rozruchu (problematycznym) wykryta częstotliwość procesora jest wyraźną wartością odstającą. Bez wartości odstającej błąd i odchylenie standardowe wykrytej częstotliwości w stosunku do wartości nominalnej wynoszą +0,15 MHz ± 0,25 MHz. W przypadku problematycznego rozruchu mam błąd -16,4 MHz, który jest około 100 razy większy niż oczekiwano.
Moje pytania:
Czy błąd tego typu może sprawić, że
ntp
dyscyplina czasowa będzie niestabilna / bezużyteczna? Czy to jest przyczyną moich problemów z zegarem?Czy tego typu zachowanie jest objawem niestabilnego sprzętu? Czy serwer powinien przejść do konserwacji?
Aktualizacja
Niektóre przydatne dane:
- jądro to 2.6.32-5-amd64 (Debian 2.6.32-48squeeze4)
current_clocksource
jesttsc
- błąd dla
lpj
jest (oczywiście) zgodny z błędem na częstotliwości procesora
Niektóre linie kontekstu dla powyższego grep
[ 0.000000] hpet clockevent registered
[ 0.000000] Fast TSC calibration using PIT
[ 0.004000] Detected 2400.110 MHz processor.
[ 0.000008] Calibrating delay loop (skipped), value calculated using timer frequency.. 4800.22 BogoMIPS (lpj=9600440)
źródło
ntpdc -c loopinfo
nigdy nie podał mi wartości dryfu częstotliwości. Teraz po ponownym uruchomieniu wszystko wydaje się być w porządku, ze stabilną wartością dryfu ... BTW twoja sugestia jest poprawna, monitorujęlog/loopstats
nieprawidłowe zachowanie.