Jak często serwery Windows muszą być ponownie uruchamiane?

77

Małe tło: Mamy kilka serwerów Windows (2003, 2008) dla naszego działu. Jesteśmy działem IT, więc zarządzamy własnymi serwerami. Z naszej czwórki tutaj jestem jedyną z niewielką wiedzą informatyczną. (Uwaga „niewielka kwota”.) Mój szef mówi, że serwery muszą być restartowane co najmniej raz w tygodniu. Nie zgadzam się. Nasz dział IT twierdzi, że ponieważ ciągle je restartuje, to dlatego nasze dyski twarde ulegają awariom i zasilają się nimi. (Tak się stało z kilkoma naszymi serwerami kilka razy w ciągu ostatnich czterech lat, a ostatnio bardzo niedawno).

Pytanie brzmi: jak często wszyscy ponownie uruchamiają serwery Windows? Czy istnieje standard branżowy lub zalecenie? Czy nasz dział IT ma rację mówiąc, że ponieważ rozpoczynamy od nowa, dlatego mamy problemy ze sprzętem? (Potrzebuję powodu, żeby zmienić zdanie!)

Evan
źródło
111
Aha, co drugi wtorek miesiąca . :)
jscott
4
Dang! Robiliśmy co czwarty czwartek miesiąca! :)
Evan
2
Jestem na przeciwnej łodzi. Nie wolno nam ponownie uruchamiać serwerów bez cotygodniowej debaty w obie strony w całym dziale, która zajmuje około 12 roboczogodzin na serwer. Tak, obejmuje to ponowne uruchomienie łatki, co skutecznie oznacza, że ​​nigdy się nie uda.
Hyppy
19
Ponowne uruchamianie co tydzień nie powinno również powodować drastycznego wzrostu liczby awarii sprzętu.
JamesRyan
3
Wygląda na to, że twoje serwery są uruchamiane częściej niż mój laptop. Zazwyczaj przechodzę w tryb uśpienia, kiedy go nie używam. Typowym powodem ponownego uruchomienia jest instalacja aktualizacji systemu Windows lub oprogramowania.
Phil

Odpowiedzi:

116

Mój szef mówi, że serwery muszą być restartowane co najmniej raz w tygodniu

I zdecydowanie nie zgadzam. Firma Microsoft poczyniła ogromne postępy od czasu dobrych dni, jeśli chodzi o stabilność i czas pracy. Szkoda, że ​​konsensus w zakresie wsparcia IT nie zmienił się wraz z tym.

Jak często wszyscy restartują swoje serwery Windows?

Tylko w razie potrzeby - albo z powodu aktualizacji systemu operacyjnego / oprogramowania, krytycznej awarii oprogramowania, której nie można naprawić innymi metodami, modernizacji / wymiany sprzętu lub innej czynności, która nie może nastąpić bez ponownego uruchomienia komputera. 1

Czy istnieje standard branżowy lub zalecenie?

Nigdy nie widziałem standardowe zalecenia, per se , ale mogę nie zgodzić się z każdym z wyjątkiem rekomendacji [MS] samych który wskazywałby wymaganego ponownego uruchomienia w określonym przedziale czasu „just-bo”.

Czy nasz dział IT ma rację mówiąc, że ponieważ rozpoczynamy od nowa, dlatego mamy problemy ze sprzętem?

Ponowne uruchomienie [a tym bardziej cykl zasilania] jest najbardziej stresującym okresem aktywności sprzętowej komputera. Większość wszystkiego kręci się do 100% - dyski i wentylatory ... ... a także znaczne wahania temperatur elementów. Nowoczesny sprzęt jest niesamowicie odporny, ale nie powinno to być powodem, dla którego serwery odbijają się kaprysem kilka razy w tygodniu.

1 Poza tym nie cierpię, gdy technicy „po prostu” restartują serwer Windows w przypadku awarii usługi lub tym podobnych. Rozumiem potrzebę ponownego uruchomienia usługi, ale ponowne uruchomienie powinno być ostatnim krokiem w kłopotach ze strzelaniem do serwera. Zidentyfikowanie i naprawienie [!], Głównej przyczyny niepowodzenia prawie nigdy nie powinno skutkować „Meh, po prostu uruchom go ponownie…”

jscott
źródło
2
Dziękuję za dokładną odpowiedź. Aktualizacje przeprowadzamy raz w miesiącu, co oczywiście, kiedy to robimy, musimy ponownie uruchomić. Doceniam odpowiedź.
Evan
5
Muszę się nie zgodzić z twoim uzupełnieniem. Jeśli usługa definiuje serwer (na przykład serwer NFS, który przestaje udostępniać eksport), i wiesz, że czysty restart spowoduje przywrócenie usługi w ciągu X minut, a po podstawowym rozwiązywaniu problemów ustalisz, że x + 5 zajmie rozwiązanie problem, najlepiej zrestartować komputer. Następnie możesz przeprowadzić analizę przyczyny. Tak czy inaczej, to moja metoda na robienie tego, a ty możesz dość łatwo kłócić się za i przeciw :) Po prostu jak toczę.
Matthew
34
@Matthew: Przeprowadzanie analizy przyczyn źródłowych po fakcie jest dobre i dobre, jeśli nie ma przejściowych informacji o przyczynie utraconej przez ponowne uruchomienie. Wydaje mi się, że mówię w imieniu wielu osób, gdy mówię, że wolę mieć jeszcze jeden dłuższy czas przestoju, aby wykryć i naprawić pierwotną przyczynę przestoju niż kilka krótszych incydentów przestoju, kiedy decyduję się na „ponowne uruchomienie” i potencjalnie stracić możliwość korzystania z lotnych informacji w celu analizy pierwotnych przyczyn.
Evan Anderson
8
@Matthew W przypadkach awarii usługi oczekiwałbym od technika ponownego uruchomienia usługi jako kroku rozwiązywania problemów przed ponownym uruchomieniem całego urządzenia.
jscott
6
@Evan Zgadzam się z tobą, ale myślę, że musi istnieć próg incydentów, które stają się problemem. Np. Jeśli zdarzy się to raz w miesiącu i zostanie rozwiązane w ciągu 10 minut po ponownym uruchomieniu, firma może nigdy nie przejmować się pierwotną przyczyną. Myślę, że ty i ja chcielibyśmy wiedzieć, ale czas działania jest ważniejszy niż podstawowa przyczyna. Jeśli jednak zdarza się to 3 razy w tygodniu, jest to zupełnie inna historia.
Jim B
52

Serwery Windows muszą być restartowane co miesiąc, jeśli stosujesz poprawki. Nakładasz łatki, prawda? Dobrze?

Hippy
źródło
8
+1 za
3
Stosujesz łatki tylko co miesiąc?
John Gardeniers
Ściśle mówiąc, xe stosuje tylko łaty, które same wymagają comiesięcznego restartu . Nie wszystkie poprawki PTF wymagają ponownego uruchomienia i nie wszystkie comiesięczne aktualizacje w ogóle zawierają takie poprawki.
JdeBP
2
Ponownie uruchamiam serwery Windows tylko wtedy, gdy wymaga tego aktualizacja . Czasami minie kilka miesięcy bez łatki wymagającej ponownego uruchomienia. Mam jednak serwery linuksowe, które nie były restartowane od lat i działają bez żadnych problemów. Wydaje mi się, że najdłużej widziałem w mojej sieci Linux, który został schowany w szafie i zapomniany (otrzymywał automatyczne aktualizacje). Przyłączyłem się, a czas pracy wynosił 3 lata. Rok później został ponownie uruchomiony z powodu awarii zasilania.
James
Gdyby to był Linux lub BSD, możesz załatać serwer bez konieczności restartowania. Musisz tylko zrestartować się w celu aktualizacji jądra (i przy dystrybucji zorientowanej na serwer, te są rzadkie).
SnakeDoc,
18

Dam alternatywną odpowiedź na bardzo konkretny przypadek. Postępy z ostatnich 2-3 lat mogły to zmienić, ale jeśli masz intensywnie używane serwery TS lub Citrix, na których działa wiele interaktywnych aplikacji (takich jak Office), dobrym pomysłem jest cotygodniowe ponowne uruchamianie poza godzinami pracy, po prostu zacznij od czystej listy zasobów, takich jak zablokowane sesje, zużyta sterta pulpitu itp. Jeśli masz dobrze skonfigurowaną farmę i ustawiasz ponowne uruchamianie, nawet jeśli masz mało czasu poza godzinami pracy, użytkownicy nie powinni mieć na to wpływu.

Jasne, to regularne restartowanie serwerów, ale są one używane jak komputery stacjonarne.

mfinni
źródło
4
Mm ... dobre połączenie w sprawie TS / Citrix.
Hyppy
Podobne doświadczenie tutaj przy użyciu Citrix z oprogramowaniem do zarządzania audytem CCH.
1
To samo miało miejsce w czasach MetaFrame, gdy sami Citrix zalecali nocne restartowanie, jeśli było to praktyczne.
John Gardeniers
Tak, Metaframe ... whoof. Nie brakuje mi gry z plikiem mapowania sterownika drukarki. Z pewnością stało się znacznie lepiej z punktu widzenia zarządzania IT.
mfinni
10

Jest to bardziej kwestia polityczna i psychologiczna niż techniczna.

Z mojego doświadczenia wynika, że niektórzy ludzie, którzy pracowali z niektórymi o wiele starszymi wersjami systemu Windows, uświadomili sobie, że potrzebują cotygodniowych restartów i zapisali tę filozofię w małym kącie umysłu (nigdy nie zauważają, że restart jest jednak pomijany, gdy są na wakacjach). Jeśli nie masz bardzo niestabilnych systemów i aplikacji, nie jest już oparty na rzeczywistości.

Z drugiej strony, częste ponowne uruchamianie może katalizować awarię sprzętu, ale nie jest strasznie przyczyną tego.

Shane Madden
źródło
7
Mój szef jest dobrym przyjacielem emerytowanego administratora sieci, który powiedział jej, że trzeba go uruchamiać co najmniej raz w tygodniu ... co wyjaśnia, dlaczego jest taka nieugięta. Dziękuję za Twoją odpowiedź.
Evan
5
Nic dziwnego, że jest „na emeryturze” ... czy to eufemizm dla zwolnionych?
KCotreau
3

Należy je ponownie uruchomić tylko w celu konserwacji, jeśli wszystko działa poprawnie . Zaplanowane ponowne uruchomienie jest tak naprawdę wymogiem tylko wtedy, gdy A) aktualizacja oprogramowania, B) konserwacja sprzętu lub C) zajmowanie się wyciekiem pamięci, którego nie można rozwiązać poprzez ponowne uruchomienie oprogramowania / usługi, która go spowodowała. Chociaż Windows nie jest znany z długich okresów przestoju, tak się dzieje (ostatnia praca miała kilka pudełek Win2k, które działały przez wiele miesięcy - po prostu działały). Pamiętaj tylko, że łatanie najprawdopodobniej będzie wymagało ponownego uruchomienia.

Mateusz
źródło
Dziękuję za Twoją odpowiedź. To powinno pomóc ją przekonać.
Evan
1
Znalazłem Windows NT, 2000 i 2003 Boxy w sieci roboczej, które działają od wielu lat. a do niedawna nasze centrum danych miało coroczną politykę łatania, a przy ponad 600 serwerach nierzadko zdarza się, aby sprawdzić czasy działania w zakresie ponad 250 dni. Moje serwery (mam około 120) Aktualizuj się i uruchamiaj po każdym łataniu Microsoft. Czasami, jak w zeszłym miesiącu, nie mieliśmy cyklu. Czas pracy zależy od tego, co działa na serwerze i od tego, jak dobrze wszystko działa razem. 2003 R2 z tymi rzeczami, które muszę uruchomić, muszą być restartowane co 35 dni. potem dzieją się śmieszne rzeczy.
Christopher Thornton
2

W żadnym wypadku nie jestem ekspertem w tej dziedzinie, ale w zależności od tego, jakie usługi masz uruchomione, niektóre mogą być podatne na przepełnienie niektórych funkcji pomiaru czasu, takich jak timeGetTime () i getTickCount ().

timeGetTime ma wynik 32-bitowy, który jest równy liczbie milisekund od uruchomienia komputera. Maksymalnie trwa to około 49,7 dni.

Mateusz
źródło
2
Err, nie. Mam serwer (w całkowicie odizolowanej, zaufanej sieci - nie wygłaszaj kazań), który działał przez najlepszą część 14 miesięcy bez ŻADNYCH złych efektów.
Ben Pilbrow
3
Nie chciałem sugerować, że każdy serwer i instancja będą miały ten problem, ale że jeśli serwer korzysta z oprogramowania, które korzysta z tych funkcji i nie bierze pod uwagę takich problemów, mogą wystąpić problemy obliczeniowe.
Matthew
2
Problem z 32-bitowym zegarem jest prawidłowy, ale jest to problem, którego poszczególni dostawcy oprogramowania muszą ostrożnie unikać we własnym kodzie. System Windows nie jest już podatny na awarie związane z tym zegarem (jak to miało miejsce w przeszłości), ale jeśli masz zainstalowane oprogramowanie, które nie uwzględnia wycofania timera, może to powodować nieoczekiwane efekty.
tylerl
1
Czy odnosisz się do tej bazy wiedzy Microsoft ?
jscott
9
Err, to jest błąd NT 4, wygrana 2k + nie cierpi z tego powodu. Myślę, że możemy spokojnie powiedzieć, że NT 4 nie żyje w 2011 roku. Jeśli ktoś gdzieś go obsługuje ... zasługuje na to, co dostaje w tym momencie.
Zypher
2

Ponownie uruchamiałem wszystkie moje serwery Windows co tydzień i na pewno był taki czas, kiedy było to wymagane. Obecnie uruchamiam je ponownie tylko wtedy, gdy wymaga tego aktualizacja. Oczywiście oznacza to, że i tak są one restartowane co kilka tygodni.

John Gardeniers
źródło
2

Microsoft przez lata świetnie sobie radził z poprawą systemu operacyjnego serwera. Niektóre serwery mogą działać przez 6-12 miesięcy, zanim zaczną występować problemy, niektóre tylko przez 2-3 miesiące. Wszystko zależy od tego, jakie usługi i aplikacje działają serwery. Ale w pewnym momencie wszyscy będą mieli problem. Aktualizacje systemu Windows, wycieki pamięci, niedoskonałe oprogramowanie to tylko kilka powodów.

Dla naszych klientów z umowami serwisowymi instalujemy aktualizacje i restartujemy ich serwery co miesiąc. Klienci ci mają znacznie mniej nieprzyzwoitych problemów z nieplanowanymi serwerami, rzędu 1/5 liczby problemów, które nie uruchamiają się regularnie.

Dla tych, którzy twierdzą, że ponowne uruchomienie powoduje przedwczesną awarię sprzętu, był czas, kiedy restartowanie dysków twardych i systemów było potencjalnym problemem. Jednak obecnie dyski twarde i inne komponenty są konstruowane tak, aby wytrzymać tysiące cykli start-stop. Jeśli sprzęt serwera jest słaby, czy wolałbyś o nim wiedzieć w kontrolowanym czasie, gdy jesteś tam, aby szybko rozwiązać problem, lub przypadkową awarię z połączeniem w środku dnia roboczego, informującym o awarii działu?

Wydaje mi się, że regularne comiesięczne restarty nie mają żadnych wad, a zalety są wyraźne i udowodnione z czasem.

Todd H.
źródło
1

Korzystam z aktualizacji systemu Windows, aby skonfigurować mój „harmonogram restartu”. Pozwól systemowi Windows sam się zarządzać ... raz! Tylko bardzo rzadko wymagane jest ponowne uruchomienie z naszą konfiguracją z powodu wycieków pamięci ...

Louisville
źródło
1

Jestem administratorem sieci w firmie, która działa na kilku serwerach Windows 2003 2008. Ponownie uruchamiam serwery co miesiąc, zwykle nie czekając dłużej niż 3 miesiące, ponieważ bardzo ważne jest, aby być wyłączonym przez tak krótki czas.

Jednak dzięki poprawkom i aktualizacjom systemu Windows będę instalować program WSUS na kontrolerze domeny, aby stosować aktualizacje itp. Zgodnie z harmonogramem na podstawie moich upodobań. Ma to na celu uniknięcie aktualizacji serwerów i nieoczekiwanego ponownego uruchomienia ...

GMitch
źródło
1

Wszyscy, którzy nienawidzą systemu Windows, powinni sprawdzić witryny Netcraft.com z najdłużej działającymi systemami według średniego czasu pracy ( http://uptime.netcraft.com/up/today/top.avg.html ). Pokazuje to strony, które działały najdłużej od ostatniego restartu, a 95% z 50 najlepszych to komputery z systemem Windows 2003 i 2000. Jak zawsze przebieg może się różnić.

Mark Lawrence
źródło
Być może nie wiesz zbyt wiele na temat równoważenia obciążenia ...
mfinni
0

Określenie tylko systemu Windows może być zbyt szerokie, aby podjąć rozsądną decyzję. W rzeczywistości podejmiesz lepszą decyzję, jeśli weźmiesz pod uwagę usługi, role i funkcje uruchamiane na komputerze z systemem Windows (np. Usługi sieciowe, serwery baz danych itp.).

Jakość i zachowanie aplikacji i usług stron trzecich uruchomionych na określonym serwerze może sugerować potrzebę częstszego / mniejszego restartowania hostującej maszyny Windows niż innych maszyn bez nich.

W rzeczywistości niektóre aplikacje innych firm ( nie perfekcyjnie zaprojektowane; ale nikt nie jest doskonały! ) Mogą nie zwolnić nabytych zasobów systemowych, takich jak pamięć, zamki i gniazda w zgrabny i terminowy sposób. Może to na przykład utrzymywać niektóre zawieszone aplikacje, usługi lub sterowniki [po ponownym uruchomieniu] w stanie oczekiwania lub początkowym, które mogą nie być łatwo naprawione bez ponownego uruchomienia komputera.

W praktyce aplikacje we / wy dysku, wymagające sieci i pamięci pod dużym i obciążonym obciążeniem oraz z dostępnymi niskimi zasobami systemowymi mogą powodować opóźnienie, niestabilność lub niszczenie komputera z systemem Windows, co może sugerować, że należy je ponownie uruchomić wcześniej.

Jeśli musisz uruchamiać takie wadliwe aplikacje lub obsługiwać więcej użytkowników niż typowa pojemność sprzętu / oprogramowania lub jesteś zmuszony do zlokalizowania niekompatybilnych usług w jednym komputerze fizycznym, możesz podjąć decyzję o ponownym uruchomieniu systemu Windows cyklicznie. W takim przypadku możesz dostosować okres restartu, słuchając skarg użytkowników na szybkość serwera!

FIV
źródło
-6

Prawidłowa odpowiedź nigdy nie jest możliwa, chyba że wykonasz aktualizację oprogramowania. Ostatni raz zrestartowałem mój serwer około 2 lata temu i przyczyną była awaria zasilania.

Dmitriy R.
źródło
3
Mam nadzieję, że mówisz o serwerze linuxowym lub mam nadzieję, że twój serwer nie jest w profesjonalnym użyciu ...
HTDutchy
3
Każdy serwer, który zostanie załatany, musi zostać zrestartowany, aby zastosować niektóre z tych poprawek. Każdy serwer wystawiony na działanie sieci publicznej musi zostać załatany.
mięso szynowe
Mam kilka kontrolerów domeny NT 4, które uruchamiane są raz w roku. Żadnych więcej aktualizacji i już nie atakowani przez złych facetów ... (nie mają
dostępu