Czy serwery powinny być wyłączone w nocy?

144

Istnieje serwer używany od 4:30 rano do ~ 22:00.

Czy należy to wyłączyć? Myślę, że jest to serwer i że nie będzie miał problemu z utrzymaniem się na nim, ale poważni profesorowie mówią mi, że jest niebezpieczny i że HD może zawieść w ciągu 2 lat. Właściciel serwera uważa, że ​​jego stary serwer działający od 1995 r. Bez kopii zapasowej i jednego dysku twardego (jeśli dysk twardy ulegnie awarii, jest wkręcony) nie miał problemu, ponieważ wyłączał go w nocy.

Co w to wierzysz?

Teraz ma macierz RAID 1, kopię zapasową zewnętrznego dysku twardego i pełne kopie zapasowe na twardym dysku na dyskach DVD i przez Internet.

GorillaApe
źródło
62
+1, ponieważ choć nie sądzę, by ktokolwiek z nas kiedykolwiek brał to pod uwagę, jest to pytanie, ale niektórzy ludzie to robią i należy na nie odpowiedzieć.
Mark Henderson
8
Twoi profesorowie nie obsługują serwerów. Działają na stacjach roboczych z demonami sieciowymi.
Bekon Bity
4
Czy nie możesz użyć niektórych ustawień zasilania do spowolnienia dysków twardych, gdy nie są one używane? Ta sama korzyść pod względem zużycia, ale nie musisz wyłączać całej maszyny.
Brendan Long
34
Professors of English Lit?
Iain Holder
28
Nie polecam zasięgania porady od osób, które nie wykonują kopii zapasowych. Zwłaszcza nie, jeśli robią to od ponad 15 lat. Oszczędzanie energii elektrycznej jest jedynym argumentem za jej wyłączeniem. Żywotność zostanie zmniejszona z powodu codziennego podgrzewania i chłodzenia.
Malte

Odpowiedzi:

153

Aby porównać to do analogii samochodu: Taksówka może przejechać ponad 500 000 kilometrów, zanim będzie wymagała przebudowy silnika. Powodem tego jest to, że zawsze pracują one 24 godziny na dobę, 7 dni w tygodniu, a po osiągnięciu przez silnik temperatury silnika znacznie zmniejsza się jego zużycie.

Komputer jest trochę taki sam. Większość „zużycia” części może wystąpić podczas uruchamiania serwera. Po prostu podłącz amperomierz do komputera i włącz go. Po uruchomieniu moc, którą pobiera, rośnie bardzo wysoko, a następnie uspokaja się, gdy wszystkie dyski się zwrócą i procesor zostanie zainicjowany. Pomyśl także o tym, ile aktywności dyskowej serwer wykonuje podczas uruchamiania, a kiedy działa. Prawdopodobnie dostęp do dysku podczas uruchamiania systemu operacyjnego jest dość solidny, natomiast gdy system operacyjny jest uruchomiony, chyba że jest to bardzo obciążony serwer bazy danych (chyba nie), dyski najprawdopodobniej pozostaną dość bezczynne. Jeśli zdarzy się, że zawiedzie, są szanse, że uruchomi się.

Włączanie i wyłączanie serwera to głupi pomysł. Nie tylko wspominając, że większość serwerów może minąć od 2 do 5 minut, aby przejść przez testy systemu BIOS, ale także ogromną ilość zmarnowanego czasu.


Aktualizacja 2018: Biorąc pod uwagę, że większość komputerów jest teraz zasadniczo całkowicie półprzewodnikowych, ta odpowiedź może nie być tak dokładna, jak kiedyś. Analogia taksówek tak naprawdę nie pasuje do dzisiejszych współczesnych serwerów. To powiedziawszy, zazwyczaj nadal nie wyłączasz serwerów.

Mark Henderson
źródło
15
Czy możesz dodać linki do badań na ten temat?
mafu
15
@mafutrct: WikiBook na temat awarii HD i badanie Google Labs na temat awarii HD pokazuje nieprzekonujące dowody sugerujące, że cykle zasilania wpływają na żywotność dysku, a całkowity czas pracy nie jest tak duży jak partia / szczęście losowania. Najbardziej oczywiste są również oczywiste rzeczy, takie jak uraz fizyczny.
Chris S
3
Jak zasilają taksówkę, jeśli zawsze jeździ? W większości jurysdykcji jest to nielegalne.
Lekkość ściga się na orbicie
8
@Tomalak - cóż, analogia była taka, że ​​silnik taksówki ma temperaturę i w tym czasie występuje mniejsze zużycie. W ciągu 90 sekund ponownego tankowania taksówki silnik nie ma szans na ochłodzenie, a zatem zużycie jest nadal mniejsze. Na komputerze jest on natychmiast „chłodzony” (dla celów analogii), a każdy start jest „zimnym” startem.
Mark Henderson
6
@Fergus - cóż, dotyczy to tylko fizycznych skrzynek. Jeśli masz maszynę wirtualną, możesz ją dowolnie włączać / wyłączać. Ale nie uzyskasz z tego żadnej oszczędności życia ani energii.
Mark Henderson
70

Codzienne wyłączanie i włączanie serwera prawdopodobnie spowodowałoby jego awarię szybciej niż pozostawienie go włączonego.

HostBits
źródło
3
Najprawdopodobniej z powodu obciążenia dysku @ boot; miałem też serwer, który z radością działał przez lata, a potem odmówił uruchomienia przy ponownym uruchomieniu. Okazało się, że dysk startowy powoli się degradował, a MBR był całkowicie nieczytelny - ale MBR był czytany tylko podczas uruchamiania, więc nikt tego nie zauważył. Na szczęście dysk całkowicie zmarł dopiero po szalonej pogoni za odzyskaniem tego, czego jeszcze nie utworzono.
Piskvor
Wątpię, aby zdarzyło się to przy wyłączaniu raz dziennie, nawet dyski korporacyjne mają 300 000 włączeń pod względem szczegółów technicznych. Problem pochodzi z zarządzania energią, która robi to co 15 minut.
Lothar
Nie rozumiem, w jaki sposób odpowiedź, która zawiera jedynie czyjeś myśli, bez żadnego uzasadnienia, co kiedykolwiek otrzymało 70 głosów pozytywnych.
Bassie-c
52

Jedyne, co widzę, co jest prawie bliskie temu, o czym mówiono, to to, że dyski mogą ulec awarii w ciągu 2 lat. W rzeczywistości mogą zawieść w dowolnym momencie. Jestem pewien, że większość z nas otrzymała co najmniej jeden nowy dysk, czyli DOA. Średnio dyski serwerowe wystarczą na okres od około 3 lat wzwyż, a 10 lub 20 lat nie jest niczym niezwykłym. Nie oznacza to, że żaden indywidualny dysk nie zawiedzie się dużo wcześniej.

Serwery (czyli maszyna z odpowiednimi komponentami klasy serwerowej) są zaprojektowane do ciągłej pracy. Nie ma powodu, aby go wyłączać w nocy, ale istnieją bardzo dobre powody, aby pozostawić go uruchomionym. Noc lub jakikolwiek inny czas „cichy” dla danego systemu to czas na całą konserwację i automatyzację.

np. Kopie zapasowe najlepiej wykonywać, gdy nie ma aktywności użytkownika lub jest ona niewielka. Pomaga to zapewnić spójność kopii zapasowych. Pewnie, że są na to sposoby, ale dlaczego nie dać kopiom zapasowym każdej szansy na sukces, skoro nie ma nic do stracenia?

Ktoś, kto uruchamia „serwer” z jednym dyskiem i nie ma kopii zapasowej, jest głupcem, a nie administratorem. Jedynym powodem, dla którego uszło mu to na sucho, jest głupie szczęście. Nie miało to absolutnie nic wspólnego z wyłączaniem maszyny w nocy.

John Gardeniers
źródło
Odgadnę tutaj dzikie przypuszczenia i powiem, że „administrator”, który nie wykonuje kopii zapasowych, również nie używa odpowiednich komponentów klasy serwerowej.
intuicyjnie
23

Serwery są przeznaczone do działania 24x7. Zamykanie serwerów na noc jest niezwykle nietypowe. Dyski twarde serwera są zaprojektowane tak, aby były bardziej niezawodne niż dyski stacjonarne, a teraz, gdy masz kopie zapasowe i RAID 1, nie poniesiesz utraty danych, jeśli jeden z dwóch dysków ulegnie awarii.

Tym, co martwi mnie teraz w przypadku tego 16-letniego serwera, jest awaria płyty głównej lub brak redundancji zasilania.

Zerowa podsieć
źródło
Wydaje się to logiczne :) To jest motorola PC Power PC .. Jeszcze nie umarłem!
GorillaApe
13

Nigdy wcześniej nie wyłączałem serwera.

Dyski twarde ulegną awarii, jeśli ulegną awarii. Włączanie i wyłączanie maszyny nie spowoduje spowolnienia działania dysku. Widziałem dyski twarde wysłane od dostawcy, które były już złe, i widziałem dyski działające (i aktywnie używane) przez ponad 5 lat bezawaryjnie.

Twoi profesorowie są idiotami.

mrdenny
źródło
2
Włączanie i wyłączanie urządzenia z pewnością spowoduje wolniejsze działanie dysku, jeśli zostanie ono wyłączone na wystarczająco długi okres. Jeśli wyłączysz urządzenie na 10 lat, dysk będzie miał mniej więcej 10 lat. Pytanie brzmi, jak długo przeciętna maszyna musi zostać przerwana, aby uzyskać pozytywny efekt.
intuicyjnie
4
@intuited Jeśli włączysz maszynę po 50 latach oczekiwania, a napęd nie uruchomi się, czy trwał 0 lat, 50 lat czy co?
Cade Roux
@Cade Roux: Nie mam pojęcia. Co to za różnica Nawet jeśli policzymy to jako 0, ta wartość odstająca nie zmieni znacząco ogólnej średniej.
intuicyjnie,
1
@intuited to był żart - ale w rzeczywistości, to będzie prawdopodobnie pochylić średnią research.google.com/archive/disk_failures.pdf I z tych danych, to możliwe, że nowy napęd włączony po siedząc na półce do 5 lat będzie bardziej prawdopodobne jest uszkodzenie niż dysk działający przez 5 lat. Chodzi o to, ponieważ nie opłaca się pozwolić sprzętowi stać bezczynnie bardziej niż to, aby go wyłączyć i włączyć ponownie. Sprzęt ulega degradacji i przestarza, a jego maksymalna wartość musi zostać wykorzystana przed zużyciem i wymianą.
Cade Roux,
@Cade Roux: Z badań Google, z którymi się łączysz: Jak to zwykle bywa we wdrożeniach klasy serwerowej, dyski były włączane, obracały się i ogólnie służyły zasadniczo przez całe zarejestrowane życie. Tak więc badania nie są tu istotne. To pokazuje, że wciąż nowy dysk będzie bardziej podatny na awarię w danym okresie po jego ponownym włączeniu, ale zakłada to, że stary nie uległ awarii przez 5 lat, w których był bieganie.
intuicyjnie
11

Stawia to również większy „ludzki aspekt” na serwerze. Nawet jeśli używasz ustawień zasilania do wyłączenia i włączenia we właściwym czasie, powinieneś poprosić kogoś o monitorowanie serwera, aby upewnić się, że wszystkie wymagane usługi itp. Uruchomią się poprawnie. To cenny czas, kiedy możesz uczyć profesorów o kopiach zapasowych i macierzy RAID.

Kiedy wykonujesz kopie zapasowe? Oddałbym wszystko za 6-godzinne okno do uruchamiania moich codziennych kopii zapasowych, aktualizacji, poprawek itp. Jeśli nic więcej, można do tego wykorzystać ten czas przestoju.

Wzywam was, abyście poszli do tych „poważnych profesorów” i przedstawili badania wskazujące, że pozostawienie komputera w trybie 24x7 jest dla niego złe. Chciałbym utworzyć kopię zapasową tego, co mówią.

Theo
źródło
Powiedziałem poważnie, ponieważ jeden z nich zaprojektował procesory, systemy wbudowane znają jądro Linuksa bardzo szczegółowo. Jeśli chodzi o kopie zapasowe, stworzyłem skrypty do automatycznej kopii zapasowej, ale właściciel i administrator wyglądali mi jak koleś z WTF. „NIE chcę robić to ręcznie codziennie” i nie „smołuj i kompresuj”.
GorillaApe
2
@Parhs Mówiąc wprost, jesteś mądrzejszy od swoich przełożonych. Mądrze byłoby z ciebie zrezygnować i znaleźć prawdziwego mentora, zanim spędzisz zbyt dużo czasu w cieniu idiotów, którzy nie pozwolą ci postępować właściwie.
Skyhawk
10

Realistycznie oczekuje się, że większość serwerów będzie dostępna 24/7. Prosty i prosty.

Jeśli nie masz takiej szansy, jest bardzo debata, która spowoduje większe zużycie twojego serwera, ciągłe rozszerzanie się i kurczenie między włączaniem i podgrzewaniem serwera, a następnie wyłączaniem i ochładzaniem lub zużycie komponentów w wyniku ciągłego użytkowania.

Nie widziałem jeszcze żadnych badań, które byłyby gorsze, i bardzo wątpię, by twój profesor miał dostęp do niektórych badań twierdzących inaczej.

Ostatecznie będziesz musiał podjąć decyzję na podstawie swoich potrzeb, ale korzyścią dla większości firm jest to, że ich serwery i usługi są dostępne przez cały czas, nie tylko wtedy, gdy ktoś wchodzi i je włącza. Zwłaszcza, gdy toczy się debata, że ​​możesz sprawiać więcej kłopotów swoim serwerom, wyłączając je.

rfelsburg
źródło
7

Ważniejsze jest chłodzenie. Chłodzenie robi dużą różnicę. Temperatura wewnątrz skrzynki może być znacznie wyższa niż w pomieszczeniu. Zainstalowałbym oprogramowanie do monitorowania takich jak Everest. Porównując współczesne dyski twarde z wymienionymi, są gorące. Niektórzy potrzebują fanów, aby je ochłodzić. Czasami mały fan może mieć duże znaczenie. Żywotność HD i serwera zależy od chłodzenia.

Joe w Michigan
źródło
5

Tak, nie ma opcji. Powiedz profesorom, że standardem branżowym jest pozostawienie ich działających 24 godziny na dobę, 7 dni w tygodniu i mieć gwarancję na uszkodzony sprzęt. Jeśli serwer ma 16 lat, wyobrażam sobie, że nie dostaniesz tej gwarancji.
Gdyby serwer eksplodował, jaki czas przywracania musiałbyś zbudować nowy z kopią zapasową informacji? Chciałbym zacząć informować klientów, że ich serwer dobiegł końca, i powinni zacząć szukać funduszy na nowy.

xXhRQ8sD2L7Z
źródło
5

Prawdą jest, że naprężenia mechaniczne związane z cyklem zasilania są trudne na dysku twardym. Ponadto istniały niektóre starsze dyski, które (przy wystarczającym schłodzeniu) mogły całkowicie przestać działać z powodu „tarcia”.

W przypadku nieodpowiednio zaprojektowanych obwodów prądy rozruchowe z włączenia maszyny mogą również obciążać niektóre elementy, chociaż nie jest to wcale prawdopodobne.

To powiedziawszy, jest trochę prawdy, że pozostawienie włączonej maszyny ma swoje żniwo: kondensatory. Liczne kondensatory elektrolityczne na płycie głównej są prawdopodobnie najsłabszym ogniwem niezawodności systemu. Kondensatory te są oceniane pod względem zdolności do obsługi prądu / napięcia, temperatury roboczej i żywotności. Typowe kondensatory będą oceniane przez kilka tysięcy godzin. Wytrzymałe / trwałe czapki są oceniane na kilkadziesiąt tysięcy godzin i wyższe temperatury.

To dlatego czasami widzisz na sprzedaż płyty główne z „kondensatorami klasy serwerowej” - ponieważ te maszyny pracują z pełną prędkością 24x7 i przeżuwają żywotność płyty głównej.

Producent zabawek
źródło
Ponad 15 lat temu słyszałem termin „statystyka dysku” lub coś w tym rodzaju, wyjaśnienie zostało podane po latach, gdy polimery w smarach tarczowych zaczynają tworzyć długie łańcuchy, a kiedy dysk jest wyłączany i przestaje wirować łożyska przejąć i nie zacznie się ponownie ”. Awarie zasilania w DC zwykle oznaczały, że kilka serwerów nie mogło się zrestartować. Oczywiście nie mam pojęcia, jakich dysków używają teraz jako / zamiast łożysk.
jqa
+1 za karę. Zastanawiałem się, czy ktoś by o tym wspominał. @James, nazywa się to „striction”, i wiele pracy włożono w opracowanie smarów do napędów, które nie pogrubiają się z czasem, używają / nadużywają. Sprawy są lepsze niż kiedyś, ale włączanie i wyłączanie napędów nadal nie jest dobrym pomysłem, ponieważ najprawdopodobniej umrą, gdy dojdzie do mocy, albo dlatego, że jakiś element wieje, albo silniki napędowe nie mogą zacząć obracać talerzy
Greg
Większość płyt głównych wyprodukowanych od 2008 roku (być może wcześniej) wykorzystuje teraz kondensatory półprzewodnikowe, które mają DUŻO wyższą żywotność niż elementy elektrolityczne. Zasilacze są teraz jedynym miejscem, w którym nadal widać kondensatory elektrolityczne.
Mircea Chirea,
To jest siła (kij + tarcie), a nie siła. :-)
uprzejmie
2

Kiedy mój serwer dostawał comiesięczną konserwację zapobiegawczą od producenta, zaczęli od wyłączenia co miesiąc. Powodowało to awarie komponentów. Harmonogram zmienił się na kwartalny, a następnie tylko w razie potrzeby. Nie polecam wyłączania tak starego systemu, chyba że jest to konieczne.

BillThor
źródło
Tak, widziałem też serwery z ponad 1000 dniami bezawaryjności. Ale nie regularne restartowanie (ciepło) jest grzechem; lepiej napotkać nieudany system po planowanym ponownym uruchomieniu niż po nieplanowanym. Również te ponowne uruchamianie mają tendencję do wykrywania wpadek konfiguracyjnych.
sjas
1

Jedną rzeczą nie wymienioną jest to, że większość serwerów ma zadania konserwacyjne, które wykonują codziennie, co tydzień lub co miesiąc. Są one prawie zawsze zaplanowane na środek nocy, kiedy aktywność powinna być najniższa.

Na przykład w systemie Red Hat te czynności zaczynają się o 4:02 czasu serwera. W zależności od serwera mogą one działać od kilku sekund do godziny lub dłużej. Jeśli włączysz serwer o 4:30, te zadania konserwacyjne rozpoczną się natychmiast (przez anacron), a do najwcześniejszych użytkowników, którzy zalogują się między tym a 5-godzinnym czasem, będzie to miało wpływ.

Michael Hampton
źródło