Zarządzanie nieruchomościami w mojej organizacji poinformowało mnie, że jutro nasz budynek straci moc. Muszę się przygotować na to wydarzenie (jesteśmy małą organizacją, jestem młody, dlatego jestem IT). O jakich rzeczach muszę wiedzieć.
Planuję wchodzić i wyłączać wszystkie maszyny i drukarki. Czy to mnie obejmie? Mamy zarządzany przełącznik. Czy trzeba go zamknąć? Czy muszę odłączyć wtyczki w przypadku przepięcia?
Wygląda na to, że będę objęty ochroną, jeśli wszystko po prostu odłączę od zasilania. Dzięki za wgląd.
Właśnie to zrobiłem w ostatnim tygodniu po zamknięciu centrum danych;). Tak, należy zamknąć wszystko. Niektóre rzeczy mogą tolerować wyciąganie spod nich mocy i zazwyczaj można je zidentyfikować, nie mając włącznika zasilania. W zależności od tego, co ludzie robią, możesz fizycznie odłączyć zasoby o wyższej wartości od ściany.
Czasami możesz uzyskać znaczne wzrosty mocy, gdy moc powróci, a to może zabić sprzęt. Należy również pamiętać o obciążeniu początkowym. WSZYSTKO, gdy włączy się od razu, może wystarczyć, aby przełamać wyłączniki i wszystko sprowadzić ponownie. To jest do bani. Postaraj się o stopniowe włączanie zasilania, aby obejść to.
EDYCJA: Mieliśmy przypadek, w którym przełącznik transferu do generatora nie zadziałał, a UPSowi zabrakło baterii. Kiedy narzędzie wróciło, wszystko włączało się na raz. 20 sekund później UPS uderzył w Przeciążenie i ponownie zrzucił ładunek z pokoju. Do tego czasu na miejscu przybyło wystarczającej liczby techników (miało się to zdarzyć w weekend), że udało im się wyłączyć wystarczającą liczbę rzeczy przy przełącznikach zębatkowych, aby po powrocie narzędzia pokój nie spadł ponownie . To jo-jo kosztowało nas dużo sprzętu, a powrót do zdrowia po części szkód był tydzień.
źródło
Jedyne, co chciałbym dodać, to upewnić się, że wszystkie umowy wsparcia i części zamienne są łatwo dostępne. Jestem pewien, że tak, ale sprawdź to podwójnie i potrójnie. Jeśli masz serwery, które nie wyłączały się przez długi czas, od czasu do czasu znajdziesz problemy ze wszystkimi ruchomymi częściami (łożyska / silniki dysków twardych, silniki wentylatorów i łożyska oraz niektóre naprawdę głupie rzeczy, o których zwykle nie myślimy o).
Jeśli możesz tam być przez cały czas, przygotuj listę ważnych serwerów, w tym ich znacznik serwisowy, konfiguracje, gdzie znajdują się kopie zapasowe oraz osoby, które mogą być odpowiedzialne za aplikacje na każdym komputerze. Przyklej taśmą z boku danego serwera lub umieść go w segregatorze w centrum danych, gdy zaczniesz próbować przywracać ustawienia. Nie chcesz nadal działać w całym biurze, jeśli coś jest zepsute.
źródło
Przede wszystkim masz dobre kopie zapasowe, prawda? :) Zawsze dobrym pomysłem jest upewnienie się, że masz kopię zapasową, na wypadek, gdyby dysk zdecydował się nie uruchamiać itp., Gdy wszystko przywrócisz do trybu online. Nie ma nic lepszego niż oddychanie po przerwie w zasilaniu, niż uświadomienie sobie, że jeden krytyczny serwer SQL nigdy nie wrócił. :)
Po drugie, masz rację, z wdziękiem zamknij i wyłącz wszystkie serwery itp.
Jeśli nie jest to nowoczesny budynek i / lub nie masz zasilacza UPS z ochroną przeciwprzepięciową (tak to brzmi) lub coś w tym rodzaju, zawsze lepiej jest być bezpiecznym niż żałować, i sugerowałbym odłączenie sprzętu. Ponowne włączenie zasilania może spowodować skok mocy.
Również trochę FYI; wyłącz serwery podstawowe na końcu (np. DNS itp.) Nie chcesz wyłączać serwerów DNS i nie będziesz w stanie rozwiązać pozostałych serwerów, jeśli zdalnie je wyłączysz :)
Po przywróceniu wszystkiego do trybu online, najpierw uruchom sprzęt sieciowy, następnie najważniejsze serwery krytyczne, a następnie serwery aplikacji / plików.
Powodzenia!
źródło
Zamknij wszystko, w tym przełączniki i routery, a następnie odłącz wtyczkę lub wyłącz w gnieździe ściennym.
Jeśli martwisz się gwałtownymi wzrostami, czy istnieje budżet na kilka małych zasilaczy UPS na najbardziej krytyczny sprzęt?
EDYCJA: Podoba mi się sugestia neobajta, aby mieć „plan testowy” na wypadek, gdy przywracasz rzeczy. Nawet jeśli masz tylko jeden w głowie i zdecydowane polecenie, aby szybko przywrócić usługi, wszystko będzie dobrze. Upewnij się, że ludzie wiedzą, że pracujesz według planu, i mam nadzieję, że zrozumieją, dlaczego włączenie ich stacji roboczej, zanim spojrzysz na serwery i zmiana, nie pomoże!
źródło
Zależności między serwerami / kolejność uruchamiania serwera również najlepiej będzie ustalić z wyprzedzeniem. Na przykład, jeśli jest to sieć systemu Windows, najpierw włącz zasilanie DC, a następnie serwery baz danych, a następnie wymień itp. W każdym razie jest to świetna lista dla twojej dokumentacji.
Minimalizuje ponowne uruchomienie i spam w pliku dziennika.
źródło
Za późno na przećwiczony scenariusz wyłączania. Sugeruję, abyś zrobił wszystko, co opisałeś, a potem byłeś przy powrocie zasilania.
nie zapomnij opublikować notatki wyjaśniającej kolegom, co się stało. większość z nich „zapomni” o wyłączeniu komputera i może chcieć wiedzieć, dlaczego system należy uruchomić ...
źródło