Nasz budynek znajduje się ok. 100 metrów od ładunków wybuchowych. Zdarzają się kilka razy dziennie i naprawdę wstrząsają całym budynkiem. Trwa to przez wiele dni, a wybuchy mają się wzmocnić.
Nasze serwerownie nie są niczym wyjątkowym; jeden z nich ma wszystkie stojaki na twardym betonie, a drugi ma podniesioną podłogę (ten, który pozwala na poprowadzenie kabli pod nim).
Czy ktoś ma dla nas jakieś wskazówki, środki zaradcze lub najlepsze praktyki?
Obecnie myślimy o następujących środkach zaradczych:
- Codzienny raport lampek stanu serwerowni (lamp HD, zasilaczy itp.).
- Nocne sprawdzanie skanowania dysku na najważniejszych serwerach
- Zamów dodatkową dostawę zapasowych dysków twardych
Edytuj: Wiele dobrych odpowiedzi tutaj! Trzeba jednak zostać zaakceptowanym. Najwyżej głosowana odpowiedź w momencie tej edycji zostanie zaakceptowana.
disaster-recovery
server-room
Chris Dale
źródło
źródło
Odpowiedzi:
Gdybym był tobą, zadzwoniłbym do firmy ubezpieczeniowej firmy i kazałbym im umieścić akcelerometr.
W ten sposób - firma ubezpieczeniowa będzie wiedziała, że to nie ty potrząsasz dyskami, a firma ubezpieczeniowa będzie wiedziała na pewno, kiedy wybuchnie każdy wybuch, na wypadek, gdyby Twoja sieć SAN umarła dokładnie w tym samym momencie.
(Zrobiliśmy to.)
źródło
Nadszedł czas, aby upewnić się, że zweryfikowałeś swoje rozwiązanie do tworzenia kopii zapasowych. Cały wymienny sprzęt na świecie nie uratuje cię, jeśli twoje kopie zapasowe są uszkodzone lub w inny sposób stały się bezużyteczne.
źródło
Oprócz wszystkich innych doskonałych sugestii (szczególnie kopii zapasowych poza siedzibą ) powinieneś rozważyć zabezpieczenie pomieszczenia przed kurzem w stopniu, w jakim jest to praktyczne: zrzucanie pogody wokół drzwi, taśmy wokół okien itp.
Jeśli masz wloty powietrza zewnętrznego, planuj zmianę filtruje po zakończeniu śrutowania.
To powiedziawszy, nie marnowałbym czasu / zasobów na nocne skanowanie dysków ani pieniędzy na zapasowe dyski twarde (być może kupię jeden lub dwa na najbardziej krytyczne maszyny, ale pamiętaj, że w razie potrzeby możesz je na noc).
Sprzęt serwerowy jest zaskakująco solidny i będzie działał przez lata w dość okropnych warunkach. Szanse są w porządku.
źródło
Zamontuj szafy serwerowe na platformach ISO-Base . Pozwoli to odizolować szafę serwerową od wstrząsów naziemnych i pozwoli na działanie systemów nawet w przypadku ruchu.
To nie jest łatwe, ale skuteczne. Zwłaszcza w strefach trzęsień ziemi.
Aby zobaczyć ISO-Base w akcji, obejrzyj ten film pokazujący efekty w szafie serwerowej podczas symulacji trzęsienia ziemi . Jeden stelaż jest zamontowany na podstawie ISO, a drugi nie.
źródło
Zasilanie: jeśli straciłeś zasilanie, czy wszystkie serwery, pamięć masowa, san (itp.) W twoim stojaku ponownie uruchomią się same? A może pojawią się dopiero po naciśnięciu przycisku „Włącz”?
To z dwóch powodów:
Możesz również zasugerować użytkownikom, aby co wieczór wyłączali i odłączali komputery.
źródło
Większość ludzi mówi o tworzeniu kopii zapasowych - niewiele mówi o przywracaniu. Upewnij się, że przywracanie z kopii zapasowej jest tak proste, jak to możliwe. W szczególności, jeśli czas ma krytyczne znaczenie.
Jeśli masz replikację w tej samej lokalizacji, zmień ją na wzorce (jeśli pozwala na to czas), ponieważ te w twoim budynku są znacznie bardziej narażone. Są również bardziej prawdopodobne, że spadną w godzinach pracy (ewidentnie).
Radzę też pracować z domu.
źródło
Zagraj w heavy metal, aby zastąpić twardy kamień podczas eksplozji. Hard rock i tak jest taki passé. ;)
Mówiąc poważniej, być może za rogiem jest sklep z sprzętem dla DJ-ów, w którym można kupić amortyzatory / izolację. Wielu DJ-ów (muzyka taneczna) ma podobne trudności z odtwarzaniem płyt (tj. Trzymaniem małej igły w małym wirującym rowku, nieco porównywalnym z wrażliwym sprzętem, takim jak dyski) przy ekstremalnej głośności, podczas gdy tłumy wokół nich skaczą i tupią na podłodze w synchronizacji (ważne jest „zsynchronizowane”; jeśli nigdy nie słyszałeś o incydencie z Tacoma Narrows Bridge , powinieneś rozważyć obejrzenie tego klipu ). Rozerwij kilka worków na śmieci, aby zapewnić dodatkową ochronę przed kurzem.
źródło
Dziwi mnie, że nikt nie wspomniał o procesach.
Jest to idealna okazja, aby zapoznać się z planami dotyczącymi ciągłości działania. Jaki jest plan, jeśli musisz przenosić biura na dzień lub tydzień? Czy masz aktualne plany dotyczące rysunków i które systemy mają pierwszeństwo do odtworzenia? Czy kierownictwo zostało poinformowane, że masz plan i jesteś tego świadomy
Przyspieszenie od wybuchów powodujących spustoszenie w serwerowni jest prawdopodobnie najmniejszym z twoich zmartwień. Twoje narzędzia mogą być znacznie bardziej narażone na ryzyko, chyba że jesteś samowystarczalny dzięki zasilaniu na miejscu i niezawodnej łączności (zakładając, że nie jesteś samowystarczalny i wspierasz tylko lokalnych pracowników).
Jeśli wystąpi awaria sieci wodnej, awaria zasilania lub dostępu do Internetu, czy możesz to przetrwać? Czy zadzwoniłeś do swojego dostawcy Internetu, aby dowiedzieć się, czy jest on świadomy wybuchu i czy przygotowałeś się do przywrócenia usługi alternatywną trasą, jeśli twoje narzędzia zostaną przerwane. Poznasz swoją specyfikę lepiej, niż możemy się domyślić, ale powinieneś mieć listę wszystkiego, czego potrzebujesz, aby funkcjonować i odpowiadać „Co, jeśli to nieoczekiwanie zniknie?” dla każdego.
Samo omówienie tego w twojej głowie / na papierze pomoże ci dowiedzieć się, czy masz jakieś słabości, które wymagają późniejszej pracy, i być może przekażesz to do łańcucha, jeśli twoja organizacja nie ma nic napisanego. Zacznij od dwustronicowego streszczenia - po prostu FYI, aby wszyscy wiedzieli, co robisz.
Tak - posiadanie kilku dodatkowych dysków twardych / części zamiennych jest dobre, ale bardziej martwiłbym się tym, czego nie widzę lub nie kontroluję bezpośrednio.
Prawdziwą zaletą tego procesu jest sprawdzenie rzeczywistego systemu monitorowania. Po zaplanowaniu podstawowych scenariuszy będziesz lepiej przygotowany na nieoczekiwane. Krótkie podsumowanie tego, czego oczekujesz od przetrwania, a czego nie, przyda ci się bardzo bez względu na przyczynę awarii, a także pomoże w wysiłkach zmierzających do poprawy monitorowania 24/7, a nie wtedy, gdy fundacja zacznie się trząść.
źródło
Kiedyś uruchamiałem komputery w kopalni, która była odzyskiwana. Gdy rekultywacja zbliżała się coraz bardziej do biura, sala danych trzęsła się prawie codziennie pod koniec dnia.
Moje środki zaradcze obejmowały przesunięcie stojaków na niektóre twarde gumowe nóżki zaprojektowane do tłumienia wibracji. Zostały one wykonane przez Mansona i właśnie oszacowałem wagę mojego stojaka i kupiłem odpowiednie stopy. Wydawało się, że to naprawia jakikolwiek ruch w szafie. Twarda część polegała na delikatnym podnoszeniu stojaka, aby wsunąć stopy.
Ponadto, jak wspomniano inni, miałem kopie zapasowe, które przetestowałem i trzymałem poza witryną.
Serwery te trwały 3 lata z ciągłym wstrząsaniem i awariami niezwiązanymi ze sprzętem. Komputery stacjonarne w biurze nie działały tak dobrze, ponieważ 2 z nich miały katastrofalne awarie dysków twardych.
źródło
Nie widziałem tego jeszcze o kopiach zapasowych, ale upewnij się, że zabrałeś je ze strony! Możesz także wykonać kopię zapasową konfiguracji przełącznika, zapory sieciowej itp.
źródło
Zapytaj firmę inżynierską wykonującą strzał. Szanse są bardzo dobre, w przeszłości mieli własny sprzęt lub zadawali obrażenia od wybuchu sąsiedniej serwerowni.
źródło
Przeczytaj ponownie kroniki BOFH . Da ci kilka praktycznych pomysłów, jak zatrzymać wybuchy. Cała reszta będzie tylko środkiem zaradczym.
Jeśli chodzi o środki zaradcze, wszyscy wspominali o kopiach zapasowych, więc unikam powtarzania tej dobrej porady.
Codziennie sprawdzaj 5 tablic rajdowych i już masz wolne dyski. Cała ta wibracja nie może być dobra dla wrzecion, a zdumiewające jest, jak często tablice, które można zapisać, są tracone z powodu alarmu, którego nikt nie słyszy, i awarii drugiego wrzeciona.
Być może jestem optymistą, ale inżynierowie wykonujący wybuch zwykle nie celują w poziomy wibracji w celu zniszczenia poziomów energii „zniszczyć podstawę sąsiada”, więc najbardziej martwiłbym się ruchomymi częściami komputerów, czyli dyskami.
źródło
Umieść pewną ochronę pod stojakami, szczególnie z twardego betonu. To będzie (lub prawdopodobnie będzie) wstrząsać (ing) bardzo często. Jeśli nie możesz kupić (szczególnie z powodu czasu), kup podłogę odporną na trzęsienia ziemi, umieść pod nią piankę, aby zmniejszyć wstrząs.
źródło