Ostatnio jeden z głównych serwerów plików w naszej firmie zawiódł. Używał 4-dyskowej macierzy RAID, ale najwyraźniej 3 dyski zginęły, a wszystkie dane na serwerze zostały utracone.
W rozmowie z administratorem sys powiedział, że od miesięcy ostrzega kierownictwo wyższego szczebla o sytuacji związanej z tworzeniem kopii zapasowych. Próbował uzyskać zgodę na zakup rozwiązania do tworzenia kopii zapasowych na poziomie przedsiębiorstwa, ale nigdy nie uzyskał zatwierdzenia budżetu na to - ponieważ kierownictwo uważało, że to przesada.
Administrator sys jest dedykowanym odpowiednio certyfikowanym administratorem sys, podczas gdy jego menedżerowie nie są zorientowani na IT.
Jego menedżer pyta, dlaczego nie kupił taniego dysku zewnętrznego i użył go do wykonania kopii zapasowej serwera plików. Administrator sys uważa, że jest to po prostu myszka miki, która nadaje się do użytku w domu, ale nie jest profesjonalną firmą informatyczną - dlatego tego nie zrobił.
Wydaje mi się, że administrator sys chce odpowiedniej strategii informatycznej, która kosztuje dużo więcej pieniędzy, podczas gdy zarząd (bez głębokiego zrozumienia IT) chce tańszych rozwiązań, które ich zdaniem są odpowiednie.
Zastanawiam się, jaka jest opinia innych administratorów systemu? Czy ten administrator systemu działał poprawnie? A może powinien zawsze upewnić się, że wykonano kopię zapasową ważnych danych, nawet jeśli uważa, że tańszy sposób nie jest wystarczająco dobry?
Edycja: na podstawie odpowiedzi dodam, że administrator sys ma menedżera IT, który wiedziałby o tej sytuacji. Podlega najwyższemu szefowi. Nie wiem, czy menedżer kiedykolwiek zgłosił szefowi pełną sytuację. Myślę, że jest to dość trudne dla menedżera, ponieważ utknął w środku i chce być dyplomatyczny z obiema stronami.
Odpowiedzi:
Zgadzam się, że robienie tego dobrze jest preferowaną metodą. Ale stać i nie robić nic, jest nieprofesjonalne. Czy zarząd został poinformowany, że nie ma kopii zapasowej? Zadaniem administratora jest przedstawienie kierownictwu opcji, w tym kosztów i ryzyka. Przedstawił swoją preferowaną opcję, a kiedy odmówiono jej, nic nie zrobił. Nie fajnie.
źródło
powiedziałbym szczerze, że jest to awaria obu części.
Logistyka sytuacji może oznaczać, że będzie musiał zabrać czas, który powinien spędzić, wykonując inne, natychmiastowe, ważne zadania.
Jednak ostatecznie tak, powinien był coś zrobić. Kilka twardych dysków stąd i byłoby lepiej niż nic, jak wielokrotnie powtarzano.
Z drugiej strony, głównym celem zarządzania jest upewnienie się, że ludzie pod tobą mogą wykonywać swoje zadania i robić. a zatem z przywódczego punktu widzenia menedżerowie ponieśli porażkę i mogą być pociągnięci do odpowiedzialności w równym stopniu, jeśli nie więcej.
źródło
Jeśli nie ma kopii zapasowych, moim zdaniem sysadmin ma obowiązek:
1) Wyraźnie powiedz wyższym wzlotom, że nie ma żadnych kopii zapasowych, w żadnych niepewnych terminach, aby byli tego świadomi
2) W każdym razie wykonaj kopię zapasową danych, w dowolny sposób
Szczerze mówiąc, spodziewałbym się zwolnienia, gdyby tak się stało, ponieważ nawet jeśli kierownictwo utrudnia mi życie, to nie jest usprawiedliwienie, zwłaszcza jeśli nadal mają wrażenie, że mają coś, a nie nic.
źródło
To jest cholerne, jeśli tak, potępione, jeśli nie. Szczerze mówiąc, jeśli zarząd nie wydał żadnych pieniędzy na rozwiązanie do tworzenia kopii zapasowych, to ich wina. Z drugiej strony, administrator powinien był aktywnie próbować znaleźć rozwiązanie zatrzymania, zamiast po prostu siadać na tyłku i czekać, aż coś się zepsuje (nie sądzę, aby jakiekolwiek rozwiązanie zewnętrznego dysku było dopuszczalne. nigdy nie dostanie przyzwoity zapasową z tym.) nie można po prostu powiedzieć: „nie mam, co ja chcę , więc nie jestem odpowiedzialny”, ale można powiedzieć, „ja wielokrotnie próbował cię zrobić coś, a nie daliście mi nic, a to nie jest mój problem ”.
Byłem kiedyś w takiej sytuacji - nie byłem nawet ADMIN-em w tym zadaniu - gdzie pracowałem nad bazą danych i utworzyłem kopię zapasową, zanim ją zmieniłem (czyli sop), i ja (jak zwykle robię) , gdy tylko mogę) zapisałem go na moim komputerze lokalnym. Dwa dni później stracili tablicę rajdową i ooops, okazało się, że nie ma rozwiązania do tworzenia kopii zapasowych. Oni że został kopii zapasowej bazy danych do macierzy RAID.
Spóźniam się więc z tym i mówię: „Och, poparłam to przedwczoraj”.
Wiesz jaki był wynik? Zostałem potępiony za moje złe rozwiązanie do tworzenia kopii zapasowych. Za maszynę, za którą w żaden sposób nie byłem odpowiedzialny. I to nie dlatego, że kopia zapasowa, którą miałem, była zbyt stara, tylko dlatego, że utworzyłem kopię zapasową bazy danych, nad którą pracowałem, a nie każdej bazy danych.
Problem w tym, że jeśli zrobisz rozwiązanie myszy miki, jeśli zrobisz coś, a to nie będzie wystarczająco dobre, dostaniesz tyle samo piekła, jak gdyby nic nie robiłeś. Jeśli kopie zapasowe są twoją odpowiedzialnością, jawnie i nie ma budżetu, powinieneś spróbować połączyć coś razem, ale lepiej cholernie upewnij się, że to działa, i musisz się z tym pogodzić. Wielokrotnie. Przy każdej okazji.
Jeśli to nie twoja odpowiedzialność, zwróć uwagę, że istnieje problem, i absolutnie, kategorycznie, odmów przyjęcia odpowiedzialności za nieprzyznany mandat, gdy próbują go Ci przypisać. Nikt nie traktuje odzyskiwania katastrof priorytetem, dopóki nie nastąpi katastrofa, a następnie kozioł ofiarny, aby spróbować nadrobić swoją krótkowzroczność.
źródło
Niestety firmy skąpiące na kopiach zapasowych są zbyt powszechne. Większość nigdy się nie zmienia, dopóki się nie spalą i nie stracą wszystkiego.
ALE
Jeśli jesteś zatrudniony jako administrator systemu, musisz pracować z narzędziami, które masz, w tym z mózgiem. Bez względu na to, co kierownictwo lub ktokolwiek mówi w dobre dni, kiedy kupa trafi do wentylatora, wszyscy otrzymują selektywną pamięć.
Kopia zapasowa myszy miki jest lepsza niż brak kopii zapasowej.
źródło
Dla mnie brzmi to tak, jakby sysadmin chciał wszystkiego lub nic. Fajnie jest dostać wszystko, ale jeśli nie możesz, nie możesz nic zaakceptować?
Z mojego doświadczenia wynika, że należy ocenić wszystkie możliwe opcje (niezbyt głęboko) i sporządzić kilka punktów za każdą wskazującą zalety i wady, koszty (początkowe i bieżące). Dołącz do tego opcję „nic nie rób”.
Następnie pozwalasz menedżerom decydować, które rozwiązanie wybrać. Wydaje mi się, że twój sysadmin mógł mieć więcej niż jedną możliwą opcję. Być może jednak widział tylko ten, którego naprawdę chciał?
źródło
Dodam mój głos do tych, którzy mówią, że administrator powinien tu coś zaimplementować . Jest bardzo winny, że tego nie zrobił. Jest część mnie, która chciałaby sympatyzować ze swoją pozycją, ale w idealnym świecie tworzenie kopii zapasowych i przywracanie nie zajmowałoby czasu, zawsze działało i nigdy nie było potrzebne. To nie jest świat, a nawet najlepsze rozwiązanie do tworzenia kopii zapasowych będzie miało wady, które trzeba zaakceptować i nauczyć się z nimi pracować.
Na wpół dupska jest lepsza niż bez oceny, a nawet użycie el-cheapo USB HD wyciągnęłoby go z lasu i nadałoby wagę jego pozycji, gdy zarząd powiedziałby, że nie mogą uzyskać danych więcej niż dzień lub dwa stare plecy. Ale w tym przypadku nadal oszczędziłby mu szyję.
źródło
Nie wiem, czy powiedziałbym, że powinieneś zrobić kopię zapasową w każdych warunkach . Istnieje kilka rzeczy, które mogą Cię kusić, które mogą być nielegalne. Na przykład nie tworzyłem kopii zapasowej zapisów stanu zdrowia przez sieć na moim komputerze osobistym. Nie zrobiłbym czegoś nielegalnego tylko po to, żeby mieć kopię zapasową.
OTOH, aby mieć przynajmniej jakiś system kopii zapasowych, zaakceptowałbym wiele kompromisów. Następnie, ilekroć zawarty został kompromis, chciałbym upewnić się, że moje zastrzeżenia są jasne i udokumentowane, dlaczego był to zły kompromis, który spowoduje problemy, będzie nieodpowiedni lub stanie się mniej przydatny w przyszłości.
źródło
Jako administrator uważam, że moim obowiązkiem jest zapewnienie, że systemy pod moją opieką są tak bezpieczne i niezawodne, jak to tylko możliwe. Kopie zapasowe należą do tagów niezawodności. To może być frustrujące, gdy trzeba kłócić się z niezrozumiałymi pracownikami wyższego szczebla (myślę, że wszyscy byliśmy tam w tym czy innym czasie), nadal powinniśmy wykonywać nasze zadania najlepiej, jak potrafimy.
Kiedy system tworzenia kopii zapasowych, który odziedziczyłem na moim obecnym stanowisku, zawiódł, a zarząd wahał się przed wydaniem pieniędzy na system, którego chciałem, nie opuściłem systemu bez kopii zapasowych. Zamiast tego przyniosłem osobisty dysk zewnętrzny i korzystałem z niego przez około tydzień. Pomimo absolutnej niechęci do używania dysków twardych do tworzenia kopii zapasowych, faktem jest, że zdecydowanie lepiej było nie mieć ich wcale.
źródło
Jeśli administrator systemu nie był w stanie przekonać zarządzania o znaczeniu dobrego rozwiązania do tworzenia kopii zapasowych, jedynym sposobem, w jaki kiedykolwiek będzie przekonany, jest katastrofalna utrata danych, ale jako administrator systemu jesteś odpowiedzialny za edukowanie zarządzania i użytkowników na temat znaczenia takich rzeczy, jak tworzenie kopii zapasowych i aby upewnić się, że dokładnie rozumieją bieżący stan (w tym przypadku „brak kopii zapasowych”) i potencjalne konsekwencje („Stracimy dysk, a cenne dane znikną na zawsze”).
Moje osobiste zdanie jest takie, że administrator coś tutaj spieprzył: kopie zapasowe ad-hoc to zły pomysł (przegapisz rzeczy, ważne dane zostaną utracone, jeśli nie będziesz w pobliżu, kopie zapasowe się nie zdarzają), ale jednocześnie czas powinien był być w stanie znaleźć niezawodne rozwiązanie do tworzenia kopii zapasowych „dla przedsiębiorstw” w ramach budżetu firmy.
Oprogramowanie takie jak Bacula i Amanda jest dostępne za darmo i oba mogą bezpiecznie i niezawodnie współpracować z wymiennymi nośnikami USB i CD. Łącznie z kosztami mediów i sprzętu serwerowego możesz mieć dobry system za mniej niż 2000 USD - nawet taniej, jeśli oddasz sprzęt do recyklingu.
Teraz, gdy kierownictwo sprzeciwia się również administratorowi, który poświęca CZAS na tworzenie kopii zapasowych, po prostu nic nie pomaga tej firmie: jak powiedziałem powyżej, czasami jedynym sposobem na nauczenie ludzi jest katastrofalna utrata danych, a jeśli tak, to jest to niedobrze dla biednego administratora, który ponosi winę za instytucjonalną głupotę.
źródło
Osobiście uważam, że moim zadaniem jako administratora systemu jest informowanie i uświadamianie zarządowi potrzeby i znaczenia posiadania odpowiedniego, odpowiedniego rozwiązania do tworzenia kopii zapasowych i wnioskowania o niezbędny budżet na takie działania oraz wyjaśnianie ryzyka związanego z nieprzestrzeganiem tego. Nie mam obowiązku wychodzić poza mandat kierownictwa i robić po prostu wszystko, co uważam za słuszne, niezależnie od tego, jak kiepskie są te decyzje kierownicze. Nie jestem odpowiedzialny za łączenie na wpół upieczonego, na wpół wypalonego roztworu.
Gdybym był agentem ubezpieczeniowym i powiedziałem, że ważne jest, aby ubezpieczenie przeciwpożarowe było ważne w polisie właściciela domu, a jeśli odpowiednio wytłumaczyłem ryzyko braku ochrony przeciwpożarowej, a ty odmówiłeś ochrony przeciwpożarowej, a twój dom spłonął, kto odpowiedzialność to jest? Czy mimo to powinienem zapewnić ci ochronę przeciwpożarową?
Moim zdaniem sysadmin dołożył należytej staranności w wykonywaniu obowiązków związanych z pracą, zwracając uwagę kierownictwa na sprawę, wyjaśniając znaczenie posiadania odpowiedniego rozwiązania do tworzenia kopii zapasowych, wyjaśniając ryzyko jego braku i żądając niezbędnego budżetu na taki. Jeśli odmówiono mu wysiłków, odpowiedzialność spoczywa wprost na barkach kierownictwa.
Ludzie cały czas podejmują złe decyzje i zdarzają się złe rzeczy z powodu tych złych decyzji, to fakt. Nie mogę ponosić odpowiedzialności za każdą złą decyzję, którą podejmuje mój szef, niezależnie od ryzyka związanego z tymi decyzjami.
źródło
Czy ta sama sytuacja miała miejsce w przypadku macierzy RAID? Gdy tylko jeden dysk umiera, znajdujesz się w sytuacji, w której jeden oznacza utratę danych. Lepiej natychmiast wymień ten dysk.
Gdybym był w butach administratora sys, natychmiast przeszedł pierwszy dysk:
Jeśli po drodze odmówisz, przynajmniej masz to na piśmie, gdy gówno trafi do wentylatora (Dostań to na piśmie / e-mailem, nie akceptuj odpowiedzi ustnej. Potrzebujesz tutaj papierowego śladu. Jeśli twój kierownik odmawia pisania to, a potem przejdź nad jego głową, ponieważ to jest po prostu podejrzane - nie ma uzasadnionego powodu, aby tego nie zapisywać.)
Taki sam proces powinien zostać wykonany w celu uzyskania systemu kopii zapasowej, choć być może bez eskalacji tak szybko (lub w ogóle nad głową). Jeśli żadne z żądań nie jest na piśmie, cóż ... gówno stacza się w dół. Przynajmniej jest to dobra lekcja życia.
Jeśli nie stracisz pracy w związku z tą sytuacją, zacznij ponownie składać tę prośbę, powołując się na katastrofę, która spowodowała to, gdy twoje żądanie zostało odrzucone. Jeśli nadal jest to odrzucane, musisz zdecydować, czy jest to środowisko, w którym chcesz pracować, i warto stresować. Jeśli każdego ranka spodziewasz się wejść do pracy i znaleźć panikę z powodu utraty danych, cóż, to nie jest sposób na życie.
źródło
Firma wyraźnie szuka kozła ofiarnego, administrator sys ma rację, nie wykonując kopii zapasowej krytycznych danych na urządzeniu wymiennym.
1) Nie są niezawodne 2) Nie są bezpieczne
Ostatecznie to menadżerowie nie dopilnowują, aby wdrożone zostało odpowiednie rozwiązanie DR (odzyskiwania po awarii).
Spójrz na to w ten sposób, ile ta utrata danych kosztowała firmę? Nagle jestem pewien, że rozwiązanie „over the top” nie wygląda tak drogo.
edytuj: tak Przyznaję fakt, że każda kopia zapasowa jest bardziej niezawodna niż żadna, ale mój pierwotny punkt pozostaje, jeśli ta osoba ma menedżerów, menedżerowie powinni upewnić się, że kopia zapasowa była na miejscu, nie wybaczam tutaj administratora systemu, ale to właśnie powinien sprawdzić menedżer.
A co jeśli serwer ulegnie awarii, a danych na dyskach wymiennych nie będzie można odzyskać z jakiegokolwiek powodu? W przeszłości zdarzało mi się to, że dyski USB są dalekie od niezawodnych, ale dla niektórych można ich użyć w „szczypcie”, problemem jest, jak się wydaje, w tym przypadku zarządzanie zezwoliłoby na użycie kopii zapasowej dysku wymiennego w długim okresie biegać.
źródło