Czy powinienem martwić się konfiguracją naszego serwera?

9

Pracuję dla firmy liczącej około 50 osób. Nasze dwa serwery (identyczne) są zbudowane na zamówienie z tymi specyfikacjami:

Xeon E3-1270 V3
Intel Entry Server Board
32 GB DDR3 ECC
2x 256 GB SSD RAID1 (for System)
4x 1TB SSD RAID10 (for Hyper-V VMs)
Windows Server 2012 R2 as Host and VMs

Każdy serwer obsługuje dwie maszyny wirtualne (2x AD + udostępnianie plików + profile mobilne, 1x serwer SQL do testowania, 1x inne (nieistotne).

Codzienne kopie zapasowe wykonujemy przy użyciu wbudowanej kopii zapasowej systemu Windows na obiektach docelowych iSCSI hostowanych na serwerze QNAP NAS (2x 2 TB RAID1).

Serwery nie mają dużego obciążenia i nigdy nie mieliśmy żadnych problemów. Większość naszych danych jest przechowywana w chmurze (VS Online, SharePoint).

Zastanawiam się jednak, czy rozsądne jest kontynuowanie tej konfiguracji, czy lepiej przejść na profesjonalny sprzęt serwerowy, a mianowicie jedną dużą maszynę.

Więc jakie są pułapki i co mam z nimi zrobić?

Martin Walter
źródło
2
Zastanawiam się jednak, czy rozsądne jest kontynuowanie tej konfiguracji, czy też lepiej przejść na profesjonalny sprzęt serwerowy, a mianowicie jedną dużą maszynę. ” Są to dwa dość różne pytania, jeśli szukasz również wyczerpującej odpowiedzi na to ostatnie pytanie, to może warto pozować osobno. Poza tym, czy możesz wyjaśnić swoją rolę w organizacji? Zakładam, że jesteś odpowiedzialny za infrastrukturę, ale jeśli nie, to oczywiście nie musisz nic robić.
Lilienthal
1
Mogę wymyślić tutaj kilka różnych odpowiedzi, więc określenie podstawowego pytania (czy ta konfiguracja jest w porządku? Czy ten sprzęt jest w porządku? Czy powinniśmy skonsolidować usługi? ...) może pomóc uzyskać bardziej przydatne odpowiedzi.
Lilienthal
@Lilienthal Jestem głównym administratorem firmy. Tak, chcę wiedzieć, czy sprzęt i konfiguracja są prawidłowe.
Martin Walter
Czy konfiguracja jest prawidłowa, jest dość szerokim tematem, ponieważ wiąże się z wieloma czynnikami: Czy masz kopię zapasową offline i / lub poza siedzibą? Czy masz strategię odzyskiwania? Czy przetestowałeś już wspomnianą strategię odzyskiwania? Jakie przestoje możesz znieść? Jaki jest twój budżet i oczekiwany poziom usług? Jak wygląda proces aktualizacji i aktualizacji? Czy twoje systemy i poświadczenia są udokumentowane? Czy rozważałeś czynnik autobusowy? ... To zupełnie inne pytanie niż „kiedy sensowne jest odejście od sprzętu konsumenckiego?”
Lilienthal,
1
@Lilienthal Lol. Uwielbiam to, jak złapałeś się na środku akapitu. Tak właśnie miałem na myśli.
Ryan Babchishin,

Odpowiedzi:

11

Wygląda na to, że używasz już porządnego sprzętu. Co jest z tym nie tak? Nie jest za stary, prawda? Trzymaj swoje rzeczy w gwarancji lub blisko, jeśli nie chcesz czuć się zbytnio zaniepokojony (nie wszyscy podzielają moje zdanie na ten temat).

Jeśli masz konfigurację nadmiarową i dobre kopie zapasowe, masz się całkiem nieźle. Jeden serwer = pojedynczy punkt awarii, bez względu na to, jak dobry jest, sprawiłoby to, że czułbym się niekomfortowo. Można wiele zrobić przy ograniczonym budżecie, podejmując mądre decyzje dotyczące sposobu implementacji oprogramowania / sprzętu / infrastruktury / wsparcia.

Jeśli nie stosujesz środków ostrożności / rzeczy, być może powinieneś się martwić. Jeśli jeden system umrze, czy jego usług już nie ma? Jak to wpłynie na biznes? Jak szybko możesz się zregenerować?

Pułapki? Zależy. Nie podałeś zbyt wielu informacji. Tanie dyski mogą zawieść lub być wolne. Tanie skrzynki mogą się przegrzewać. Tani fani mogą zawieść. Tanie kontrolery SATA / SAS / RAID mogą zepsuć się lub nie działać zgodnie z oczekiwaniami. Tanie zasilacze mogą zginąć, a jeśli nie będą zbędne, pozostawią cię bez prądu. Płyty główne mogą robić dziwne rzeczy. Systemy bez zdalnych konsol (ILO itp.) Mogą być uciążliwe. Tanie karty sieciowe mogą mieć tanie sterowniki lub zepsute. Może wystąpić wiele nieprzewidzianych problemów. Z drugiej strony możesz dostać tanie, jak diabli, rzeczy podstawowe, które działają niesamowicie. Droższe rzeczy mogą być czasem nieprzyjemne.

Widziałem to wszystko, w przyzwoitej * jakości serwerów, serwerów niższej klasy, stacji roboczych i urządzeń klasy konsumenckiej. Produkty z wyższej półki wydają się na dłuższą metę lepiej (dawniej gwarancja). Ale jeśli nie możesz sobie na to pozwolić? A może stać Cię tylko na jeden serwer i nie możesz wdrożyć odpowiedniej redundancji?

Nie ma nic zasadniczo złego w przypadku podwójnych serwerów działających z Xeon, pamięcią ECC i RAID. Chyba że masz z tym problem.

Ryan Babchishin
źródło
Pomocne może być najpierw zdefiniowanie celów (rzeczy, których absolutnie potrzebujesz, rzeczy, które są miłe i które nie przeszkadzają Ci zbytnio) oraz budżetu, a następnie zakup najlepszej jakości spełniającej te kryteria. Poza tym osobiście nie dotknąłbym niczego bez zdalnego zarządzania (IPMI, AMT itp.), Jest to po prostu zbyt wygodne. To samo dotyczy nadmiarowych zasilaczy, szczególnie w przypadku hostów VM, w których zamknięcie jest dość czasochłonne.
user121391,
9

Zakładając, że twoje maszyny wirtualne są nadmiarowe (i jest to testowane jako praca z wyłączonym jednym węzłem), prawdopodobnie jesteś stosunkowo odporny na awarie związane ze sprzętem dzięki posiadaniu dwóch lustrzanych węzłów.

Nie wiedząc więcej, nie polecam zejścia do jednego (nowszego) pudełka, chyba że awaria całego węzła nie stanowi poważnego problemu w Twojej firmie.

To powiedziawszy, pomocne byłoby poznanie dodatkowych szczegółów na temat twojego środowiska ... na przykład, jak długo masz te maszyny, czy są one w specjalnie zbudowanym środowisku (czyste, suche pomieszczenie z szafą i klimatyzacją itp.) . Jak zapewne wiesz, dobrze utrzymany sprzęt trwa dłużej!

Ogólnie rzecz biorąc, korzystanie z mniej „profesjonalnego” sprzętu nie musi być niczym złym, po prostu nie ma takich samych gwarancji lub niezawodności, jak droższy zestaw, a ryzyko to należy porównać z budżetem.

Matt Renner
źródło
2
Dzięki za odpowiedź. Myślę, że mamy serwery od 3 lat. Są w szafie w dedykowanym pomieszczeniu z klimatyzacją. Serwery nie są jednak dublowane. Każdy serwer obsługuje różne maszyny wirtualne, a każdy host zawiera jedną AD.
Martin Walter
W takim przypadku (wygląda na to, że dobrze się nimi opiekujesz), myślę, że możesz bezpiecznie kontynuować tak, jak teraz (zakładając, że AD jest jedyną krytyczną usługą, którą na nich hostujesz). Polecam wdrożenie pewnego rodzaju monitorowania, aby mieć oko na błędy sprzętowe (nie jestem pewien, co jest najbardziej odpowiednie dla systemu Windows w tych dniach) i być może planuję je wymienić lub wymyślić inne rozwiązanie w ciągu najbliższych 2-3 lat
Matt Renner,
4
@MartinWalter Może powinieneś się martwić. Jeden system umiera, jego usług już nie ma. Jak to wpłynie na biznes? Jak szybko możesz się zregenerować?
Ryan Babchishin,
1
@RyanBabchishin To pytanie jest zawsze ważne dla wewnętrznego działu IT. Jednak realistycznie są zawsze kompromisy, a dla firmy, schodzenie na godzinę lub dwie może być dopuszczalne przy tej rzadkiej okazji. Ponadto, jeśli OP ma migawkę / eksport maszyny wirtualnej na urządzenie zewnętrzne, odzyskiwanie jest tak proste, jak zamontowanie tego urządzenia zewnętrznego na drugim uruchomionym urządzeniu i tymczasowe uruchomienie z niego VM. W przypadku AD prawdopodobnie nie spowoduje to żadnych problemów (jeśli wszystko, co obsługuje, to podstawowe rzeczy związane z AD, nic zaawansowanego) poza zmniejszoną wydajnością aż do odzyskania głównego komputera.
SnakeDoc,
1
@ SnakeDoc Dlatego to pytanie ... do niego. O tym. ?
Ryan Babchishin
5

Ponieważ zaplecze pamięci jest w całości flashowane, twój sprzęt jest całkowicie OK na wspomniane obciążenie. Jedyne, co mam obawy dotyczące twojej konfiguracji, to to, że twoje maszyny wirtualne są podzielone i działają na jednym serwerze zamiast być dublowane / synchronizowane między serwerami, szczególnie jeśli są identyczne. Dlatego zdecydowanie zalecam korzystanie z pamięci programowej (wirtualnej sieci SAN), która pozwoli ci połączyć oba serwery w jeden klaster i sprawi, że twoje maszyny wirtualne będą odporne na ewentualne awarie sprzętowe.

Możliwe opcje to HP VSA http://www8.hp.com/us/en/products/storage-software/product-detail.html?oid=5306917 lub EMC Unity VSA https://store.emc.com/us/ Rodzina produktów / EMC-Unity-Products / EMC-Unity-VSA / p / EMC-Unity-Virtual-Storage-Appliance, które jest bezpłatne, ale o ile wiem, nie jest dozwolone do produkcji. Ponieważ używasz funkcji Hyper-V, idealną opcją byłoby skorzystanie z wirtualnej sieci SAN StarWind https://www.starwindsoftware.com/starwind-virtual-san, która działa natywnie na oknach i pozwala bezproblemowo utworzyć w pełni funkcjonalny klaster Microsoft Failover Hyper-V korzystający tylko z bezpośrednio podłączonej pamięci.

Poleciłbym również użycie VEEAM B&R https://www.veeam.com/vm-backup-recovery-replication-software.html, który ma darmową wersję lub Bacula http://blog.bacula.org/ do tworzenia kopii zapasowych maszyn wirtualnych korzystania z natywnej kopii zapasowej systemu Windows 2012 Server, ponieważ wiadomo, że powoduje problemy podczas próby odzyskania maszyn wirtualnych.

Net Runner
źródło
1
Dzięki za radę. Wiem, że tworzenie kopii zapasowych jest czymś, z czym muszę się zmierzyć. Przełączanie awaryjne nie jest w tej chwili możliwe, ponieważ maszyny działają na różnych maszynach wirtualnych i nie mają tyle pamięci RAM, więc nie mogę umieścić wszystkich maszyn wirtualnych na jednym komputerze.
Martin Walter
1
Chciałbym usłyszeć więcej o problemach, które wspomniałeś o przywracaniu maszyn wirtualnych za pomocą Kopii zapasowej systemu Windows 2012 Server
Wandersick,
1
@ wandersick Właściwie to często występujący problem. Kopia zapasowa systemu Windows znana jest z powodowania dziwnych błędów, takich jak 0x8XXXXXXX podczas przywracania, co uniemożliwia przywracanie. Dziwne jest to, że czasami kody błędów nie są nawet googlable :-(
Net Runner
0

W małych wdrożeniach na ogół lepiej jest mieć wiele (co najmniej 2) tańszych maszyn niż jedna droga. Innymi słowy, w małych wdrożeniach lepiej być szerokim niż wysokim. Powodem jest to, że w ten sposób zyskujesz pewną nadmiarowość przy ograniczonym wzroście kosztów. Dwa serwery 3000, - mogą być w stanie zrobić to samo, co jeden serwer 5000, -, ale jeśli drogi serwer zawiedzie, zostaniesz bez kości. Jeśli jeden z tańszych nie powiedzie się, przynajmniej połowa maszyn wirtualnych nadal działa, a prawdopodobnie może również działać na innych, będzie po prostu wolniej.

Powinieneś przyjrzeć się temu, aby nie zarządzać tymi serwerami indywidualnie, ale jakoś je zgrupować. Twoje rozwiązanie do wirtualizacji powinno być w stanie utworzyć klaster pracy awaryjnej, aby nie miało znaczenia, na którym hoście znajduje się maszyna wirtualna, jeśli host umrze, maszyna wirtualna jest migrowana automatycznie. Zmniejsza to również mikro zarządzanie i oznacza, że ​​w przyszłości możesz po prostu dodać nowy serwer, utrzymując działanie starych, dopóki nie będzie to opłacalne. Ta decyzja zwykle sprowadza się do zużycia energii lub ograniczeń miejsca.

Jeśli chcesz się bardziej rozwijać, prawdopodobnie chcesz migrować z pamięci na serwerze do sieci SAN. W ten sposób serwery stają się czystymi węzłami obliczeniowymi, a ich kondycja nie ma tak naprawdę znaczenia dla maszyn wirtualnych.

mzhaase
źródło
Pamiętaj, że dzięki temu rozwiązaniu / ogólnej ścieżce istnieje pewien poziom, który musisz osiągnąć, aby był poprawny. Nadmiarowość można uzyskać także w drogiej maszynie (zasilacze, dyski, kontrolery, procesory graficzne, procesory, karty sieciowe), jednocześnie zmniejszając złożoność zarządzania (aktualizacje oprogramowania dla drugiego hosta, automatyczna organizacja pracy awaryjnej VM, względy ruchu sieciowego, uprawnienia, monitorowanie) trochę. Trudno jednak powiedzieć, co jest lepsze bez twardych liczb.
user121391,
-8

tak długo, jak nie masz żadnych problemów w sieci i systemie zapasowym, możesz kontynuować tę konfigurację, ale w przyszłości lepiej jest mieć Profesjonalny serwer, aby był w 100% ZDROWY.

Shan't Baghdikian
źródło