Nic nie wiedząc o dyskach twardych, zastanawiam się, w jaki sposób dostawca usług w chmurze monitoruje dyski twarde pod kątem problemów (uszkodzenie danych, utrata danych, awaria dysku twardego itp.). Wyszukiwanie w Google nie ujawnia niczego poza „pobierz zestaw naprawczy producenta dysku twardego i naciśnij przycisk naprawy”. Chciałbym wiedzieć, co dzieje się w tym procesie naprawy, a jeszcze lepiej, w jaki sposób dostawca chmury regularnie monitoruje dyski twarde pod kątem jakości. Czytałem gdzieś, że BackBlaze dokonuje codziennej analizy statystyk SMART , aby zobaczyć, jak radzą sobie ich dyski twarde, ale nie jestem pewien, co to znaczy.
Używamy Smartmontools do przechwytywania danych SMART.
Repozytorium jest tutaj , ale chciałbym wiedzieć, co robi ten Smartmontools. Niekoniecznie szczegółowo, ale krótki zarys. Naprawdę nie mogę powiedzieć z repozytorium, co robi.
To, co wyobrażam sobie, by się wydarzyło (aby monitorować dysk twardy), to. Utwórz bazę danych z skrótami MD5 każdego pliku. Okresowo skanuj cały dysk twardy i wykonaj sumę kontrolną dla każdego pliku względem zapisanego skrótu MD5. Ale wydaje się, że byłoby to bardzo wolne, szczególnie na dyskach twardych terabajtów. Nie jestem do końca pewien, jakie rodzaje awarii możesz mieć i jakie powiadomienia możesz otrzymać. Może możesz użyć zdarzeń systemu plików, ale nie jestem pewien, jak to działałoby na dysku zewnętrznym, a nie na komputerze głównym. Ale nawet jeśli zadziałało na zewnętrznym dysku twardym, nie jestem pewien, czy zostanie powiadomiony, gdy dane zostaną uszkodzone z powodu starzenia się urządzenia. Wydaje się więc, że jedynym sposobem na sprawdzenie poprawności danych jest porównanie aktualnych danych ze starymi danymi. Ale poza sumą kontrolną nie jestem do końca pewien, jaki skuteczny sposób to zrobić.
Najważniejszą rzeczą, jakiej chciałbyś w procesie monitorowania, jest wiedzieć, kiedy dysk również nie działa, więc możesz przygotować się na jego zmianę. Naprawianie dysku to zupełnie inna sprawa, której nie wiem, jak to działa, ale nie będę o to pytać. Chciałbym tylko wiedzieć, w jaki sposób zazwyczaj monitorujesz zewnętrzny dysk twardy i skąd wiesz, kiedy zaczyna on działać nieprawidłowo (tj. Skąd wiesz, czy dane zostały uszkodzone / utracone w wydajny sposób i takie tam) .
To wydaje się zawierać pewne informacje.
Zamiast po prostu znać „po prostu zastosuj technologię x”, chciałbym wiedzieć, jak ją zaimplementować jako aplikację lub coś takiego, przynajmniej podstawy na początek.
Odpowiedzi:
„Zastanawiam się, jak dostawca usług w chmurze monitoruje dyski twarde pod kątem problemów”
Nie bardzo. Napędy zwykle zawodzą nagle. Odpowiedzią jest zbudowanie systemów, które przetrwają awarie. Duże usługi chmurowe wykorzystują ogromne klastry serwerów, w wielu budynkach, mają serwery, które używają lustrzanych macierzy RAID (które przechowują dane nadmiarowo) oraz serwery, które odzwierciedlają inne serwery.
Nadmiarowe lokalizacje, nadmiarowe serwery, nadmiarowe dyski na serwerach.
Google opublikowało badania na temat częstości awarii dysków itp. I zasadniczo: SMART jest głównie bezużyteczny, a awarie dysków gwałtownie wzrosły po około 3 latach.
Zdobądź drugi dysk w miksie, skopiuj je (robocopy (część systemu Windows) to świetny wybór dla konsumentów) i wymieniaj je co trzy lata. Jeśli możesz uzyskać kopię swoich danych poza witryną, zrób to.
Naprawianie dysków jest dobre tylko w celu uzyskania z nich rzeczy, dla których nie masz kopii zapasowych. Nie możesz już im ufać i powinni zostać porzuceni. Jeśli masz kopię lustrzaną, po prostu zastąp uszkodzony dysk lustrzany istniejącymi danymi i przejdź dalej.
Używam urządzenia o niskiej mocy jako serwera w mojej sieci LAN z dwoma pasującymi dyskami zewnętrznymi (szukam czegoś dużego za około 100 USD). Pcham kopie zapasowe na dysk serwera, a serwer planuje rutynową operację dublowania w celu zduplikowania kopii zapasowej na inny dysk. Od czasu do czasu obrazuję również moje ważne maszyny, aby w razie potrzeby móc odzyskać instalację systemu operacyjnego.
Wymieniam dyski zewnętrzne co kilka lat i zwykle kończę wyjmowanie dysku z obudowy i używanie go do masowego przechowywania niekrytycznych danych, np. Gier na jednym z moich głównych komputerów do następnej rundy.
źródło