Dlaczego 5 różnych komputerów iMac opracowało uszkodzone partycje OS X, kiedy dyski fizyczne są w porządku?

9

Jestem technologiem dla mojego lokalnego okręgu szkolnego i mamy pewne problemy z naszym iMac Multimedia Lab. W ciągu ostatnich dziewięciu miesięcy 5 z 22 komputerów iMac doznało uszkodzenia systemu plików. Jedynym wyjściem dla tych komputerów było całkowite wymazanie partycji OS X i rozpoczęcie od nowa (z odpowiednim przywróceniem z Time Machine).

Oto lista powodów, dla których wiem, że to uszkodzenie systemu plików:

  • IMac nie uruchomi systemu OS X. Widziałem, jak zatrzymuje się na „pulsowaniu”, pasku postępu lub po prostu logo Apple.

  • Montowanie dysku iMac za pomocą trybu dysku docelowego (uwielbiam tę funkcję) kończy się powodzeniem, ale tylko w przypadku partycji Bootcamp. Nie można zainstalować partycji OS X.

  • Weryfikacja dysku ujawnia, że ​​partycja OS X wymaga naprawy (widziałem nieprawidłowe wpisy rodzeństwa, osierocone dzieci itp.). Próba naprawy dysku kończy się niepowodzeniem. Ta ostatnia próba (zaledwie wczoraj) powiedziała, że ​​drzewa katalogu B nie można odbudować. Powinienem był robić pełniejsze notatki na temat tego, co zostało powiedziane za każdym razem, ale za każdym razem, aż do ostatniego, zakładałem, że było to dziwne wydarzenie jeden na milion. Fuks

  • Próba naprawy lub przebudowania dysków za pomocą Drive Genius 3 również kończy się niepowodzeniem Do tej pory 98% plików użytkownika można odzyskać za pomocą Data Rescue 3 Fizyczny dysk twardy nie wydaje się nie działać (pobieranie plików z dysku nie zawiesza się lub „piłka plażowa” ”, dysk nie pojawia się i nie znika w Narzędziu dyskowym, Finder pozostaje responsywny itp.)

  • Zwykle zaliczam to do serii złych dysków. Tak się złożyło, że był nieszczęśnikiem, który kupił kiepską wersję iMaców, prawda? Tutaj zaczyna się robić ciekawie. Przekazuję ci listę osobliwości:

  • Dyski sprawdzają się równie dobrze za pomocą SMART

  • Pamięć RAM się sprawdza
  • Po usunięciu i ponownym utworzeniu partycji (i ponownej instalacji OS X) wszystkie problemy znikają.
  • Zepsucie nie zdarzyło się dwa razy na tym samym komputerze Mac
  • Bootcamp jest instalowany na tym samym dysku i funkcjach przed, po i podczas uszkodzenia po stronie Mac.
  • Partycja Bootcamp nie miała tego problemu na ŻADNYM z komputerów iMac

Ponadto, aby wykluczyć oczywiste:

  • Nie było żadnych przerw i skoków napięcia

  • Poważnie wątpimy w wirusa, ponieważ awarie pojawiają się gdziekolwiek od jednoczesnego (dwie maszyny zepsuły się w tym samym czasie około miesiąca temu) do kilku miesięcy od siebie. Ponadto dokumenty użytkownika są przywracane po ponownym sformatowaniu, więc można przypuszczać, że gdyby był to złośliwy program, komputer Mac nadal występowałby niepowodzeniem.

  • Maszyny były w strefie klimatyzowanej

  • Nie dotyczy to tego samego użytkownika

  • Czasami problem pojawia się po nieuniknionym twardym wyłączeniu (co zdarza się rzadko). Te maszyny nie są nadmiernie wyłączane w niewłaściwy sposób. Tylko to, czego można się spodziewać po Mac Lab z multimediami pięć dni w tygodniu), innym razem jest to całkowicie poza -niebieski

Często używane oprogramowanie obejmuje:

  • iPhoto
  • iDVD
  • iMovie
  • Safari

Maszyny są również ładowane z Parallels 5, który ładuje partycję Bootcamp do maszyny wirtualnej. Paralele zostały skonfigurowane za pomocą standardowego kreatora, bez konfiguracji dziwnych kul i hacków.

I na koniec specyfikacje:

  • iMac 10,1 (21,5 cala)
  • Napędy podstawowe
  • OS X Snow Leopard (najnowsze aktualizacje)
  • Zapasowa pamięć
  • Dołączony do naszej infrastruktury Active Directory
  • System plików HFS + (bez rozróżniania wielkości liter, domyślny dla OS X Snow Leopard)
  • Brak nadzwyczajnych konserwacji dysków. programy. Drive Genius został załadowany wczoraj po południu (PO odzyskaniu po ostatniej awarii), aby uruchomić weryfikację na wszystkich komputerach iMac, ale nie został wcześniej zainstalowany. Wszystkie komputery Mac, zarówno te, które zawiodły w przeszłości, jak i te, które nigdy nie zawiodły, przeszły błyskawicznie.

TL; DR: partycja OS X uległa uszkodzeniu na pięciu różnych komputerach iMac, ale dyski fizyczne są w porządku. DLACZEGO!?!?!

EightQuarterBit
źródło
Off Topic: 8¼b: Możesz użyć Shift + Enter, aby wprowadzić podział wiersza w polach komentarza. Słyszałem również, że istnieją wtyczki do przeglądarki (skrypty użytkownika?), Które odwracają rolę enter & shift-enter, więc enter wstawi znak podziału wiersza, a shift-enter prześle komentarz.
Jason Salaz,
+1 dobrze udokumentowane pytanie. Czy zastanawiałeś się kiedyś, czy to może być akt ze strony studentów?
W jaki sposób iMac 10,1 mapuje na iMaca {wczesny | środkowy | późny} 20YX, aby łatwiej było patrzeć na sprzętową stronę rzeczy? Jeśli zamienisz #desktopcomputers na jeden z numerów seryjnych, support.apple.com/manuals/#desktopcomputers otrzyma opisową nazwę dla twojego komputera iMac.
bmike

Odpowiedzi:

6

HFS Plus (HFS +) to delikatny i nieco przestarzały system plików. Jeśli google go znajdziesz, znajdziesz wiele raportów o uszkodzeniu systemu plików.

Ponowne uruchomienie bez odmontowania systemu plików jest najlepszym sposobem na jego uszkodzenie. Dzieje się tak, gdy Mac zawiesza się z jakiegoś powodu (w moim przypadku jest to karta graficzna NVIDIA) lub awarie zasilania.

Oto kilka wskazówek, że IMHO powinno zmniejszyć ryzyko uszkodzenia systemu plików:

  1. Gdy system zawiesza się, spróbuj ponownie uruchomić z ssh. Kiedy podsystem graficzny mojego Maca zostanie zwolniony, nadal jest dostępny przez SSH - spróbuj otworzyć połączenie ssh z sieci i uruchom go ponownie. Do tego zadania możesz użyć Pulpitu zdalnego Apple (62 €). Najpierw należy włączyć dostęp ssh.

  2. Rób diskutil verifyVolume /okresowo. Tak, nawet jeśli HFS + jest kronikowanym systemem plików, możliwe jest uszkodzenie. Możesz użyć Apple Remote Desktop, aby uruchomić to na wszystkich komputerach w klasie jednocześnie.

  3. Używaj wielu woluminów. Używanie wielu woluminów powinno zmniejszyć ryzyko korupcji. Podział /z /Users/powinien ułatwić przywracanie (albo / lub / Użytkownicy zostaną uszkodzeni). Zauważ, że prawdopodobnie może to skomplikować sytuację z Bootcamp.

  4. Zamontuj partycje z opcjami, które ograniczają pisanie. Montowanie partycji z noatimeopcją powinno ograniczyć do nich zapisywanie. Domyślnie przy każdym dostępie do pliku znacznik czasu dostępu jest „dotykany”.

  5. Upewnij się, że nie ma żadnych prób montowania partycji HFS + z innych systemów operacyjnych. Czy to możliwe, że ktoś zaczyna dystrybucję Linuksa z USB / DVD i montuje /w trybie RW lub gra z ustawieniami dziennika?

Mam nadzieję, że moja odpowiedź jest pomocna.

PS: korupcja zwykle jest stopniowa, a nie nagła. Istnieje możliwość, że przyczyną tego jest oprogramowanie lub przepływ pracy. Mam na myśli Parallels 5, ale powinno to uszkodzić objętość bootcampa, a nie MacOS. Przeszukanie ich KB nie ujawnia niczego przydatnego.

PPS: jest delikatny, ponieważ nie ma rzeczywistego systemu do naprawy uszkodzenia w pliku. Dziennik rejestruje transfery i próbuje ponownie skopiować dane, aby przywrócić system plików do spójnego stanu, ale jeśli utracony plik jest niezbędny (podobnie jak rzeczywiste dane struktury systemu plików), nie ma możliwości skorzystania z niego. W rzeczywistości, ponieważ plik katalogu (który zawiera wszystkie informacje o danych logicznych) jest przechowywany jako plik, jeśli zostanie uszkodzony w niektórych miejscach, cały system plików stanie się bezużytecznymi danymi śmieci lub częściowo wyrzucony śmieci w przypadku jego uszkodzenia i następuje powtórzenie dziennika, co powoduje jego restrukturyzację systemu plików w sposób niezgodny z danymi (np. plik aib ma odpowiednio 1 MB i 2 MB, ale powtórka zmienia je na 2 MB i 1 MB, co skutkuje połową zawartości B jest w środku A).

mspasov
źródło
2
Każdy system plików będzie miał problemy z uwzględnieniem okoliczności. Ale „Kruche” i „Trochę przestarzałe”? Naprawdę? Nieco przestarzałe w mojej opinii nie ma Journaling. I tak nie jest w przypadku HFS +.
Jason Salaz,
Gdyby system plików był delikatny, czy wszystkie komputery Mac miałyby problemy? Instalacje z setkami komputerów Mac, które kontrolują nagłe odłączenie zasilania i ciągły harmonogram bezpiecznych rozruchów, naprawy systemu plików zatrzymają tego rodzaju problemy w zarodku.
bmike
+1 dla HFS Plus (HFS +) to delikatny system plików. Dokładnie taki scenariusz miałem z dwoma dyskami twardymi. Nie ma to wpływu na system Windows, nie można naprawić systemu plików HFS +. Odtwarzanie partycji i ponowna instalacja systemu OS X działa dobrze
Clint Good
2

Rzeczy, które mogłyby to zrobić z mojej głowy ...

powiedziałeś, że nie miałeś skoków napięcia lub przerw w dostawie prądu. Jak to potwierdzasz? Mieliśmy salę lekcyjną, w której zasilacze do komputerów zdawały się wybuchać przypadkowo. Musieliśmy zlecić personelowi konserwacyjnemu podłączenie miernika monitorującego do obwodu i stwierdziliśmy, że gniazdko ma ogromne skoki napięcia.

Pamięć nie jest prawidłowo osadzona i powoduje uszkodzenie danych.

Poluzuj kable.

marginalne dyski twarde, które mają zły zestaw sektorów, ale nie są wystarczająco złe, aby uruchamiać alerty lub skanować w poszukiwaniu uszkodzonych sektorów.

Coś po stronie systemu Windows za pośrednictwem bootcamp modyfikuje dysk w sposób, który go nie lubi. Ochrona przed kopiowaniem? Narzędzia napędowe?

Powiedziałeś, że jest w laboratorium. Co prowadzą uczniowie? Czy monitorujesz lub blokujesz to, co można wykonać, co może to robić?

Powiedziałeś, że to wydaje się przypadkowe, nie ma dwóch maszyn, które mają to miejsce z rzędu. Doprowadziłoby mnie to do podejrzeń, że przyczyną jest albo uczeń, albo grupa uczniów, lub przyczyną tego jest przypadkowy problem z zasilaniem w laboratorium. Czy istnieje sposób śledzenia, kto ostatnio używał maszyn, aby sprawdzić, czy ten problem magicznie podąża za jednym z Twoich użytkowników?

Bart Silverstrim
źródło
Nie korzystaliśmy z żadnego sprzętu do monitorowania mocy, nie. Po prostu wyłączam raport nauczycieli w liceum na ten temat. edytuj GAH! Uwaga do siebie: klawisz Enter nie tworzy nowej linii w trybie komentarza.
EightQuarterBit
Może chcę tego spróbować. Nic nie wskazywało na taki problem w klasie, ale dyrektor IT był inżynierem elektrotechniki na studiach i kazał im to sprawdzić. Zrobił matematykę i stwierdził, że mieli okresowe skoki tysięcy woltów ...
Bart Silverstrim
Zrobiliśmy test pamięci RAM na każdym komputerze, który miał ten problem, wszystkie przeszły pomyślnie. Można by pomyśleć, że gdyby kable napędowe były luźne, problem pojawiłby się kilka razy na tej samej maszynie na tym samym komputerze iMac, a nie na wielu komputerach iMac. Ponadto, jeśli był to luźny kabel napędu, to dziwne, że nie wystąpił na partycjach Bootcamp.
EightQuarterBit
Możliwe, że dyski są naprawdę marginalne, ale trudno mi je kupić. Sprawdziłem, ponownie sprawdziłem i potroiłem te dyski. Użyłem narzędzia dyskowego Apple oraz Drive Genius 3 do skanowania smarka z dysków. Ponadto, nigdy nie widziałem napędu marginalnego bez przynajmniej kilku wskaźników w SMART. Widziałem „złe” dyski twarde, które przeszły SMART, ale nadal miały dużą liczbę przeniesionych sektorów i co więcej, gdy korzystałem z narzędzia SMART. Te dyski? Nada.
EightQuarterBit
Myślałem o tym, że Windows wkręca się z partycją Mac i nadal nie wykluczam. Jednak fakt, że sterownik bootcamp firmy Apple montuje TYLKO partycje HFS + jako tylko do odczytu, wydaje się temu wykluczać. Nie używamy żadnych narzędzi dyskowych ani narzędzi typu „głębokie zamrożenie” po stronie Windows.
EightQuarterBit
1

Czy rozważałeś okresową kontrolę maszyn? Możesz łatwo zaplanować cotygodniowe przepustki weryfikacyjne fsck (dopóki nie dowiesz się, dlaczego dochodzi do korupcji), a następnie co miesiąc, aby śledzić różne rzeczy.

W przypadku systemu plików z kronikowaniem system Mac musi kilkakrotnie źle traktować się do momentu, w którym nie uruchamia się. Nawet złe oprogramowanie nie pisze po stronie rozruchowej, więc podejrzewam, że coś jest nie tak. Na komputerach Mac, które są automatycznie zamykane i zwracają uwagę za każdym razem, gdy drobne błędy systemu plików są naprawiane (za każdym razem, gdy komputer Mac uruchamia się ponownie i fsck nie działa w trybie preen, jest to oznaka problemów na horyzoncie).

Dzięki wdrożeniu 25 macs możesz łatwo poświęcić trochę czasu na proaktywne sprawdzanie systemu plików i sprawdzanie, które nie wyłączają się czysto, konfigurując serwer syslog lub inny scentralizowany system kontroli.

bmike
źródło
0

Rozważałbym aktywność studentów. Jeśli korzystasz z bootcampa i OS X, założę się, że uczniowie rozbijają stronę Maca, aby uruchomić boot camp, ponieważ nie są cierpliwi. Może się tak zdarzyć również w przypadku blokady ekranu.

Sugeruję:

  1. Usuń obóz rekrutacyjny. Zamiast tego uruchom maszynę wirtualną pod Parallels lub Virtual Box. (Przekonałem się, że Windows XP pod VirtualBox działa całkiem dobrze.) Skonfiguruj to, aby maszyna wirtualna była niezmienna i przechowywana lokalnie na starej partycji bootcamp. Zapobiegnie to przekręcaniu się przez dzieci przy instalacji systemu Windows. Przekieruj ich katalog domowy, aby odczytać katalog domowy Mac na twoim serwerze. (Jest to PITA, którą należy skonfigurować za pierwszym razem, ponieważ obejmuje ona około zillion regedits)

  2. Ustal jakąś formę monitorowania logowania, abyś wiedział, którzy uczniowie korzystali z których maszyn. Ma to tę zaletę, że można zauważyć, że to samo dziecko loguje się na wielu komputerach, zwykle robiąc to jako przysługę dla kogoś, kto został zbanowany. Ustawiłem, że kiedy to samo logowanie było na dwóch komputerach, oba komputery zostały ponownie uruchomione.

Sherwood
źródło