Mam serwer z uruchomionym VMware ESXi v4.1.0 348481. Ma sprzętowy RAID10 i dysk zapasowy SATA. Mam uruchomioną maszynę wirtualną, która ma swój podstawowy plik startowy vmdk w magazynie danych RAID10 i 600 GB vmdk w magazynie danych dysku zapasowego SATA. VM uruchamia system Linux Debian z jądrem FreeBSD i używa ZFS jako napędu kopii zapasowej.
EDYCJA: Dysk nie jest bezpośrednio podłączony do maszyny wirtualnej. Jest on używany jako magazyn danych VMware, a maszyna wirtualna ma vmdk w magazynie danych napędu SATA. Magazyn danych nie jest pełny (tylko 65%)
Zalogowałem się na serwerze przy użyciu protokołu SSH i stwierdziłem, że kopia zapasowa zeszłej nocy została zawieszona i / zfs list
lub zpool list
obie. Więc otworzyłem wirtualną konsolę w ESXi i przykro mi było widzieć:
(da1:mpt0:0:1:0): READ(10). CDC: 28 0 19 97 3a 50 0 0 2d 0
(da1:mpt0:0:1:0): CAM status: SCSI Status Error
(da1:mpt0:0:1:0): SCSI status: Check Condition
(da1:mpt0:0:1:0): SCSI sense: MEDIUM ERROR info:4862ec asc:11,4 (Unrecovered read error - auto reallocate failed)
(da1:mpt0:0:1:0): READ(10). CDC: 28 0 19 97 3a 50 0 0 2d 0
(da1:mpt0:0:1:0): CAM status: SCSI Status Error
(da1:mpt0:0:1:0): SCSI status: Check Condition
(da1:mpt0:0:1:0): SCSI sense: MEDIUM ERROR info:4862ec asc:11,4 (Unrecovered read error - auto reallocate failed)
Próbowałem zrestartować maszynę wirtualną i otrzymałem komunikat, że system jest wyłączany w celu ponownego uruchomienia, a następnie zawiesił się. (^ C pojawia się, ale nie zabija shutdown
). I nie może przerwać lub lub procesy - Nic się nie dzieje, gdy próbuję.kill -9
zpool list
zfs list
rsync
- Czy to wskazuje na awarię dysku SATA? Czy może to być po prostu błąd ESXi?
- Jak w kliencie vSphere mogę stwierdzić, czy dysk nie działa? Nie widziałem żadnych oznak, wszystko w stanie kondycji sprzętu wygląda dobrze i nic nie widziałem w konfiguracji pamięci.
- Jak mam stąd postępować? Czy powinienem po prostu mocno zrestartować maszynę wirtualną?
AKTUALIZACJA: Właśnie ponownie uruchomiłem maszynę wirtualną. Po powrocie online zapasowy zpool był jednak online:
root@timestandstill:/home/jnet# zpool status -v
pool: backup
state: ONLINE
status: One or more devices has experienced an error resulting in data
corruption. Applications may be affected.
action: Restore the file in question if possible. Otherwise restore the
entire pool from backup.
see: http://www.sun.com/msg/ZFS-8000-8A
scrub: none requested
config:
NAME STATE READ WRITE CKSUM
backup ONLINE 0 0 0
da1 ONLINE 0 0 0
errors: Permanent errors have been detected in the following files:
/backups/someserver/home/someuser/public_html/somedir/calendar/someuser/calendars/somefile.ics
Opieram się mocno na wymianie napędu ...