Jak mogę zmniejszyć potrzebę ręcznej interwencji dzięki zdalnie wdrożonemu Raspberry Pis?

13

Pracuję nad projektem wykorzystującym Raspberry Pis, który zostanie wdrożony w kilku lokalizacjach. Mają specjalny sprzęt podłączony do niego do celów automatyzacji i uruchamiają usługę internetową (którą napisałem), aby uzyskać dostęp do sprzętu. Od czasu do czasu będziemy wdrażać nowe oprogramowanie do Pis - metoda, która zostanie jeszcze ustalona - i jest to duży problem.

Moje pytanie: Czy możesz podać kilka pomysłów lub najlepszych praktyk, aby zmniejszyć potrzebę ręcznej interwencji w przypadku problemów? Zastanawiam się, czy istnieje jakieś rozwiązanie typu watchdog, w którym Pi wykonuje normalny restart w przypadku zawieszenia (być może niemożność zadzwonienia do domu?), A jeśli nadal nie działa, zrestartuje się w bezpiecznej partycji, która może „zadzwoń do domu” w celu znalezienia rozwiązania (wykonaj ponowną instalację lub ponownie uruchom normalny restart, jeśli nastąpiła awaria sieci).

Naprawdę nie jestem pewien, czego dokładnie szukam, tylko sposoby, które zapobiegną nam konieczności dzwonienia lub wysyłania ludzi do ręcznego restartu lub reimage. Wydaje się, że schemat podwójnego partycjonowania może być pomocny, ale może są lepsze pomysły.

BobIsNotMyName
źródło
1
Na początek zajrzyj tutaj raspberrypi.stackexchange.com/questions/1401/…
Steve Robillard
Dzięki .. Patrzyłem na to, ale nie było tam za dużo nowych. Wiem, że korzystanie ze sprzętowego watchdoga pomoże w pewnym stopniu.
BobIsNotMyName

Odpowiedzi:

6

Ta odpowiedź nie jest specyficzna dla Raspberry Pi, ale jest ogólną radą dla zdalnie administrowanych serwerów.

  1. ssh. Korzystanie z bezpiecznej powłoki jest prawie tak samo dobre jak bycie tam.

  2. konsola szeregowa i administracja poza pasmem: jeśli spieprzysz swój interfejs sieciowy, drugi sposób logowania to ratownik. prostym sposobem byłoby uruchomienie Identycznej maszyny do tworzenia kopii zapasowych w trybie gorącej gotowości z parą szeregowych połączeń między nimi, aby każda z nich mogła ponownie załadować drugą.

  3. zdalna kontrola zasilania: wiele centrów danych może zdalnie uszkodzić niedziałające serwery. drogie, ale bardzo miłe.

  4. e-mail: jeśli zainstalujesz nullmailer i logwatch, otrzymasz codzienne raporty o stanie, które pomogą wcześnie wykryć awarie.

  5. uwaga dotycząca rpi: nie przechowuj / var ani / tmp na karcie SD, ponieważ spowoduje to skrócenie żywotności karty SD.

Hildred
źródło