Jak zastosować twierdzenie Bayesa do poszukiwań rybaka zagubionego na morzu

19

Artykuł The Odds, Continually Updated wspomina historię rybaka z Long Island, który dosłownie zawdzięcza swoje życie Bayesian Statistics. Oto krótka wersja:

W środku nocy na łodzi jest dwóch rybaków. Podczas gdy jeden śpi, drugi wpada do oceanu. Łódź cały czas trolluje autopilotem przez całą noc, aż pierwszy facet w końcu się obudzi i powiadomi Straż Przybrzeżną. Coast Guard używa oprogramowania o nazwie SAROPS (Search and Rescue Optimal Planning System), aby znaleźć go w samą porę, ponieważ był hipotermiczny i prawie nie miał energii, aby pozostać na powierzchni.

Oto długa wersja: A Speck In The Sea

Chciałem dowiedzieć się więcej o tym, jak faktycznie stosuje się tutaj twierdzenie Bayesa. Dość sporo dowiedziałem się o oprogramowaniu SAROPS, po prostu google.

Symulator SAROPS

Komponent symulatora uwzględnia aktualne dane, takie jak prąd oceaniczny, wiatr itp., I symuluje tysiące możliwych ścieżek dryfu. Z tych ścieżek dryfu tworzona jest mapa rozkładu prawdopodobieństwa.

Zwróć uwagę, że poniższe grafiki nie odnoszą się do przypadku zaginionego rybaka, o którym wspomniałem powyżej, ale są zabawkowym przykładem zaczerpniętym z tej prezentacji

Mapa prawdopodobieństwa 1 (kolor czerwony oznacza najwyższe prawdopodobieństwo; kolor niebieski najniższy) wprowadź opis zdjęcia tutaj

Zwróć uwagę na koło, które jest początkową lokalizacją.

Mapa prawdopodobieństwa 2 - Minęło więcej czasu wprowadź opis zdjęcia tutaj

Zauważ, że mapa prawdopodobieństwa stała się multimodalna. Jest tak, ponieważ w tym przykładzie uwzględniono wiele scenariuszy:

  1. Osoba unosi się w wodzie - tryb góra-środek
  2. Osoba jest w tratwie ratunkowej (bardziej dotknięta wiatrem z północy) - dolne 2 tryby (podzielone z powodu „efektów jibing”)

Mapa prawdopodobieństwa 3 - Wyszukiwanie zostało przeprowadzone wzdłuż prostokątnych ścieżek w kolorze czerwonym. wprowadź opis zdjęcia tutaj Zdjęcie przedstawia optymalne ścieżki utworzone przez planistę (inny element SAROPS). Jak widać, ścieżki te zostały przeszukane, a mapa prawdopodobieństwa została zaktualizowana przez symulator.

Być może zastanawiasz się, dlaczego przeszukane obszary nie zostały zredukowane do zera. Wynika to z faktu, że istnieje prawdopodobieństwo niepowodzenia, , uwzględnione, to znaczy, że istnieje znacząca szansa, że ​​poszukiwacz przeoczy osobę w wodzie. Zrozumiałe jest, że prawdopodobieństwo awarii jest o wiele wyższe dla samotnej osoby na wodzie niż dla osoby na tratwie ratunkowej (łatwiej ją zobaczyć), dlatego prawdopodobieństwo w górnej części nie spadło zbytnio.p(fail)

Skutki nieudanego wyszukiwania

Właśnie tutaj pojawia się twierdzenie Bayesa. Po przeprowadzeniu wyszukiwania mapa prawdopodobieństwa jest odpowiednio aktualizowana, dzięki czemu można optymalnie zaplanować kolejne wyszukiwanie.

Po przejrzeniu Twierdzenia Bayesa na wikipedii oraz w artykule Intuicyjne (i krótkie) objaśnienie Twierdzenia Bayesa na BetterExplained.com

Wziąłem równanie Bayesa:

P(AX)=P(XA)×P(A)P(X)

I zdefiniował A i X w następujący sposób ...

  • Zdarzenie A: Osoba znajduje się w tym obszarze (komórka siatki)

  • Test X: nieudane wyszukiwanie w tym obszarze (komórka siatki), tzn. Przeszukano ten obszar i nic nie widziałem

Wydajność,

P(person thereunsuccessful)=P(unsuccessfulperson there)×P(person there)P(unsuccessful)

Odkryłem w Search and Rescue Optimal Planning System, że SAROPS oblicza prawdopodobieństwo nieudanego wyszukiwania , biorąc pod uwagę ścieżki wyszukiwania i symulowane ścieżki dryfu. Dla uproszczenia załóżmy, że wiemy, jaka jest wartość .P ( fail )P(fail)P(fail)

Więc teraz mamy

P(person thereunsuccessful)=P(fail)×P(person there)P(unsuccessful)
  1. Czy równanie Bayesa jest tutaj stosowane poprawnie?

  2. Jak obliczyć mianownik, prawdopodobieństwo nieudanego poszukiwania?

    Również w Search and Rescue Optymalny system planowania , mówią

    Wcześniejsze prawdopodobieństwa są „normalizowane w zwykły sposób bayesowski” w celu uzyskania prawdopodobieństw późniejszych

  3. Co oznacza „znormalizowany w normalny sposób bayesowski” ?

    Czy to oznacza, że ​​wszystkie prawdopodobieństwa są podzielone przez , czy po prostu znormalizowane, aby cała mapa prawdopodobieństwa sumowała się do jednego? Czy te są takie same?P(unsuccessful)

  4. Wreszcie, jaki byłby właściwy sposób normalizacji siatki prawdopodobieństwa po siatce po zaktualizowaniu pod kątem nieudanego wyszukiwania, biorąc pod uwagę, że ponieważ nie przeszukiwałeś WSZYSTKICH obszarów (komórek siatki), miałbyś niektóre komórki równe i niektóre równe ?P(person there)P(person thereunsuccessful)

Jeszcze jedna uwaga dotycząca uproszczenia - według systemu optymalnego planowania Search and Rescue rozkład tylny jest w rzeczywistości obliczany przez aktualizację prawdopodobieństw symulowanych ścieżek dryftu, a następnie NAWRACANIE siatkowej mapy prawdopodobieństwa. Aby uprościć ten przykład, postanowiłem zignorować ścieżki SIM i skupić się na komórkach siatki.

Mlai
źródło

Odpowiedzi:

6
  1. Zakładając niezależność między komórkami siatki, to tak, wydaje się, że Twierdzenie Bayesa zostało właściwie zastosowane.
  2. P(X)=P(X|A)P(A)+P(X|Ac)P(Ac)
    AcAP(X|Ac)=1
  3. P(A|X)
    P(A|X)P(X|A)P(A)P(Ac|X),P(X|Ac)P(Ac), and P(A|X)+P(Ac|X)=1
    P(X)
  4. iAiiXiiX

    • iP(Ai|X)=1
    • P(Ai|X)=P(Ai|Xi)P(Xi|Ai)P(Ai)P(Ai|X)P(Ai)P(Ai|X)

    P(Ai|X)

jaradniemi
źródło
iP(Ai|X)=1P.(X|ZA)P.(ZA)jaP.(X|ZA)P.(ZAja)
Właśnie zdałem sobie sprawę, że przeszukanie każdej komórki ze stałym prawdopodobieństwem awarii nie spowoduje absolutnie żadnej zmiany w rozkładzie prawdopodobieństwa :)
mlai
P.(X|ZA)P.(ZAja)P.(ZAja)
4

Dawny profesor, który był pilotem helikoptera i faktycznie przeprowadził misje poszukiwawczo-ratownicze, wskazał mi książkę, w której cały rozdział poświęcony jest mojemu pytaniu - Analiza operacji morskich.

W rozdziale 8 podano przykład taki (nieco go dostosowałem):

Na początek istnieje siatka wcześniejszej dystrybucji dla lokalizacji zaginionych osób, łodzi itp.

Wcześniejsza dystrybucja: Wcześniejsza dystrybucja

Wyszukiwanie jest przeprowadzane na części siatki, a prawdopodobieństwa są aktualizowane znormalizowanym rozkładem bocznym , stosując równanie Bayesa w taki sam sposób, jak wspomniałem w moich pytaniach:

P(target in (i,j)no detection)=P(no detectiontarget in (i,j))×P(target in (i,j))P(no detection)

gdzie (i, j) = (lat, long)

W tym przypadku postanowiłem przeszukać kolumnę 3, ponieważ ta kolumna miała największe wcześniejsze prawdopodobieństwo.

Znormalizowany rozkład boczny po przeszukaniu trzeciej kolumny w / pFail = 0,2: Znormalizowany rozkład boczny (w / prawdopodobieństwo awarii = 0,2)

Moje pytanie dotyczyło głównie sposobu normalizacji tylnej części ciała. Oto, jak to zostało zrobione w książce - po prostu podziel każde prawdopodobieństwo tylne przez sumę całkowitą , S :

opis obrazu

Wybrałem 0,2 prawdopodobieństwo nieudanego wyszukiwania, ponieważ mój profesor powiedział: „Szukamy tylko 80% prawdopodobieństwa wykrycia, ponieważ jest to zwykle najlepszy kompromis między terminowością a dokładnością”.

Tylko dla kopnięć, uruchomiłem inny przykład z pFail 0,5. Podczas gdy w pierwszym przykładzie ( pFail = 0,2), następną najlepszą trasą wyszukiwania (biorąc pod uwagę znormalizowane wyszukiwanie tylne i przy założeniu przeszukiwania w linii prostej, bez przekątnej lub zygzakowatości) byłoby przelecieć nad kolumną 2, w drugim przykładzie ( pFail = 0,5) następna najlepsza trasa jest powyżej rzędu 2.

Znormalizowany rozkład boczny po przeszukaniu trzeciej kolumny w / pFail = 0,5: eNormalizowany rozkład boczny (w / prawdopodobieństwo awarii = 0,5)

wprowadź opis zdjęcia tutaj

Dodał także: „Samolot ma przy sobie małą listę kontrolną, która pomaga określić najlepszą wysokość i prędkość lotu. Praca w latającym helikopterze jest jak siedzenie na pralce i czytanie książki przyklejonej kanałem do innej pralki”.

Mlai
źródło