Artykuł The Odds, Continually Updated wspomina historię rybaka z Long Island, który dosłownie zawdzięcza swoje życie Bayesian Statistics. Oto krótka wersja:
W środku nocy na łodzi jest dwóch rybaków. Podczas gdy jeden śpi, drugi wpada do oceanu. Łódź cały czas trolluje autopilotem przez całą noc, aż pierwszy facet w końcu się obudzi i powiadomi Straż Przybrzeżną. Coast Guard używa oprogramowania o nazwie SAROPS (Search and Rescue Optimal Planning System), aby znaleźć go w samą porę, ponieważ był hipotermiczny i prawie nie miał energii, aby pozostać na powierzchni.
Oto długa wersja: A Speck In The Sea
Chciałem dowiedzieć się więcej o tym, jak faktycznie stosuje się tutaj twierdzenie Bayesa. Dość sporo dowiedziałem się o oprogramowaniu SAROPS, po prostu google.
Symulator SAROPS
Komponent symulatora uwzględnia aktualne dane, takie jak prąd oceaniczny, wiatr itp., I symuluje tysiące możliwych ścieżek dryfu. Z tych ścieżek dryfu tworzona jest mapa rozkładu prawdopodobieństwa.
Zwróć uwagę, że poniższe grafiki nie odnoszą się do przypadku zaginionego rybaka, o którym wspomniałem powyżej, ale są zabawkowym przykładem zaczerpniętym z tej prezentacji
Mapa prawdopodobieństwa 1 (kolor czerwony oznacza najwyższe prawdopodobieństwo; kolor niebieski najniższy)
Zwróć uwagę na koło, które jest początkową lokalizacją.
Mapa prawdopodobieństwa 2 - Minęło więcej czasu
Zauważ, że mapa prawdopodobieństwa stała się multimodalna. Jest tak, ponieważ w tym przykładzie uwzględniono wiele scenariuszy:
- Osoba unosi się w wodzie - tryb góra-środek
- Osoba jest w tratwie ratunkowej (bardziej dotknięta wiatrem z północy) - dolne 2 tryby (podzielone z powodu „efektów jibing”)
Mapa prawdopodobieństwa 3 - Wyszukiwanie zostało przeprowadzone wzdłuż prostokątnych ścieżek w kolorze czerwonym. Zdjęcie przedstawia optymalne ścieżki utworzone przez planistę (inny element SAROPS). Jak widać, ścieżki te zostały przeszukane, a mapa prawdopodobieństwa została zaktualizowana przez symulator.
Być może zastanawiasz się, dlaczego przeszukane obszary nie zostały zredukowane do zera. Wynika to z faktu, że istnieje prawdopodobieństwo niepowodzenia, , uwzględnione, to znaczy, że istnieje znacząca szansa, że poszukiwacz przeoczy osobę w wodzie. Zrozumiałe jest, że prawdopodobieństwo awarii jest o wiele wyższe dla samotnej osoby na wodzie niż dla osoby na tratwie ratunkowej (łatwiej ją zobaczyć), dlatego prawdopodobieństwo w górnej części nie spadło zbytnio.
Skutki nieudanego wyszukiwania
Właśnie tutaj pojawia się twierdzenie Bayesa. Po przeprowadzeniu wyszukiwania mapa prawdopodobieństwa jest odpowiednio aktualizowana, dzięki czemu można optymalnie zaplanować kolejne wyszukiwanie.
Po przejrzeniu Twierdzenia Bayesa na wikipedii oraz w artykule Intuicyjne (i krótkie) objaśnienie Twierdzenia Bayesa na BetterExplained.com
Wziąłem równanie Bayesa:
I zdefiniował A i X w następujący sposób ...
Zdarzenie A: Osoba znajduje się w tym obszarze (komórka siatki)
Test X: nieudane wyszukiwanie w tym obszarze (komórka siatki), tzn. Przeszukano ten obszar i nic nie widziałem
Wydajność,
Odkryłem w Search and Rescue Optimal Planning System, że SAROPS oblicza prawdopodobieństwo nieudanego wyszukiwania , biorąc pod uwagę ścieżki wyszukiwania i symulowane ścieżki dryfu. Dla uproszczenia załóżmy, że wiemy, jaka jest wartość .P ( fail )
Więc teraz mamy
Czy równanie Bayesa jest tutaj stosowane poprawnie?
Jak obliczyć mianownik, prawdopodobieństwo nieudanego poszukiwania?
Również w Search and Rescue Optymalny system planowania , mówią
Wcześniejsze prawdopodobieństwa są „normalizowane w zwykły sposób bayesowski” w celu uzyskania prawdopodobieństw późniejszych
Co oznacza „znormalizowany w normalny sposób bayesowski” ?
Czy to oznacza, że wszystkie prawdopodobieństwa są podzielone przez , czy po prostu znormalizowane, aby cała mapa prawdopodobieństwa sumowała się do jednego? Czy te są takie same?
Wreszcie, jaki byłby właściwy sposób normalizacji siatki prawdopodobieństwa po siatce po zaktualizowaniu pod kątem nieudanego wyszukiwania, biorąc pod uwagę, że ponieważ nie przeszukiwałeś WSZYSTKICH obszarów (komórek siatki), miałbyś niektóre komórki równe i niektóre równe ?
Jeszcze jedna uwaga dotycząca uproszczenia - według systemu optymalnego planowania Search and Rescue rozkład tylny jest w rzeczywistości obliczany przez aktualizację prawdopodobieństw symulowanych ścieżek dryftu, a następnie NAWRACANIE siatkowej mapy prawdopodobieństwa. Aby uprościć ten przykład, postanowiłem zignorować ścieżki SIM i skupić się na komórkach siatki.
Dawny profesor, który był pilotem helikoptera i faktycznie przeprowadził misje poszukiwawczo-ratownicze, wskazał mi książkę, w której cały rozdział poświęcony jest mojemu pytaniu - Analiza operacji morskich.
W rozdziale 8 podano przykład taki (nieco go dostosowałem):
Na początek istnieje siatka wcześniejszej dystrybucji dla lokalizacji zaginionych osób, łodzi itp.
Wcześniejsza dystrybucja:
Wyszukiwanie jest przeprowadzane na części siatki, a prawdopodobieństwa są aktualizowane znormalizowanym rozkładem bocznym , stosując równanie Bayesa w taki sam sposób, jak wspomniałem w moich pytaniach:
gdzie (i, j) = (lat, long)
W tym przypadku postanowiłem przeszukać kolumnę 3, ponieważ ta kolumna miała największe wcześniejsze prawdopodobieństwo.
Znormalizowany rozkład boczny po przeszukaniu trzeciej kolumny w / pFail = 0,2:
Moje pytanie dotyczyło głównie sposobu normalizacji tylnej części ciała. Oto, jak to zostało zrobione w książce - po prostu podziel każde prawdopodobieństwo tylne przez sumę całkowitą , S :
Wybrałem 0,2 prawdopodobieństwo nieudanego wyszukiwania, ponieważ mój profesor powiedział: „Szukamy tylko 80% prawdopodobieństwa wykrycia, ponieważ jest to zwykle najlepszy kompromis między terminowością a dokładnością”.
Tylko dla kopnięć, uruchomiłem inny przykład z pFail 0,5. Podczas gdy w pierwszym przykładzie ( pFail = 0,2), następną najlepszą trasą wyszukiwania (biorąc pod uwagę znormalizowane wyszukiwanie tylne i przy założeniu przeszukiwania w linii prostej, bez przekątnej lub zygzakowatości) byłoby przelecieć nad kolumną 2, w drugim przykładzie ( pFail = 0,5) następna najlepsza trasa jest powyżej rzędu 2.
Znormalizowany rozkład boczny po przeszukaniu trzeciej kolumny w / pFail = 0,5:
Dodał także: „Samolot ma przy sobie małą listę kontrolną, która pomaga określić najlepszą wysokość i prędkość lotu. Praca w latającym helikopterze jest jak siedzenie na pralce i czytanie książki przyklejonej kanałem do innej pralki”.
źródło