Powiedzmy, że próbuję ustalić prawdopodobieństwo, że ulubionym smakiem lodów jest wanilia.
Wiem, że ta osoba lubi też horrory.
Chcę ustalić prawdopodobieństwo, że ulubionymi lodami tej osoby są wanilia, ponieważ lubią horrory.
Wiem następujące rzeczy:
- ludzi wybiera wanilię jako swój ulubiony smak lodów. (To jest moje )
- ludzi, których ulubionymi są lody waniliowe, uwielbia także horrory. (To jest mój )
- ludzi, których ulubionymi nie są lody waniliowe, uwielbia także horrory (To jest mój )
to w ten sposób: Uważam, że (w zaokrągleniu do najbliższej dziesięciotysięcznej). Istnieje szans, że ulubionym smakiem lodów fanów horroru jest wanilia.
Ale potem dowiaduję się, że ta osoba widziała horror w ciągu ostatnich 30 dni. Oto co wiem:
- to zaktualizowane prawdopodobieństwo tylnego prawdopodobieństwa, że wanilia jest ulubionym smakiem lodów - w następnym problemie.
- osób, których ulubionymi są lody waniliowe, widziało horror w ciągu ostatnich 30 dni.
- osób, których ulubionymi nie są lody waniliowe, widziało horror w ciągu ostatnich 30 dni.
Daje to: po zaokrągleniu.
Więc teraz uważam, że istnieje szans, że fan horrorów uwielbia lody, biorąc pod uwagę, że widzieli horror w ciągu ostatnich 30 dni.
Ale czekaj, jest jeszcze jedna rzecz. Dowiedziałem się również, że ta osoba ma kota.
Oto co wiem:
- to zaktualizowane prawdopodobieństwo tylnego prawdopodobieństwa, że wanilia jest ulubionym smakiem lodów - w następnym problemie
- osób, które lubią lody waniliowe, ma także koty
- ludzi, których ulubionymi lodami waniliowymi nie są, także ma koty
Daje to: po zaokrągleniu.
Moje pytanie w zasadzie sprowadza się do tego: czy poprawnie aktualizuję prawdopodobieństwo za pomocą twierdzenia Bayesa? Czy w moich metodach robię coś jeszcze nie tak?
źródło
Odpowiedzi:
To nie jest poprawne Sekwencyjna aktualizacja tego typu działa tylko wtedy, gdy informacje, które otrzymujesz sekwencyjnie, są niezależne (np. Obserwacje zmiennej losowej). Jeśli każda obserwacja nie jest niezależna, jak w tym przypadku, należy rozważyć wspólny rozkład prawdopodobieństwa. Prawidłowy sposób aktualizacji to powrót do przeszłości, znalezienie wspólnego prawdopodobieństwa, że ktoś kocha horrory, widział horror w ciągu ostatnich 30 dni i jest właścicielem kota, biorąc pod uwagę, że wybiera wanilię lub nie ulubiony smak lodów, a następnie aktualizuj w jednym kroku.
Aktualizowanie sekwencyjne w ten sposób, gdy dane nie są niezależne, gwałtownie zwiększy twoje prawdopodobieństwo tylne znacznie wyższe lub niższe niż powinno być.
źródło