Czy to poprawny sposób ciągłego aktualizowania prawdopodobieństwa za pomocą twierdzenia Bayesa?

9

Powiedzmy, że próbuję ustalić prawdopodobieństwo, że ulubionym smakiem lodów jest wanilia.

Wiem, że ta osoba lubi też horrory.

Chcę ustalić prawdopodobieństwo, że ulubionymi lodami tej osoby są wanilia, ponieważ lubią horrory.

Wiem następujące rzeczy:

  1. 5% ludzi wybiera wanilię jako swój ulubiony smak lodów. (To jest moje )P.(ZA)
  2. 10% ludzi, których ulubionymi są lody waniliowe, uwielbia także horrory. (To jest mój )P.(b|ZA)
  3. 1% ludzi, których ulubionymi nie są lody waniliowe, uwielbia także horrory (To jest mój )P.(b|¬ZA)

to w ten sposób: Uważam, że (w zaokrągleniu do najbliższej dziesięciotysięcznej). Istnieje szans, że ulubionym smakiem lodów fanów horroru jest wanilia.

P.(ZA|b)=0,05×0,1(0,05×0,1)+(0,01×(1-0,05))
P.(ZA|b)=0,344834,48%

Ale potem dowiaduję się, że ta osoba widziała horror w ciągu ostatnich 30 dni. Oto co wiem:

  1. 34,48% to zaktualizowane prawdopodobieństwo tylnego prawdopodobieństwa, że ​​wanilia jest ulubionym smakiem lodów - w następnym problemie.P.(ZA)
  2. 20% osób, których ulubionymi są lody waniliowe, widziało horror w ciągu ostatnich 30 dni.
  3. 5% osób, których ulubionymi nie są lody waniliowe, widziało horror w ciągu ostatnich 30 dni.

Daje to: po zaokrągleniu.

0,3448×0.2(0,3448×0.2)+(0,05×(1-0,3448))=0,6779

Więc teraz uważam, że istnieje szans, że fan horrorów uwielbia lody, biorąc pod uwagę, że widzieli horror w ciągu ostatnich 30 dni.67,79%

Ale czekaj, jest jeszcze jedna rzecz. Dowiedziałem się również, że ta osoba ma kota.

Oto co wiem:

  1. 67,79% to zaktualizowane prawdopodobieństwo tylnego prawdopodobieństwa, że ​​wanilia jest ulubionym smakiem lodów - w następnym problemieP.(ZA)
  2. 40% osób, które lubią lody waniliowe, ma także koty
  3. 10% ludzi, których ulubionymi lodami waniliowymi nie są, także ma koty

Daje to: po zaokrągleniu.

0,6779×0,4(0,6779×0,4)+(0,1×(1-0,6779))=0,8938

Moje pytanie w zasadzie sprowadza się do tego: czy poprawnie aktualizuję prawdopodobieństwo za pomocą twierdzenia Bayesa? Czy w moich metodach robię coś jeszcze nie tak?

użytkownik1626730
źródło
1
miłość = ulubiona? nie publikujesz stopni miłości. jeśli to kochasz, to jest twój ulubiony. wyjaśnij w razie potrzeby.
generic_user,
Słuszna uwaga. Zmieniłem słowo „miłość” na „ulubione”. To nie jest poprawne gramatycznie, ale jest mniej nieporadne niż powiedzenie „wybierz wanilię dla swojego ulubionego smaku lodów”. Mam nadzieję, że to wszystko wyjaśni.
user1626730,

Odpowiedzi:

7

To nie jest poprawne Sekwencyjna aktualizacja tego typu działa tylko wtedy, gdy informacje, które otrzymujesz sekwencyjnie, są niezależne (np. Obserwacje zmiennej losowej). Jeśli każda obserwacja nie jest niezależna, jak w tym przypadku, należy rozważyć wspólny rozkład prawdopodobieństwa. Prawidłowy sposób aktualizacji to powrót do przeszłości, znalezienie wspólnego prawdopodobieństwa, że ​​ktoś kocha horrory, widział horror w ciągu ostatnich 30 dni i jest właścicielem kota, biorąc pod uwagę, że wybiera wanilię lub nie ulubiony smak lodów, a następnie aktualizuj w jednym kroku.

Aktualizowanie sekwencyjne w ten sposób, gdy dane nie są niezależne, gwałtownie zwiększy twoje prawdopodobieństwo tylne znacznie wyższe lub niższe niż powinno być.

Jonathan Christensen
źródło
1
Co rozumiesz przez „kiedy sekwencyjnie otrzymywane informacje są niezależne?” Jeśli masz na myśli „niezależne od wydarzenia, które próbujesz przewidzieć”, czy wiesz, jak mogę stwierdzić, czy informacje, które otrzymuję, są niezależne?
user1626730,
Warunkowo niezależny, biorąc pod uwagę wydarzenie, które próbujesz przewidzieć. Gdyby byli niezależni od wydarzenia, które próbujesz przewidzieć, nie zrobiliby ci nic dobrego. Co do tego, jak możesz powiedzieć - musisz pomyśleć o swoich danych. W tym przypadku to, czy ktoś oglądał horror w ciągu ostatnich 30 dni, nie jest oczywiście niezależne od tego, czy kocha horrory.
Jonathan Christensen,
Kiedy mówisz „warunkowo niezależny”, zgaduję, że masz na myśli, że każdy P (B) (tj. Kochający horrory, posiadanie kota) nie jest ze sobą powiązany? Jeśli tak, to czy zmienna własności kota nie byłaby niezależna od miłośników horrorów?
user1626730,
Tak, możesz argumentować, że własność kotów jest niezależna od miłośników horrorów. Niekoniecznie jednak - na przykład kobiety mogą bardziej lubić koty, a mniej horrorów.
Jonathan Christensen,
Hm, nie jestem do końca pewien, co masz na myśli, dodając ten fragment o kobietach i kotach. Czy mógłbyś wyjaśnić więcej?
user1626730,