Próbuję uzyskać jaśniejszy intuicji tyle: „Jeśli sprawia bardziej prawdopodobne, następnie sprawia bardziej prawdopodobne”, czyli
Niech oznaczają wielkość przestrzeni, w której i są, po czym
Twierdzenie: so
więc
czyli
Rozumiem matematykę, ale dlaczego ma to intuicyjny sens?
Odpowiedzi:
Intuicyjnie przykłady z prawdziwego świata, takie jak Peter Flom, są najbardziej pomocne dla niektórych osób. Inną rzeczą, która zwykle pomaga ludziom, są zdjęcia. Tak więc, aby objąć większość baz, zróbmy kilka zdjęć.
Mamy tutaj dwa bardzo podstawowe diagramy pokazujące prawdopodobieństwa. Pierwszy pokazuje dwa niezależne predykaty, które nazywam Red i Plain. Oczywiste jest, że są one niezależne, ponieważ linie się ustawiają. Proporcja prostego obszaru, który jest czerwony, jest taka sama, jak proporcja prążkowanego obszaru, który jest czerwony i jest również taka sama, jak całkowita proporcja, która jest czerwona.
Na drugim obrazie mamy rozkłady niezależne. W szczególności rozszerzyliśmy część zwykłego czerwonego obszaru do obszaru prążkowanego bez zmiany faktu, że jest czerwony. Jasne jest więc, że bycie czerwonym jest bardziej prawdopodobne.
Tymczasem spójrz na prostą stronę tego obrazu. Oczywiście proporcja prostego obszaru, który jest czerwony, jest większa niż proporcja całego obrazu, który jest czerwony. Wynika to z faktu, że regionowi równinnemu przydzielono dużo więcej obszaru, a wszystko to jest czerwone.
Tak więc czerwony zwiększa prawdopodobieństwo zwykłego, a zwykły zwiększa prawdopodobieństwo czerwonego.
Co tu się właściwie dzieje? A jest dowodem na B (to znaczy, że A zwiększa prawdopodobieństwo B), gdy obszar zawierający zarówno A, jak i B jest większy niż można by się spodziewać, gdyby byli niezależni. Ponieważ przecięcie A i B jest takie samo jak przecięcie B i A, oznacza to również, że B jest dowodem na A.
Jedna uwaga: chociaż powyższy argument wydaje się bardzo symetryczny, może nie być tak, że siła dowodów w obu kierunkach jest równa. Weźmy na przykład ten trzeci obraz. To samo się stało: zwykła czerwień zjadła terytorium należące wcześniej do prążkowanej czerwieni. W rzeczywistości całkowicie zakończył pracę!
Zauważ, że punkt, który jest czerwony wprost, gwarantuje prostotę, ponieważ nie ma już pasiastych czerwonych obszarów. Jednak zwykły punkt nie gwarantuje zaczerwienienia, ponieważ wciąż pozostały zielone regiony. Niemniej jednak zwykły punkt w polu zwiększa szansę, że jest czerwony, a punkt będący czerwony zwiększa szansę, że jest prosty. Oba kierunki implikują bardziej prawdopodobne, ale nie tyle samo.
źródło
In the second image, we have non-independent distributions. Specifically, we have moved some of the stripy red area into the plain area without changing the fact that it is red. Clearly then, being red makes being plain more likely.
- twój drugi obraz zyskał zwykły obszar niż pierwszy, więc przechodząc z obrazu 1 do 2 przenieśliśmy zwykły obszar do pasiastego obszaru.Myślę, że inny matematyczny sposób ujęcia tego może pomóc. Rozważ twierdzenie w kontekście reguły Bayesa:
Twierdzenie: jeśli toP.( B | A ) > P( B ) P.( A | B ) > P( A )
Zasada Bayesa:P.( A ∣ B ) =P.( B ∣ A )P.( A )P.( B )
zakładając, że niezerowe. A zatemP.( B )
Jeśli , to .P.( B | A ) > P( B ) P.( B | A )P.( B )> 1
Następnie , a więc .P.( A | B )P.( A )> 1 P.( A | B ) > P( A )
Dowodzi to twierdzenia i jeszcze silniejszego wniosku - że odpowiednie proporcje prawdopodobieństw muszą być równe.
źródło
Cóż, nie podoba mi się słowo „sprawia” w pytaniu. To implikuje jakiś związek przyczynowy, a przyczynowość zwykle się nie odwraca.
Ale prosiłeś o intuicję. Pomyślę więc o kilku przykładach, ponieważ wydaje się to pobudzać intuicję. Wybierz ten, który Ci się podoba:
Jeśli dana osoba jest kobietą, bardziej prawdopodobne jest, że ta osoba głosowała na Demokratę.
Jeśli dana osoba głosowała na demokratę, bardziej prawdopodobne jest, że jest ona kobietą.
Jeśli mężczyzna jest profesjonalnym centrum koszykówki, jest bardziej prawdopodobne, że ma ponad 2 metry wzrostu.
Jeśli mężczyzna ma ponad 2 metry wzrostu, bardziej prawdopodobne jest, że jest on centrum koszykówki.
Jeśli jest to ponad 40 stopni Celsjusza, bardziej prawdopodobne jest, że nastąpi zaciemnienie.
Jeśli nastąpiła awaria, bardziej prawdopodobne jest, że przekroczy ona 40 stopni.
I tak dalej.
źródło
Aby dodać odpowiedź @Dasherman: Co to znaczy powiedzieć, że dwa zdarzenia są powiązane , a może powiązane lub skorelowane ? Może moglibyśmy dla definicji porównać wspólne prawdopodobieństwo (Zakładając ): więc jeśli jest większy niż jeden, i występują razem częściej niż pod niezależnością. Możemy zatem powiedzieć, że i są pozytywnie powiązane.P(A)>0,P(B)>0 η(A,B)=P(A∩B)P(A)P(B) η A B A B
Ale teraz, używając definicji prawdopodobieństwa warunkowego, jest łatwą konsekwencją . Ale jest całkowicie symetryczny w i (zamieniając wszystkie wystąpienia symbolu z i odwrotnie) pozostawia te same formuły , więc jest również równoważne . To daje wynik. Więc intuicja poprosić o to, że jest symetryczny w i .P(A∩B)P(A)P(B)>1 P(B∣A)>P(B) P(A∩B)P(A)P(B) A B A B P(A∣B)>P(A) η(A,B) A B
Odpowiedź @gunes podała praktyczny przykład i łatwo uczynić innych tak samo.
źródło
Jeśli A zwiększa prawdopodobieństwo B, oznacza to, że zdarzenia są w jakiś sposób powiązane. Ta relacja działa w obie strony.
Jeśli A zwiększa prawdopodobieństwo B, oznacza to, że A i B zdarzają się razem. Oznacza to zatem, że B również zwiększa prawdopodobieństwo A.
źródło
Jeśli A zwiększa prawdopodobieństwo B, A ma kluczowe informacje, o których B może wnioskować na swój temat. Pomimo faktu, że może nie przyczynić się do takiej samej kwoty, informacje te nie zostaną utracone na odwrót. W końcu mamy dwa zdarzenia, które ich wystąpienie wspierają się nawzajem. Nie mogę sobie wyobrazić scenariusza, w którym wystąpienie A zwiększa prawdopodobieństwo B, a występowanie B zmniejsza prawdopodobieństwo A. Na przykład, jeśli pada deszcz, podłoga będzie mokro z dużym prawdopodobieństwem, a jeśli podłoga jest mokry, to nie znaczy, że padało, ale nie zmniejsza szans.
źródło
Możesz uczynić matematykę bardziej intuicyjną, wyobrażając sobie tabelę awaryjną.
KiedyA i B są niezależne, wówczas wspólne prawdopodobieństwa są iloczynami krańcowych prawdopodobieństw B¬B1y1−yAxa=xyc=x(1−y)¬A1−xb=(1−x)yd=(1−x)(1−y) W takim przypadku miałbyś podobne prawdopodobieństwo krańcowe i warunkowe, np P(A)=P(A|B) i P(B)=P(B|A) .
Gdy nie ma niezależności, można to uznać za opuszczenie parametrówa,b,c,d to samo (jak produkty marż), ale z tylko korektą wg ±z B¬B1y1−yAxa+zc−z¬A1−xb−zd+z
Możesz to zobaczyćz jako przełamanie równości prawdopodobieństw krańcowych i warunkowych lub przełamanie związku dla wspólnych prawdopodobieństw będących iloczynami prawdopodobieństw krańcowych.
Teraz z tego punktu widzenia (przełamania tych równości) widać, że to przełamanie odbywa się na dwa sposobyP(A|B)≠P(A) i P(B|A)≠P(B) . I nierówność będzie w obu przypadkach> kiedy z jest pozytywny i < kiedy z jest ujemny.
Abyś mógł zobaczyć połączenieP(A|B)>P(A) następnie P(B|A)>P(B) poprzez wspólne prawdopodobieństwo P(B,A)>P(A)P(B) .
Jeśli A i B często zdarzają się razem (prawdopodobieństwo połączenia jest wyższe niż iloczyn prawdopodobieństw krańcowych), wówczas zaobserwowanie jednego zwiększy prawdopodobieństwo (warunkowe) drugiego.
źródło
Załóżmy, że oznaczamy stosunek prawdopodobieństwa zdarzenia wstecznego do wcześniejszego jako:
Zatem alternatywnym wyrażeniem twierdzenia Bayesa (patrz ten powiązany post ) jest:
Współczynnik prawdopodobieństwa wcześniejszego do poprzedniego mówi nam, czy zdarzenie argumentujące jest bardziej czy mniej prawdopodobne przez wystąpienie zdarzenia warunkowego (i o ile bardziej lub mniej prawdopodobne). Powyższa postać twierdzenia Bayesa pokazuje wykorzystanie tego, że stosunek prawdopodobieństwa w stosunku do poprzedniego jest symetryczny w zmiennych.† Na przykład, jeśli obserwujesz B robi A bardziej prawdopodobne niż z góry , a następnie obserwowanieA robi B bardziej prawdopodobne niż było to z góry .
źródło
Powiedziano ci, że Sam jest kobietą, a Kim jest mężczyzną, a jeden z nich nosi makijaż, a drugi nie. Jak myślisz, kto z nich nosi makijaż?
Powiedziano ci, że Sam nosi makijaż, a Kim nie, a jeden z nich jest mężczyzną, a drugi kobietą. Jak myślisz, kim jest ta kobieta?
źródło
Wydaje się, że istnieje pewne zamieszanie między przyczynowością a korelacją. Rzeczywiście, stwierdzenie pytania jest fałszywe z powodu związku przyczynowego, co można zobaczyć na przykładzie:
To nie jest prawda:
Jeśli jednak myślisz o prawdopodobieństwach (korelacji), to JEST to prawda:
Prawda jest następująca:
Jeśli nie jest to intuicyjne, pomyśl o grupie zwierząt, w tym mrówkach, psach i kotach. Psy i koty mogą być udomowione i nosić chusty, mrówki też nie.
Udomowienie jest „tajnym” łącznikiem między zwierzęciem a szalikiem, a ten „tajny” link będzie oddziaływać na oba sposoby.
Edycja: Podaj przykład swojego pytania w komentarzach:
Wyobraź sobie świat, w którym zwierzęta to Koty lub Psy. Mogą być udomowione lub nie. Mogą nosić szalik lub nie. Wyobraź sobie, że istnieje 100 zwierząt ogółem, 50 psów i 50 kotów.
Rozważmy teraz stwierdzenie A: „ Psy w szalikach są trzykrotnie bardziej prawdopodobne niż zwierzęta bez szalików ”.
Jeśli A nie jest prawdą, możesz sobie wyobrazić, że świat mógłby być zbudowany z 50 psów, z których 25 udomowionych (z czego 10 nosi szaliki), 25 z nich dzikich (z czego 10 nosi szaliki). Te same statystyki dla kotów.
Następnie, jeśli widziałbyś zwierzę udomowione na tym świecie, miałoby 50% szansy na bycie psem (25/50, 25 psów na 50 udomowionych zwierząt) i 40% szansy na szalik (20/50, 10 psów oraz 10 kotów na 50 udomowionych zwierząt).
Jeśli jednak A jest prawdą, masz świat, w którym jest 50 psów, z czego 25 udomowionych (z czego 15 nosi szaliki ), 25 z nich dzikich (z czego 5 nosi szaliki ). Koty zachowują stare statystyki: 50 kotów, 25 z nich udomowionych (z czego 10 nosi szaliki), 25 z nich dzikich (z czego 10 nosi szaliki).
Następnie, jeśli zobaczysz udomowione zwierzę na tym świecie, będzie on miał taką samą 50% szansę na bycie psem (25/50, 25 psów na 50 udomowionych zwierząt), ale będzie miał 50% (25/50, 15 psów i 10 kotów na 50 udomowionych zwierząt).
Jak widać, jeśli powiesz, że A jest prawdą, to jeśli zobaczysz udomowione zwierzę noszące szalik na świecie, bardziej prawdopodobne jest, że Pies (60% lub 15/25) będzie nim inne zwierzę (w tym przypadku Kot, 40% lub 10/25).
źródło
Występuje tu pomyłka między przyczyną a korelacją. Podam więc przykład, w którym dzieje się dokładnie odwrotnie.
Niektórzy ludzie są bogaci, inni biedni. Niektórzy biedni ludzie otrzymują świadczenia, co czyni ich mniej biednymi. Ale ludzie, którzy otrzymują świadczenia, są jeszcze bardziej ubodzy, nawet jeśli otrzymują świadczenia.
Jeśli otrzymujesz świadczenia, zwiększa to prawdopodobieństwo, że możesz sobie pozwolić na bilety do kina. („Bardziej prawdopodobne” oznacza przyczynowość). Ale jeśli możesz sobie pozwolić na bilety do kina, zmniejsza to prawdopodobieństwo, że należysz do osób, które są wystarczająco biedne, aby uzyskać świadczenia, więc jeśli możesz sobie pozwolić na bilety do kina, mniej prawdopodobne jest, że dostaniesz świadczenia.
źródło
Intuicja staje się jasna, jeśli spojrzysz na mocniejsze stwierdzenie:
Oczywiście A jest bardziej prawdopodobne, jeśli B jest również znane, ponieważ jeśli B było fałszem, to tak też byłoby A. Ta sama logika dotyczy słabszego stwierdzenia:
źródło
Załóżmy, że Alice ma wyższy wskaźnik rzutów wolnych niż średnia. Wtedy prawdopodobieństwo strzału jest skuteczne, biorąc pod uwagę, że Alicja go spróbuje, jest większe niż prawdopodobieństwo strzału ogólnieP(successful|Alice)>P(successful) . Możemy również stwierdzić, że udział Alice w udanych ujęciach jest większy niż ogólnie ujęć:P(Alice|successful)>P(Alice) .
Lub załóżmy, że w jej okręgu szkolnym jest 10% uczniów, ale 15% uczniów z klasy A. Zatem wyraźnie odsetek uczniów tej szkoły, którzy są prostymi uczniami, jest wyższy niż odsetek w całym okręgu.
Inny sposób patrzenia na to: A jest bardziej prawdopodobne, biorąc pod uwagę B, jeśliP(A&B)>P(A)P(B) i to jest całkowicie symetryczne w odniesieniu do A i B .
źródło