Jeśli „B jest bardziej prawdopodobne, że otrzyma A”, to „A jest bardziej prawdopodobne, że otrzyma B”

9

Próbuję uzyskać jaśniejszy intuicji tyle: „Jeśli sprawia bardziej prawdopodobne, następnie sprawia bardziej prawdopodobne”, czyliABBA

Niech oznaczają wielkość przestrzeni, w której i są, po czymn(S)AB

Twierdzenie: soP(B|A)>P(B)n(AB)/n(A)>n(B)/n(S)

więcn(AB)/n(B)>n(A)/n(S)

czyliP(A|B)>P(A)

Rozumiem matematykę, ale dlaczego ma to intuicyjny sens?

Rahul Deora
źródło
1
Zredagowałem pytanie, aby usunąć słowo „make”. To pytanie brzmiało trochę jak te dwuznaczne pytania na Facebooku, te, w których musisz rozwiązać pewną sumę algebraiczną ze zdjęciami, a ludzie otrzymują bardzo różne odpowiedzi z powodu różnych interpretacji pytania. Nie tego tu chcemy. (alternatywą jest zamknięcie pytania z powodu niejasności i poproszenie go o zmianę).
Sextus Empiricus

Odpowiedzi:

10

Intuicyjnie przykłady z prawdziwego świata, takie jak Peter Flom, są najbardziej pomocne dla niektórych osób. Inną rzeczą, która zwykle pomaga ludziom, są zdjęcia. Tak więc, aby objąć większość baz, zróbmy kilka zdjęć.

Wykres prawdopodobieństwa warunkowego pokazujący niezależność Wykres prawdopodobieństwa warunkowego pokazujący zależność

Mamy tutaj dwa bardzo podstawowe diagramy pokazujące prawdopodobieństwa. Pierwszy pokazuje dwa niezależne predykaty, które nazywam Red i Plain. Oczywiste jest, że są one niezależne, ponieważ linie się ustawiają. Proporcja prostego obszaru, który jest czerwony, jest taka sama, jak proporcja prążkowanego obszaru, który jest czerwony i jest również taka sama, jak całkowita proporcja, która jest czerwona.

Na drugim obrazie mamy rozkłady niezależne. W szczególności rozszerzyliśmy część zwykłego czerwonego obszaru do obszaru prążkowanego bez zmiany faktu, że jest czerwony. Jasne jest więc, że bycie czerwonym jest bardziej prawdopodobne.

Tymczasem spójrz na prostą stronę tego obrazu. Oczywiście proporcja prostego obszaru, który jest czerwony, jest większa niż proporcja całego obrazu, który jest czerwony. Wynika to z faktu, że regionowi równinnemu przydzielono dużo więcej obszaru, a wszystko to jest czerwone.

Tak więc czerwony zwiększa prawdopodobieństwo zwykłego, a zwykły zwiększa prawdopodobieństwo czerwonego.

Co tu się właściwie dzieje? A jest dowodem na B (to znaczy, że A zwiększa prawdopodobieństwo B), gdy obszar zawierający zarówno A, jak i B jest większy niż można by się spodziewać, gdyby byli niezależni. Ponieważ przecięcie A i B jest takie samo jak przecięcie B i A, oznacza to również, że B jest dowodem na A.

Jedna uwaga: chociaż powyższy argument wydaje się bardzo symetryczny, może nie być tak, że siła dowodów w obu kierunkach jest równa. Weźmy na przykład ten trzeci obraz. To samo się stało: zwykła czerwień zjadła terytorium należące wcześniej do prążkowanej czerwieni. W rzeczywistości całkowicie zakończył pracę!Wykres prawdopodobieństwa warunkowego pokazujący skrajną zależność

Zauważ, że punkt, który jest czerwony wprost, gwarantuje prostotę, ponieważ nie ma już pasiastych czerwonych obszarów. Jednak zwykły punkt nie gwarantuje zaczerwienienia, ponieważ wciąż pozostały zielone regiony. Niemniej jednak zwykły punkt w polu zwiększa szansę, że jest czerwony, a punkt będący czerwony zwiększa szansę, że jest prosty. Oba kierunki implikują bardziej prawdopodobne, ale nie tyle samo.

Josiah
źródło
Lubię obrazy :) Jednak wygląda na to, że albo obrazy, albo wyjaśnienie jest obrócone: In the second image, we have non-independent distributions. Specifically, we have moved some of the stripy red area into the plain area without changing the fact that it is red. Clearly then, being red makes being plain more likely. - twój drugi obraz zyskał zwykły obszar niż pierwszy, więc przechodząc z obrazu 1 do 2 przenieśliśmy zwykły obszar do pasiastego obszaru.
Pod
Tak więc, jeśli mam schemat Venna z jakimś wspólnym obszarem przecięcia A, B, a wszystko, co robię, to zwiększam ten obszar przecięcia, automatycznie dodam więcej A, B dla całej przestrzeni (bez powiększania przestrzeni) i zmieniam / zwiększam n (A ) / n (S) i n (B) / n (S) w konsekwencji. Dobrze? Więcej komentarzy?
Rahul Deora,
4
Czerwony vs. zielony to problematyczne połączenie dla osób niewidomych.
Richard Hardy,
@Pod Myślę, że opisujesz dwuznaczność języka naturalnego. Przeczytaj „przenieśliśmy część prążkowanego czerwonego obszaru na zwykły obszar”, ponieważ „przenieśliśmy część obszaru znanego wcześniej jako prążkowany czerwony i zmieniliśmy go na zwykły obszar”. Myślę, że [źle-] przeczytałeś to jako „ rozszerzyliśmy część prążkowanego czerwonego obszaru do obszaru znanego wcześniej jako zwykły” .
Peter - przywróć Monikę
21

Myślę, że inny matematyczny sposób ujęcia tego może pomóc. Rozważ twierdzenie w kontekście reguły Bayesa:

Twierdzenie: jeśli toP(B|A)>P(B)P(A|B)>P(A)

Zasada Bayesa:

P(AB)=P(BA)P(A)P(B)

zakładając, że niezerowe. A zatemP(B)

P(A|B)P(A)=P(B|A)P(B)

Jeśli , to .P(B|A)>P(B)P(B|A)P(B)>1

Następnie , a więc .P(A|B)P(A)>1P(A|B)>P(A)

Dowodzi to twierdzenia i jeszcze silniejszego wniosku - że odpowiednie proporcje prawdopodobieństw muszą być równe.

Aaron Hall
źródło
Podobało mi się to, ponieważ pokazuje silniejszy link „jeśli A zwiększa prawdopodobieństwo B x procent, wówczas B zwiększa prawdopodobieństwo A x procent”
prawdopodobieństwo
@probabilityislogic Frazowanie w ten sposób wprowadza niejednoznaczność. Jeśli wcześniejsze prawdopodobieństwo wynosi 10%, a tylne 15%, to czy prawdopodobieństwo wzrosło o 5% (15% minus 10%) czy o 50% (15% podzielone przez 10%)?
Akumulacja
Prostszy dowód: jeśli , to używając tej reguły i reguły Bayesa, mamyP(B|A)>P(B)P(A|B)=P(B|A)P(A)/P(B)>P(B)P(A)/P(B)=P(A)
Ray
12

Cóż, nie podoba mi się słowo „sprawia” w pytaniu. To implikuje jakiś związek przyczynowy, a przyczynowość zwykle się nie odwraca.

Ale prosiłeś o intuicję. Pomyślę więc o kilku przykładach, ponieważ wydaje się to pobudzać intuicję. Wybierz ten, który Ci się podoba:

Jeśli dana osoba jest kobietą, bardziej prawdopodobne jest, że ta osoba głosowała na Demokratę.
Jeśli dana osoba głosowała na demokratę, bardziej prawdopodobne jest, że jest ona kobietą.

Jeśli mężczyzna jest profesjonalnym centrum koszykówki, jest bardziej prawdopodobne, że ma ponad 2 metry wzrostu.
Jeśli mężczyzna ma ponad 2 metry wzrostu, bardziej prawdopodobne jest, że jest on centrum koszykówki.

Jeśli jest to ponad 40 stopni Celsjusza, bardziej prawdopodobne jest, że nastąpi zaciemnienie.
Jeśli nastąpiła awaria, bardziej prawdopodobne jest, że przekroczy ona 40 stopni.

I tak dalej.

Peter Flom
źródło
4
Tu nie chodzi o prawdopodobieństwo. To około 1 do 1 relacji.
Peter Flom
6
@jww Wyobraź sobie zdanie „jeśli pada deszcz, ulica jest mokra” (i załóżmy, że jest to ważna implikacja na ten moment, podczas gdy nie jest odwrotnie). Teraz weź dużą liczbę „próbek” w różnych czasach i miejscach, w których rejestrujesz, czy pada deszcz i czy ulica jest mokra. Ulica będzie mokra w większej liczbie próbek, w których pada deszcz, niż próbek, w których nie ma; ale także będzie padać w większej liczbie próbek, w których ulica jest mokra, niż próbek, w których ulica jest sucha. To jest prawdopodobieństwo.
hobbs
3
Oba zjawiska są spowodowane tą samą implikacją; implikacja działa tylko w jeden sposób, ale obserwacja konsekwencji zwiększa prawdopodobieństwo, że patrzysz na próbkę, w której poprzednik jest prawdziwy.
hobbs
7
@Barmar Przepraszam, ale to częściowo pokazuje poprawność mojej logiki. Ponieważ powiedzmy, że 36/25 000 jest o wiele wyższe niż 1/150 000 000.
Peter Flom
7
Bardziej prawdopodobne niż ktoś, kto ma mniej niż 2 metry wysokości.
Peter Flom
9

Aby dodać odpowiedź @Dasherman: Co to znaczy powiedzieć, że dwa zdarzenia są powiązane , a może powiązane lub skorelowane ? Może moglibyśmy dla definicji porównać wspólne prawdopodobieństwo (Zakładając ): więc jeśli jest większy niż jeden, i występują razem częściej niż pod niezależnością. Możemy zatem powiedzieć, że i są pozytywnie powiązane.P(A)>0,P(B)>0

η(A,B)=P(AB)P(A)P(B)
ηABAB

Ale teraz, używając definicji prawdopodobieństwa warunkowego, jest łatwą konsekwencją . Ale jest całkowicie symetryczny w i (zamieniając wszystkie wystąpienia symbolu z i odwrotnie) pozostawia te same formuły , więc jest również równoważne . To daje wynik. Więc intuicja poprosić o to, że jest symetryczny w i .P(AB)P(A)P(B)>1P(BA)>P(B)P(AB)P(A)P(B)ABABP(AB)>P(A)η(A,B)AB

Odpowiedź @gunes podała praktyczny przykład i łatwo uczynić innych tak samo.

kjetil b halvorsen
źródło
2

Jeśli A zwiększa prawdopodobieństwo B, oznacza to, że zdarzenia są w jakiś sposób powiązane. Ta relacja działa w obie strony.

Jeśli A zwiększa prawdopodobieństwo B, oznacza to, że A i B zdarzają się razem. Oznacza to zatem, że B również zwiększa prawdopodobieństwo A.

Dasherman
źródło
1
Może to przydałoby się rozszerzenie? Bez definicji powiązanej jest trochę pusta.
mdewey,
2
Starałem się trzymać z dala od wszystkiego, co rygorystyczne, ponieważ OP poprosił o intuicyjne wyjaśnienie. Masz rację, że jest całkiem pusty jak teraz, ale nie jestem pewien, jak go rozwinąć w intuicyjny sposób. Dodałem próbę.
Dasherman
2

Jeśli A zwiększa prawdopodobieństwo B, A ma kluczowe informacje, o których B może wnioskować na swój temat. Pomimo faktu, że może nie przyczynić się do takiej samej kwoty, informacje te nie zostaną utracone na odwrót. W końcu mamy dwa zdarzenia, które ich wystąpienie wspierają się nawzajem. Nie mogę sobie wyobrazić scenariusza, w którym wystąpienie A zwiększa prawdopodobieństwo B, a występowanie B zmniejsza prawdopodobieństwo A. Na przykład, jeśli pada deszcz, podłoga będzie mokro z dużym prawdopodobieństwem, a jeśli podłoga jest mokry, to nie znaczy, że padało, ale nie zmniejsza szans.

pistolety
źródło
2

Możesz uczynić matematykę bardziej intuicyjną, wyobrażając sobie tabelę awaryjną.

A¬Aa+b+c+da+cb+dBa+bab¬Bc+dcd

  • Kiedy A i B są niezależne, wówczas wspólne prawdopodobieństwa są iloczynami krańcowych prawdopodobieństw

    A¬A1x1xBya=xyb=(1x)y¬B1yc=x(1y)d=(1x)(1y)
    W takim przypadku miałbyś podobne prawdopodobieństwo krańcowe i warunkowe, np P(A)=P(A|B) i P(B)=P(B|A).

  • Gdy nie ma niezależności, można to uznać za opuszczenie parametrów a,b,c,d to samo (jak produkty marż), ale z tylko korektą wg ±z

    A¬A1x1xBya+zbz¬B1yczd+z

    Możesz to zobaczyć z jako przełamanie równości prawdopodobieństw krańcowych i warunkowych lub przełamanie związku dla wspólnych prawdopodobieństw będących iloczynami prawdopodobieństw krańcowych.

    Teraz z tego punktu widzenia (przełamania tych równości) widać, że to przełamanie odbywa się na dwa sposoby P(A|B)P(A) i P(B|A)P(B). I nierówność będzie w obu przypadkach> kiedy z jest pozytywny i < kiedy z jest ujemny.

Abyś mógł zobaczyć połączenie P(A|B)>P(A) następnie P(B|A)>P(B) poprzez wspólne prawdopodobieństwo P(B,A)>P(A)P(B).

Jeśli A i B często zdarzają się razem (prawdopodobieństwo połączenia jest wyższe niż iloczyn prawdopodobieństw krańcowych), wówczas zaobserwowanie jednego zwiększy prawdopodobieństwo (warunkowe) drugiego.

Sextus Empiricus
źródło
2

Załóżmy, że oznaczamy stosunek prawdopodobieństwa zdarzenia wstecznego do wcześniejszego jako:

Δ(A|B)P(A|B)P(A)

Zatem alternatywnym wyrażeniem twierdzenia Bayesa (patrz ten powiązany post ) jest:

Δ(A|B)=P(A|B)P(A)=P(AB)P(A)P(B)=P(B|A)P(B)=Δ(B|A).

Współczynnik prawdopodobieństwa wcześniejszego do poprzedniego mówi nam, czy zdarzenie argumentujące jest bardziej czy mniej prawdopodobne przez wystąpienie zdarzenia warunkowego (i o ile bardziej lub mniej prawdopodobne). Powyższa postać twierdzenia Bayesa pokazuje wykorzystanie tego, że stosunek prawdopodobieństwa w stosunku do poprzedniego jest symetryczny w zmiennych. Na przykład, jeśli obserwujesz B robi Abardziej prawdopodobne niż z góry , a następnie obserwowanieA robi Bbardziej prawdopodobne niż było to z góry .


Należy pamiętać, że jest to reguła prawdopodobieństwa, dlatego nie należy jej interpretować przyczynowo . Ta symetria jest prawdziwa w sensie probabilistycznym dla biernej obserwacji --- jednak nie jest prawdą, jeśli interweniujesz w systemie, aby zmienićA lub B. W tym ostatnim przypadku konieczne byłoby skorzystanie z operacji przyczynowych (np.do operator), aby znaleźć efekt zmiany zmiennej warunkowej.

Ben - Przywróć Monikę
źródło
1

Powiedziano ci, że Sam jest kobietą, a Kim jest mężczyzną, a jeden z nich nosi makijaż, a drugi nie. Jak myślisz, kto z nich nosi makijaż?

Powiedziano ci, że Sam nosi makijaż, a Kim nie, a jeden z nich jest mężczyzną, a drugi kobietą. Jak myślisz, kim jest ta kobieta?

Hagen von Eitzen
źródło
Nie jest łatwo połączyć to z pierwotnym problemem. Czym dokładnie jest zdarzenie A i czym jest zdarzenie B? Tutaj wydaje się bardziej jak porównanie prawdopodobieństw. Zdarzenie A to „x to kobieta” (nie A to wydarzenie „x to mężczyzna”). A zdarzenie B to „x nosi makijaż”. Ale teraz nagle mamy Sam i Kim, skąd to się bierze i czy powinniśmy wykorzystać cokolwiek z informacji na temat subiektywnej męskości lub kobiecości ich imion?
Sextus Empiricus
1

Wydaje się, że istnieje pewne zamieszanie między przyczynowością a korelacją. Rzeczywiście, stwierdzenie pytania jest fałszywe z powodu związku przyczynowego, co można zobaczyć na przykładzie:

  • Jeśli pies ma na sobie szalik, to jest to udomowione zwierzę.

To nie jest prawda:

  • Widok zwierzęcia domowego ubranego w szalik oznacza, że ​​jest to pies.
  • Widok udomowionego psa oznacza, że ​​ma na sobie szalik.

Jeśli jednak myślisz o prawdopodobieństwach (korelacji), to JEST to prawda:

  • Psy noszące szaliki są znacznie bardziej prawdopodobne jako zwierzęta udomowione niż psy nie noszące szalików (lub ogólnie zwierzęta w tym przypadku)

Prawda jest następująca:

  • Udomowione zwierzę noszące szalik jest bardziej prawdopodobne, że jest psem niż innym zwierzęciem.
  • Udomowiony pies częściej nosi szalik niż pies, który nie jest udomowiony.

Jeśli nie jest to intuicyjne, pomyśl o grupie zwierząt, w tym mrówkach, psach i kotach. Psy i koty mogą być udomowione i nosić chusty, mrówki też nie.

  1. Jeśli zwiększysz prawdopodobieństwo udomowienia zwierząt w swojej puli, będzie to również oznaczać, że zwiększysz szansę zobaczenia zwierzęcia w szaliku.
  2. Jeśli zwiększysz prawdopodobieństwo kotów lub psów, zwiększysz również prawdopodobieństwo zobaczenia zwierzęcia w szaliku.

Udomowienie jest „tajnym” łącznikiem między zwierzęciem a szalikiem, a ten „tajny” link będzie oddziaływać na oba sposoby.

Edycja: Podaj przykład swojego pytania w komentarzach:

Wyobraź sobie świat, w którym zwierzęta to Koty lub Psy. Mogą być udomowione lub nie. Mogą nosić szalik lub nie. Wyobraź sobie, że istnieje 100 zwierząt ogółem, 50 psów i 50 kotów.

Rozważmy teraz stwierdzenie A: „ Psy w szalikach są trzykrotnie bardziej prawdopodobne niż zwierzęta bez szalików ”.

Jeśli A nie jest prawdą, możesz sobie wyobrazić, że świat mógłby być zbudowany z 50 psów, z których 25 udomowionych (z czego 10 nosi szaliki), 25 z nich dzikich (z czego 10 nosi szaliki). Te same statystyki dla kotów.

Następnie, jeśli widziałbyś zwierzę udomowione na tym świecie, miałoby 50% szansy na bycie psem (25/50, 25 psów na 50 udomowionych zwierząt) i 40% szansy na szalik (20/50, 10 psów oraz 10 kotów na 50 udomowionych zwierząt).

Jeśli jednak A jest prawdą, masz świat, w którym jest 50 psów, z czego 25 udomowionych (z czego 15 nosi szaliki ), 25 z nich dzikich (z czego 5 nosi szaliki ). Koty zachowują stare statystyki: 50 kotów, 25 z nich udomowionych (z czego 10 nosi szaliki), 25 z nich dzikich (z czego 10 nosi szaliki).

Następnie, jeśli zobaczysz udomowione zwierzę na tym świecie, będzie on miał taką samą 50% szansę na bycie psem (25/50, 25 psów na 50 udomowionych zwierząt), ale będzie miał 50% (25/50, 15 psów i 10 kotów na 50 udomowionych zwierząt).

Jak widać, jeśli powiesz, że A jest prawdą, to jeśli zobaczysz udomowione zwierzę noszące szalik na świecie, bardziej prawdopodobne jest, że Pies (60% lub 15/25) będzie nim inne zwierzę (w tym przypadku Kot, 40% lub 10/25).

H4uZ
źródło
Z tą linią mam problem: „Udomowione zwierzę noszące szalik jest bardziej typem psa niż innego zwierzęcia”. Kiedy złożyliśmy wstępne oświadczenie, nie zgłosiliśmy żadnych roszczeń do innych zwierząt, które mogłyby nosić szaliki. Mogą być setki. Wydaliśmy tylko oświadczenie o psach.
Rahul Deora,
Sprawdź, czy moja edycja pomaga w rozwiązaniu konkretnego problemu.
H4uZ
0

Występuje tu pomyłka między przyczyną a korelacją. Podam więc przykład, w którym dzieje się dokładnie odwrotnie.

Niektórzy ludzie są bogaci, inni biedni. Niektórzy biedni ludzie otrzymują świadczenia, co czyni ich mniej biednymi. Ale ludzie, którzy otrzymują świadczenia, są jeszcze bardziej ubodzy, nawet jeśli otrzymują świadczenia.

Jeśli otrzymujesz świadczenia, zwiększa to prawdopodobieństwo, że możesz sobie pozwolić na bilety do kina. („Bardziej prawdopodobne” oznacza przyczynowość). Ale jeśli możesz sobie pozwolić na bilety do kina, zmniejsza to prawdopodobieństwo, że należysz do osób, które są wystarczająco biedne, aby uzyskać świadczenia, więc jeśli możesz sobie pozwolić na bilety do kina, mniej prawdopodobne jest, że dostaniesz świadczenia.

gnasher729
źródło
5
To nie jest odpowiedź na pytanie. Ciekawe, ale nie odpowiedź. W rzeczywistości chodzi o inny scenariusz; dzieje się odwrotnie, ponieważ używa dwóch różnych wskaźników o podobnych nazwach (słaba bez korzyści vs. słaba z korzyściami) i jako taka jest zupełnie inny scenariusz.
wizzwizz4
0

Intuicja staje się jasna, jeśli spojrzysz na mocniejsze stwierdzenie:

Jeśli A implikuje B, B zwiększa prawdopodobieństwo A.

Implication:
  A true  -> B true
  A false -> B true or false
Reverse implication:
  B true  -> A true or false
  B false -> A false

Oczywiście A jest bardziej prawdopodobne, jeśli B jest również znane, ponieważ jeśli B było fałszem, to tak też byłoby A. Ta sama logika dotyczy słabszego stwierdzenia:

Jeśli A zwiększa prawdopodobieństwo B, to B zwiększa prawdopodobieństwo A.

Weak implication:
  A true  -> B true or (unlikely) false
  A false -> B true or false
Reverse weak implication:
  B true  -> A true or false
  B false -> A false or (unlikely) true
Rainer P.
źródło
Myślę, że to, co mówisz w pierwszym stwierdzeniu, to to, że na diagramie Venna, jeśli A jest zawarte w B, to jeśli B jest prawdziwe, n (A) / n (B) musi być wyższe niż n (A) / n (S) ponieważ B jest mniejszą przestrzenią niż S. Nawet w drugim, mówisz podobnie?
Rahul Deora,
@RahulDeora - Tak, tak to działa. Słaba wersja jest o wiele mniej oczywista, ale i tak już to zrobiłeś. To, o co prosiłeś, to intuicja stojąca za wynikiem, co najlepiej można zaobserwować w mocniejszym stwierdzeniu.
Rainer P.
Mały problem z użyciem tego stwierdzenia w celu uzyskania większej intuicji polega na tym, że nie jest to do końca prawda. „A sugerujące B” nie jest warunkiem wystarczającym do „gdy B jest bardziej prawdopodobne, że A”. Ważnym rozróżnieniem jest to, że przy „A implikującym B” nie trzeba zwiększać prawdopodobieństwa B. Najważniejsze przykłady to przypadki, gdy B jest zawsze prawdziwe.
Sextus Empiricus
0

Załóżmy, że Alice ma wyższy wskaźnik rzutów wolnych niż średnia. Wtedy prawdopodobieństwo strzału jest skuteczne, biorąc pod uwagę, że Alicja go spróbuje, jest większe niż prawdopodobieństwo strzału ogólnieP(successful|Alice)>P(successful). Możemy również stwierdzić, że udział Alice w udanych ujęciach jest większy niż ogólnie ujęć:P(Alice|successful)>P(Alice).

Lub załóżmy, że w jej okręgu szkolnym jest 10% uczniów, ale 15% uczniów z klasy A. Zatem wyraźnie odsetek uczniów tej szkoły, którzy są prostymi uczniami, jest wyższy niż odsetek w całym okręgu.

Inny sposób patrzenia na to: A jest bardziej prawdopodobne, biorąc pod uwagę B, jeśli P(A&B)>P(A)P(B)i to jest całkowicie symetryczne w odniesieniu do A i B.

Akumulacja
źródło