Wzór na warunkowe prawdopodobieństwo wystąpienia biorąc pod uwagę, że zdarzyło się , jest następujący: P \ left (\ text {A} ~ \ middle | ~ \ text {B} \ right) = \ frac { P \ left (\ text {A} \ cap \ text {B} \ right)} {P \ left (\ text {B} \ right)}.
Mój podręcznik wyjaśnia intuicję za pomocą diagramu Venna.
Biorąc pod uwagę, że wystąpił , jedynym sposobem na wystąpienie jest zdarzenie przypadające na przecięciu i .
W takim przypadku prawdopodobieństwo po prostu nie byłoby równe prawdopodobieństwu przecięcia , ponieważ to jedyny sposób, żeby wydarzenie mogło się wydarzyć? czego mi brakuje?
Odpowiedzi:
Podano dobrą intuicję, że B wystąpiło - z A lub bez - jakie jest prawdopodobieństwo A? Tj. Jesteśmy teraz we wszechświecie, w którym wystąpił B - pełne prawe koło. W tym okręgu prawdopodobieństwo A jest obszarem A przecinającym B podzielonym przez pole okręgu.
źródło
Pomyślałbym o tym w ten sposób: zakładam, że rozumiesz intuicję, dopóki:
i zamierzam skomentować drugi obraz, który opublikowałeś:
Wyobraź sobie, że cały biały prostokąt jest miejscem na próbkę .Ω
Przypisanie prawdopodobieństwa do zestawu oznacza, że mierzysz w pewnym sensie ten zestaw. Jest tak samo, jakbyś zmierzył pole prostokąta, ale prawdopodobieństwo jest innym rodzajem miary, która ma określone właściwości (nie powiem nic więcej na ten temat).
Wiesz, że i jest to interpretowane w następujący sposób:P(Ω)=1
Analogicznie zbiór ma prawdopodobieństwo które jest proporcjonalne do prawdopodobieństwa przestrzeni próbki . Graficznie widać, że stąd miara (jej prawdopodobieństwo ) musi być mniejsza niż . To samo rozumowanie dotyczy zbioru . Zestaw ten można zmierzyć, a jego miarą jest .P ( A ) Ω A ⊂ Ω A P ( A ) P ( Ω ) A ∩ B P ( A ∩ B )A P(A) Ω A⊂Ω A P(A) P(Ω) A∩B P(A∩B)
Jeśli teraz dowiesz się, że się wydarzyło, musisz pomyśleć, jakby był twoim „nowym” . Jeśli jest Twój „nowy” wtedy można mieć 100% pewność, że wszystko dzieje się w zbiorze .B Ω B Ω BB B Ω B Ω B
I co to znaczy? Oznacza to, że teraz w „nowym” konkursie i trzeba przeskalować wszystkie miary prawdopodobieństwa, biorąc pod uwagę, że należy je wyrazić w kategoriach „nowej” przestrzeni próby . To prosta proporcja.B.P(B∣B)=1 B
Twoja intuicja jest prawie właściwa, gdy mówisz, że:
a „prawie” wynika z faktu, że teraz zmieniła się twoja przestrzeń próbki (teraz jest ) i chcesz odpowiednio przeskalować .P ( A ∩ B )B P(A∩B)
P ( A ∩ B ) BP(A∣B) to w nowym świecie, gdzie przestrzeń jest teraz próbka . Słowami powiedziałbyś to w ten sposób (i spróbuj zobrazować to na obrazie z zestawami):P(A∩B) B
W nowym świecie stosunek miary do miary musi być taki sam, jak stosunek miary do miaryA ∩ B Ω A ∣ BB A∩B Ω A∣B
Na koniec przetłumacz to na język matematyczny (prosta proporcja):
a ponieważ wynika, że:P(Ω)=1
źródło
Zobaczysz intuicję łatwo myślącą o następującym problemie.
Załóżmy, że masz 10 kulek: 6 czarnych i 4 czerwone. Z czarnych kulek 3 są Niesamowite, a czerwonych piłek tylko 1 jest Niesamowite. Jak prawdopodobne jest, że czarna kula jest również niesamowita?
Odpowiedź jest bardzo łatwa: to 50%, ponieważ mamy 3 Niesamowite Czarne kule spośród 6 Czarnych.
W ten sposób mapujesz prawdopodobieństwa do naszego problemu:
źródło
Dla podstawowej intuicji formuły prawdopodobieństwa warunkowego zawsze lubię używać tabeli dwukierunkowej. Powiedzmy, że w grupie rocznej jest 150 studentów, z których 80 to kobiety i 70 mężczyzn, z których każdy musi uczyć się dokładnie jednego kursu językowego. Dwukierunkowa tabela uczniów biorących udział w różnych kursach to:
Biorąc pod uwagę, że student bierze udział w kursie języka włoskiego, jakie jest prawdopodobieństwo, że jest kobietą? Kurs języka włoskiego ma 60 studentów, z których 40 to kobiety uczące się języka włoskiego, więc prawdopodobieństwo musi być następujące:
gdzie jest licznością zbioru , tj. liczbą zawartych w nim elementów. Zauważ, że musieliśmy używać w liczniku, a nie tylko , ponieważ to ostatnie obejmowałoby wszystkie 80 kobiet, w tym pozostałe 40 którzy nie uczą się języka włoskiego.A n ( F ∩ włoski ) n ( F )n(A) A n(F∩Italian) n(F)
Ale jeśli pytanie zostanie odwrócone, jakie jest prawdopodobieństwo, że uczeń podejmie kurs języka włoskiego, biorąc pod uwagę, że jest kobietą? Następnie 40 z 80 studentek bierze udział w kursie języka włoskiego, więc mamy:
Mam nadzieję, że to zapewnia intuicję
Zrozumienie, dlaczego ułamek można zapisać z prawdopodobieństwem zamiast liczności, jest kwestią ułamków równoważnych . Na przykład wróćmy do prawdopodobieństwa, że studentka jest kobietą, biorąc pod uwagę, że uczy się włoskiego. W sumie jest 150 studentów, więc prawdopodobieństwo, że studentka jest kobietą i uczy się włoskiego, wynosi 40/150 (jest to „wspólne” prawdopodobieństwo), a prawdopodobieństwo, że student uczy się włoskiego, wynosi 60/150 (jest to „marginalne” prawdopodobieństwo ). Zauważ, że podzielenie prawdopodobieństwa łącznego przez prawdopodobieństwo krańcowe daje:
(Aby zobaczyć, że ułamki są równoważne, pomnożenie licznika i mianownika przez 150 usuwa „/ 150” w każdym z nich).
Mówiąc bardziej ogólnie, jeśli Twoja przestrzeń próbkowania ma liczność - w tym przykładzie liczność wynosiła 150 - stwierdzimy, żeΩ n(Ω)
źródło
Odwróciłbym logikę. Prawdopodobieństwo, że zarówno jak i wynosi:A B
To ci da
Jeśli szukasz negatywnego wyniku dla swojej sugestii, to prawda, że prawdopodobieństwo danego jest zawarte w prawdopodobieństwie produktu, przestrzeń, w którą rzucasz kostką, jest mniejsza niż początkowa przestrzeń prawdopodobieństwa - wiesz na pewno jesteś „w” , dlatego dzielisz przez rozmiar nowej przestrzeni.A B B
źródło
Diagram Venna nie reprezentuje prawdopodobieństwa, reprezentuje miarę podzbiorów przestrzeni zdarzeń. Prawdopodobieństwo to stosunek dwóch miar; prawdopodobieństwo X jest wielkością „wszystkiego, co stanowi X”, podzieloną wielkością „wszystkich rozważanych zdarzeń”. Za każdym razem, gdy obliczasz prawdopodobieństwo, potrzebujesz zarówno „przestrzeni sukcesu”, jak i „przestrzeni populacji”. Nie można obliczyć prawdopodobieństwa na podstawie „wielkości” przestrzeni sukcesu. Na przykład prawdopodobieństwo rzutu siódemką z dwiema kostkami to liczba sposobów rzutu siódemką podzielona przez całkowitą liczbę sposobów rzutu dwiema kostkami. Sama znajomość liczby sposobów wyrzucenia siódemki nie wystarczy, aby obliczyć prawdopodobieństwo. P (A | B) to stosunek miary „zdarzają się zarówno A, jak i B” przestrzeń i miara przestrzeni „B dzieje się”. Właśnie to „|” oznacza: oznacza „zrób to, co nastąpi po tym, przestrzeń populacji”.
źródło
Myślę, że najlepszym sposobem, aby o tym pomyśleć, jest rysowanie ścieżek krok po kroku.
Opiszmy Zdarzenie B jako rzucie na uczciwej kości - można to łatwo wykazać jako prawdopodobieństwo . Teraz opiszmy Zdarzenie A jako dobieranie Asa ze standardowej talii 52 kart - można to łatwo wykazać jako prawdopodobieństwo .4 16 113
Rozpocznijmy teraz eksperyment, w którym rzucamy kością, a następnie wybieramy kartę. Tak więc jest prawdopodobieństwem, że narysujemy asa, biorąc pod uwagę, że wyrzuciliśmy już . Jeśli spojrzysz na obrazek, będzie to ścieżka (idź w górę), a następnie ścieżka (idź w górę).P(A|B) 4 16 113
Intuicyjnie całkowita przestrzeń prawdopodobieństwa jest tym, co już nam dano: wyrzucenie . Możemy zignorować i do którego prowadzi początkowa ścieżka, ponieważ WYDAŁEM, że wyrzuciliśmy . Zgodnie z prawem mnożenia, nasza całkowita przestrzeń jest wtedy .4 113 1213 4 (16×113)+(16×1213)
Jakie jest prawdopodobieństwo, że narysowaliśmy asa, GIVEN, że wyrzuciliśmy ? Odpowiedź przy użyciu ścieżki to , które następnie musimy podzielić przez całkowitą przestrzeń. Otrzymujemy4 (16×113)
źródło
Pomyśl o tym pod względem liczenia. Marginalnym prawdopodobieństwem jest to, ile razy A wystąpiło podzielone przez wielkość próby. Wspólne prawdopodobieństwo A i B to iloraz A występującego razem z B podzielone przez wielkość próby. Warunkowe prawdopodobieństwo A danej B to ile razy A wystąpiło razem z B podzielone przez liczbę razy B, tj. Tylko „A” w „B”.
Na tym blogu możesz znaleźć ładną ilustrację wizualną , która pokazuje ją za pomocą klocków Lego.
źródło
W momencie pisania jest około 10 odpowiedzi, które wydają się pomijać najważniejszy punkt: masz w zasadzie rację.
To zdecydowanie prawda. To wyjaśnia, dlaczego ilość, którą definiujemy jest w rzeczywistości przeskalowana .P(A|B) P(A∩B)
Brakuje Ci prawdopodobieństwa, że B zostanie spełnione, biorąc pod uwagę, że B jest spełnione, powinno wynosić 1, ponieważ jest to dość pewne zdarzenie, a nie które może być mniejsze niż 1. Dzielenie przez sprawia, że warunkowe prawdopodobieństwo B, biorąc pod uwagę B, wynosi 1, zgodnie z oczekiwaniami. W rzeczywistości jest to jeszcze lepsze i sprawia, że mapa jest prawdopodobieństwem - więc prawdopodobieństwo warunkowe jest w rzeczywistości prawdopodobieństwem.P(B∩B)=P(B) P(B) A↦P(A|B)
źródło
Wydaje mi się, że jest bardziej intuicyjny, gdy mamy konkretne dane do oszacowania prawdopodobieństw.
Użyjmy
mtcars
danych jako przykładu, dane wyglądają tak (używamy tylko liczby cylindrów i rodzaju skrzyni biegów).Możemy obliczyć rozkład połączeń dla dwóch zmiennych, wykonując tabelę krzyżową:
Wspólne prawdopodobieństwo oznacza, że chcemy wziąć pod uwagę dwie zmienne jednocześnie. Na przykład zapytamy, ile samochodów ma 4 cylindry i manualną skrzynię biegów.
Teraz dochodzimy do prawdopodobieństwa warunkowego. Znalazłem najbardziej intuicyjny sposób wyjaśnienia prawdopodobieństwa warunkowego, używając terminu filtrowanie danych.
Załóżmy, że chcemy uzyskać , dokonamy następujących oszacowań:P(am=1|cyl=4)
Oznacza to, że dbamy tylko o samochody z 4 cylindrami. Więc filtrujemy dane na ten temat. Po filtrowaniu sprawdzamy, ile z nich to manualna skrzynia biegów.
Możesz porównać to z połączeniem, o którym wspomniałem wcześniej, aby poczuć różnice.
źródło
Gdyby
A
było nadzbioremB
prawdopodobieństwa, które sięA
zdarza, to zawsze 1 biorąc pod uwagę, że sięB
zdarzyło, tjP(A|B) = 1
. JednakB
samo prawdopodobieństwo może być znacznie mniejsze niż 1.Rozważ następujący przykład:
x
liczba naturalna to 1..100,A
to „x
jest liczbą parzystą”B
jest „x
dzieli się przez 10”mamy wtedy:
P(A)
wynosi 0,5P(B)
wynosi 0,1Jeśli wiemy, że
x
można podzielić przez 10 (tzn.x
Jest wB
środku), wiemy, że jest to również liczba parzysta (tj.x
Jest wA
środku), więcP(A|B) = 1
.Z zasady Bayesa mamy:
zwróć uwagę, że w naszym (specjalnym) przypadku , tzn. prawdopodobieństwo, że jest zarówno liczbą parzystą, jak i liczbą podzielną przez 10, jest równe prawdopodobieństwu, które jest liczbą podzielną przez 10. Dlatego mamy i podłączając to z powrotem do reguły Bayesa otrzymujemy .P(A∩B) P(A∩B)=P(B) P(A|B)=P(B)/P(B)=1
x
x
W przypadku nie-zdegenerowanego przykładu rozważ np.
A
„x
Jest podzielna przez 7” iB
„x
jest podzielna przez 3”. ZatemP(A|B)
jest równoważne „biorąc pod uwagę, że wiemy, żex
można podzielić przez 3, jakie jest prawdopodobieństwo, że jest (także) podzielna przez 7?”. Lub równoważnie: „Jaką część liczb 3, 6, ..., 99 można podzielić przez 7”?źródło
Myślę, że twoje wstępne stwierdzenie może być nieporozumieniem.
Napisałeś:
Z twojego sformułowania może to brzmieć tak, jakby były 2 zdarzenia „Najpierw wydarzyło się B, a następnie chcemy obliczyć prawdopodobieństwo, że A się wydarzy”.
Nie o to chodzi. (Poniższe informacje są ważne, niezależnie od tego, czy doszło do nieporozumienia).
Mamy tylko 1 wydarzenie, które opisuje jedna z 4 możliwości:
ani ani ;A B
po prostu , nie ;A B
po prostu , nie ;B A
zarówno i .A B
Umieszczając na nim kilka przykładowych liczb, powiedzmy
Wynika z tego, że
Początkowo (bez wiedzy o zdarzeniu) wiedzieliśmy, że .P(AB)=0.25
Ale kiedy wiemy, że się wydarzyło, jesteśmy w innej przestrzeni. to połowa więc prawdopodobieństwo biorąc pod uwagę , , wynosi . To nie jest , wiedząc, że doszło do .B P(AB) P(B) A B P(A|B) 0.5 0.25 B
źródło
Prawdopodobieństwo warunkowania NIE jest równe prawdopodobieństwu przecięcia. Oto intuicyjna odpowiedź:
1) : „Wiemy, że wydarzyło. Jakie jest prawdopodobieństwo, że się wydarzy?”P(B∣A) A B
2: : „Nie wiemy, czy zdarzyło się lub To jakie jest prawdopodobieństwo, że oba wystąpią?P(A∩B) A B
Różnica polega na tym, że w pierwszym mamy dodatkowe informacje (wiemy, że występuje najpierw). W drugim nie wiemy nic.A
Zaczynając od prawdopodobieństwa drugiego, możemy wywnioskować prawdopodobieństwo pierwszego.
Zdarzenie, w którym wystąpią zarówno jak i , może nastąpić na dwa sposoby:A B
1) Prawdopodobieństwo ORAZ prawdopodobieństwo biorąc pod uwagę, że zdarzyło sięA B A
2) Prawdopodobieństwo ORAZ prawdopodobieństwo biorąc pod uwagę, że wydarzyło.B A B
Okazuje się, że obie sytuacje tak samo się zdarzają. (Sam nie potrafię znaleźć intuicyjnego powodu). Dlatego musimy rozważyć oba scenariusze za pomocą0.5
Teraz użyj, że i są niezależne i pamiętaj, że oba scenariusze równie prawdopodobne mogą się wydarzyć.A B∣A
Tadaaa ... teraz wyizoluj prawdopodobieństwo warunkowania!
btw. Chciałbym, gdyby ktoś mógł wyjaśnić, dlaczego scenariusz 1 i 2 są równe. Klucz leży tam imo.
źródło