Dlaczego ?

15

Przypuszczam, że

P(A|B)=P(A|B,C)P(C)+P(A|B,¬C)P(¬C)

jest poprawny, podczas gdy

P(A|B)=P(A|B,C)+P(A|B,¬C)

jest nieprawidłowe.

Mam jednak „intuicję” na temat późniejszej, to znaczy rozważasz prawdopodobieństwo P (A | B), dzieląc dwa przypadki (C lub Not C). Dlaczego ta intuicja jest błędna?

zell
źródło
4
Oto prosty przykład, aby sprawdzić swoje równania. Rzuć dwiema niezależnymi, uczciwymi monetami. Niech będzie wydarzeniem, w którym pierwsze pojawią się głowy , B będzie wydarzeniem, w którym pojawią się drugie głowy, a C będzie wydarzeniem, w którym oba wystąpią główkami. Czy którekolwiek z zapisanych równań jest poprawne? ABC
A. Rex
4
Twierdzenie o prawdopodobieństwie całkowitym mówi, że jeśli chcesz wyrazić bezwarunkowe prawdopodobieństwo jako suma prawdopodobieństw warunkowych, trzeba ważyć przez zdarzenie klimatyzacji: np P(A)=P(A|B)P(B)+P(A|B¯)P(B¯)
AdamO

Odpowiedzi:

25

Załóżmy, że jako prosty przykład przeciwnie, że prawdopodobieństwo P(A) z A jest 1 , niezależnie od wartości C . Następnie, jeśli weźmiemy nieprawidłowe równanie , otrzymamy:

P(A|B)=P(A|B,C)+P(A|B,¬C)=1+1=2

To oczywiście nie może być poprawne, prawdopodobnie nie może być większe niż 1 . Pomaga to zbudować intuicję, że należy przypisać wagę każdemu z dwóch przypadków proporcjonalnie do prawdopodobieństwa wystąpienia tego przypadku , co skutkuje pierwszym (poprawnym) równaniem. .


To przybliża cię do pierwszego równania, ale wagi nie są całkowicie prawidłowe. Patrz komentarz A. Rexa dla prawidłowych wag.

Dennis Soemers
źródło
1
Czy wagi w „pierwszym (poprawnym) równaniu” powinny być P(C) i P(¬C) , czy powinny być P(CB) i P(¬CB) ?
A. Rex
@ A.Rex To dobra uwaga, dla pełnej poprawności myślę, że powinna to być P(C|B) i P(¬C|B) . Wszystko (tylko jeden termin) po lewej stronie równania zakłada, że B jest podane, więc bez żadnych dodatkowych założeń (takich jak założenie, że B i C są od siebie niezależne), to samo powinno mieć miejsce po prawej stronie
Dennis Soemers
Pomyśl tylko, że A | B ma 200% pewności.
Mark L. Stone
@ MarkL.Stone Czy to oznacza, że ​​zawsze zdarza się dwa razy? ;)
Przywróć Monikę
9

Odpowiedź Dennisa ma świetny kontrprzykład, obalający błędne równanie. Ta odpowiedź ma na celu wyjaśnienie, dlaczego poniższe równanie jest prawidłowe:

P(A|B)=P(A|C,B)P(C|B)+P(A|¬C,B)P(¬C|B).

Ponieważ każdy warunek jest uwarunkowany na B , możemy zastąpić całą przestrzeń prawdopodobieństwa B i upuścić termin. To daje nam:B

P(A)=P(A|C)P(C)+P(A|¬C)P(¬C).

Następnie pytasz, dlaczego to równanie ma i P ( ¬ C )P(C)P(¬C) wyrażenia .

Powodem jest to, że jest częścią A na C i P ( A | Kontakty C ) P ( Ź C ) jest częścią A w Ź C oraz dwa dodać do A . Zobacz schemat. Z drugiej strony P ( A | C ) to proporcja C zawierająca A i P ( |P(A|C)P(C)ACP(A|¬C)P(¬C)A¬CAP(A|C)CAP(A|¬C) to proporcja zawierająca A - są to proporcje różnych regionów, więc nie mają wspólnych mianowników, więc ich dodanie jest bez znaczenia.¬CA

pic

Przywróć Monikę
źródło
2
Nie „wszystko zależy od ”. W szczególności, P ( C ) i P ( ¬ C ) nie są, więc nie można po prostu spaść B . Co więcej, może to sugerować, że równanie jest nieprawidłowe! BP(C)P(¬C)B
A. Rex
@ A.Rex Technicznie masz rację, powinienem był powiedzieć, że każdy termin dotyczący jest uwarunkowany na B (dokonałem prostej zamiany A | B A ). Poprawię odpowiedź. ABA|BA
Przywróć Monikę
5
Mój sprzeciw nie był techniczny. Twój schemat poprawnie pokazuje, że , który po uwarunkowaniu na B staje się P ( A B ) = P ( A B , C ) P ( C B )P(A)=P(AC)P(C)+P(A¬C)P(¬C)B ; Należy zauważyć, że prawdopodobieństwo C i ¬ C są również uzależnione od B . To nie jest pierwsze równanie podane w OP, co jest dobrą wiadomością, ponieważ pierwsze równanie podane w OP jest niepoprawne. P(AB)=P(AB,C)P(CB)+P(AB,¬C)P(¬CB)C¬CB
A. Rex
@ A.Rex masz rację po raz kolejny, musi również uwarunkowane B jako część przestrzeni probabilistycznej zawarte w C nie może być taka sama jak proporcja B zawarte w C . Ten punkt mi umknął. Ponownie poprawię. CBCBC
Przywróć Monikę
7

Wiem, że otrzymałeś już dwie świetne odpowiedzi na swoje pytanie, ale chciałem tylko wskazać, w jaki sposób możesz przekształcić ideę intuicji w prawidłowe równanie.

Najpierw pamiętaj, że P(XY)=P(XY)P(Y) and equivalently P(XY)=P(XY)P(Y).

To avoid making mistakes, we will use the first equation in the previous paragraph to eliminate all conditional probabilities, then keep rewriting expressions involving intersections and unions of events, then use the second equation in the previous paragraph to re-introduce the conditionals at the end. Thus, we start with:

P(AB)=P(AB)P(B)

We will keep rewriting the right-hand side until we get the desired equation.

The casework in your intuition expands the event A into (AC)(A¬C), resulting in

P(AB)=P(((AC)(A¬C))B)P(B)

As with sets, the intersection distributes over the union:

P(AB)=P((ABC)(AB¬C))P(B)

Since the two events being unioned in the numerator are mutually exclusive (since C and ¬C cannot both happen), we can use the sum rule:

P(AB)=P(ABC)P(B)+P(AB¬C)P(B)

We now see that P(AB)=P(ACB)+P(A¬CB); thus, you can use the sum rule on the event on the event of interest (the "left" side of the conditional bar) if you keep the given event (the "right" side) the same. This can be used as a general rule for other equality proofs as well.

We re-introduce the desired conditionals using the second equation in the second paragraph:

P(A(BC))=P(ABC)P(BC)
and similarly for ¬C.

We plug this into our equation for P(AB) as:

P(AB)=P(ABC)P(BC)P(B)+P(AB¬C)P(B¬C)P(B)

Noting that P(BC)P(B)=P(CB) (and similarly for ¬C), we finally get

P(AB)=P(ABC)P(CB)+P(AB¬C)P(¬CB)

Which is the correct equation (albeit with slightly different notation), including the fix A. Rex pointed out.

Note that P(ACB) turned into P(ABC)P(CB). This mirrors the equation P(AC)=P(AC)P(C) by adding the B condition to not only P(AC) and P(AC), but also P(C) as well. I think if you are to use familiar rules on conditioned probabilities, you need to add the condition to all probabilities in the rule. And if there's any doubt whether that idea works for a particular situation, you can always expand out the conditionals to check, as I did for this answer.

YawarRaza7349
źródło
2
+1. I think you extracted the equation that OP tried to intuit: P(AB)=P(ACB)+P(A¬CB).
A. Rex
Thanks! That was the main point I wanted to make, but couldn't figure out a high-level explanation why the intersection goes on the left rather than the right, so I used formulas instead. Also, I just noticed you were the one who pointed out the mistake in OP's formula, so I credited you for that. (I probably wouldn't have noticed either, lol.)
YawarRaza7349
2

Probabilities are ratios; the probability of A given B is how often A happens within the space of B. For instance, P(rain|March) is the number of rainy days in March divided by the number of total days in March. When dealing with fractions, it makes sense to split up numerators. For instance,

P(rain or snow|March)=(number of rainy or snowy days in March)(total number of days in March)=(number of rainy days in March)(total number of days in March)+(number of snowy days in March)(total number of days in March)=P(rain|March)+P(snow|March)

This of course assumes that "snow" and "rain" are mutually exclusive. It does not, however, make sense to split up denominators. So if you have P(rain|February or March), that is equal to

(number of rainy days in February and March)(total number of days in February and March).

But that is not equal to

(number of rainy days in February)(total number of days in February)+(number of rainy days in March)(total number of days in March).

If you're having trouble seeing that, you can try out some numbers. Suppose there are 10 rainy days in February and 8 in March. Then we have

(number of rainy days in February and March)(total number of days in February and March)=(10+8)/(28+31)=29.5%

and

(number of rainy days in February)(total number of days in February)+(number of rainy days in March)(total number of days in March)=(10/28)+(8/31)=35.7%+25.8%=61.5%

The first number, 29.5%, is the average of 35.7% and 25.8% (with the second number weighted slightly more because there is are more days in March). When you say P(A|B)=P(A|B,C)+P(A|B,¬C) you're saying that x1+x2y1+y2=x1y1+x2y2, which is false.

Acccumulation
źródło
1

If I go to Spain, I can get sunburnt.

P(sunburnt|Spain)=0.2
This tells me nothing about getting sunburnt if not going to Spain, let's say
P(sunburnt|¬Spain)=0.1
This year I'm going to Spain, so
P(sunburnt)=0.2
Letting B=Ω, this is, P(B)=1, your intuition would imply
P(A)=P(A|C)+P(A|¬C)
which by the previous argument, isn't neccesarily true.
sheriff
źródło