Prawdopodobieństwo - Dlaczego pomnażać?

22

Studiuję o oszacowaniu maksymalnego prawdopodobieństwa i czytam, że funkcja prawdopodobieństwa jest iloczynem prawdopodobieństwa każdej zmiennej. Dlaczego to jest produkt? Dlaczego nie suma? Próbowałem szukać w Google, ale nie mogę znaleźć żadnych sensownych odpowiedzi.

https://en.wikipedia.org/wiki/Maximum_likelihood

RuiQi
źródło
7
Należy pamiętać, że niekoniecznie tak jest i ogólnie maksymalne prawdopodobieństwo jest zdefiniowane w kategoriach łącznej gęstości zmiennych losowych. Oczywiście, jeśli są niezależni, ich łączna gęstość jest tylko produktem marginesów
Ant
Pamiętaj, że mnożenie to tylko skrót do dodania. Kiedy mówię 2 razy 3, mówię 2 + 2 + 2. Rozmnażamy się, bo jesteśmy leniwi. Kto ma czas, aby to zrobić na swój sposób? Możesz dodać, jeśli pomoże ci to zobaczyć, co się dzieje (pomogło mi zrozumieć problem Monty Hall), ale po pewnym czasie będziesz się nudzić.
candied_orange
powiedzmy, że masz 80% prawdopodobieństwa posiadania brązowych włosów i 75% prawdopodobieństwa posiadania brązowych oczu. Czy uważasz, że jest możliwe, że prawdopodobieństwo bycia brązowowłosym i brązowookimi jest 80% + 75% = 155%? jak o 80% * 75% = 60%?
njzk2

Odpowiedzi:

39

To bardzo podstawowe pytanie i zamiast używać formalnego języka i notacji matematycznej, postaram się na nie odpowiedzieć na poziomie, na którym każdy, kto rozumie pytanie, może również zrozumieć odpowiedź.

Wyobraź sobie, że mamy rasę kotów. Mają 75% prawdopodobieństwa urodzenia się na biało i 25% prawdopodobieństwa urodzenia się na szaro, bez innych kolorów. Ponadto mają one 50% prawdopodobieństwa posiadania zielonych oczu i 50% prawdopodobieństwa posiadania niebieskich oczu, a kolor sierści i kolor oczu są niezależne.

Spójrzmy teraz na miot ośmiu kociąt:

wprowadź opis zdjęcia tutaj

Zobaczysz, że 1 na 4, czyli 25%, jest szary. Ponadto 1 na 2 lub 50% ma niebieskie oczy. Teraz pytanie brzmi:

ile kociąt ma szare futro i niebieskie oczy?

Możesz je policzyć, odpowiedź jest jedna. To znaczy lub 12,5% z 8 kociąt.14×12=18

Dlaczego tak się dzieje Ponieważ każdy kot ma szary 1 na 4 prawdopodobieństwo. Wybierz cztery koty i możesz oczekiwać, że jeden z nich będzie szary. Ale jeśli wybierzesz tylko cztery koty z wielu (i uzyskasz oczekiwaną wartość 1 szarego kota), ten, który jest szary, ma prawdopodobieństwo 1 na 2 posiadania niebieskich oczu. Oznacza to, że spośród wszystkich wybranych kotów najpierw pomnożymy sumę o 25%, aby uzyskać szare koty, a następnie pomnożymy wybrane 25% wszystkich kotów przez 50%, aby uzyskać te z niebieskimi oczami. Daje to prawdopodobieństwo wystąpienia szarych niebieskookich kotów.

Podsumowanie ich dałoby , co daje314+12 lub 6 na 8. Na naszym zdjęciu odpowiada to sumowaniu kotów o niebieskich oczach z kotami o szarym futrze - i liczeniu jednego szarego niebieskookiego kociaka dwa razy! Takie obliczenia mogą mieć swoje miejsce, ale są dość niezwykłe w obliczeniach prawdopodobieństwa i na pewno nie są to te, o które pytasz.34

rumtscho
źródło
1
Wiem, że inne odpowiedzi tutaj oznaczają to samo. Nadal uważam, że potrzebna jest tutaj reprezentacja wizualna - gdyby PO był w stanie sam wizualizować koncepcję, prawdopodobnie doszedłby już do odpowiedzi.
rumtscho
To jest naprawdę wspaniała odpowiedź, ponieważ pokazuje każdą niezależną zmienną jako niezależną oś w matrycy kota. To bardzo ułatwia zrozumienie. Użyję tego przykładu, aby uczyć moje dzieci!
dotancohen
3
Ta odpowiedź jest w rzeczywistości błędna, ponieważ nadal łączy w sobie obserwowaną wartość i oczekiwaną wartość. Widząc, jak jest popularny, postaram się znaleźć czas na jego aktualizację wraz z wyjaśnieniem, dlaczego ten sposób podzbiorowania kotów daje nam oszacowanie maksymalnego prawdopodobieństwa (lub rozwiązuje problem wybierania 8 losowych kotów i stwierdzenia, że ​​nie są one te, które namalowałem na zdjęciu).
rumtscho
Dlaczego nie może to być cała populacja takich kotów? (Powiedzmy, że mają jakieś specjalne właściwości badawcze - na przykład ich języki są chemiluminescencyjne.) W takim razie połączenie nie jest szkodliwe.
Eric Towers
16

ABSABP(AB)=P(AB)=P(A)P(B)A1,A2,...AnP(AiiI)=iIP(Ai)I[1,2,...,n]

x1,x2,,xnnf(x1,x2,...,xn|θ)=i=1i=nf(xi|θ)

Bahgat Nassour
źródło
6

P(AB)P(A)P(B)

Zatem jeśli przyjmiesz, że wszystkie twoje obserwacje są niezależne, prawdopodobieństwo zaobserwowania wszystkich wartości, które zobaczyłeś, jest równe iloczynowi poszczególnych prawdopodobieństw.

Cliff AB
źródło
8
P(AB)
Cześć dzięki za odpowiedź! Dlaczego maksymalizuję prawdopodobieństwo (funkcja gęstości połączenia)? Dlaczego nie mogę zamiast tego zmaksymalizować sumy prawdopodobieństw wszystkich obserwacji (lub jakiejkolwiek innej funkcji)? Chciałbym znaleźć powód, dla którego wybrano funkcję gęstości połączenia. Wikipedia zaczyna się od użycia funkcji zagęszczenia połączenia. Ale czy istnieje powód, dla którego używamy funkcji gęstości połączeń? Właśnie to próbowałem zrozumieć.
RuiQi
@haziqRazali idea MLE polega na tym, aby wybrać szacunki, aby uzyskać próbkę, którą najprawdopodobniej podałeś. Stąd nazwa maksymalne prawdopodobieństwo
Repmat
1
@HaziqRazali Pytanie takie jak „dlaczego zmaksymalizować prawdopodobieństwo” to nowe pytanie (pytanie zadane i udzielone w innym miejscu na stronie)
Glen_b
3

Dlaczego nie dodać?

Ponieważ to wyraźnie nie ma sensu. Załóżmy, że masz ćwierć i nikiel i chcesz je obrócić. Istnieje 50% szans, że ćwiartka podejdzie do głowy, i 50% szansy, że nikiel się pojawi. Gdyby szansa na pojawienie się obu głów była sumą, dałoby to 100% szansy, co oczywiście jest błędne, ponieważ nie pozostawia szans na HT, TH i TT.

Dlaczego pomnażać?

Ponieważ to ma sens. Po pomnożeniu 50% szansy, że ćwiartka zbliża się do głów przez 50% szansy, że nikiel zbliży się do głów, otrzymujesz 0,5 x 0,5 = 0,25 = 25% szansy, że obie monety będą główkami. Biorąc pod uwagę, że istnieją cztery możliwe kombinacje (HH, HT, TH, HT) i każda jest równie prawdopodobna, to pasuje idealnie. Oceniając prawdopodobieństwo wystąpienia dwóch niezależnych zdarzeń, mnożymy ich indywidualne prawdopodobieństwa.

Monty Harder
źródło
2

Czytam te posty, ponieważ podobnie jak oryginalny plakat, muszę zrozumieć, dlaczego fn „ Prawdopodobieństwo ” jest „ produktem ” gęstości każdej wartości próbki - „ x ”. Czytelny i logiczny powód podany jest pod nagłówkiem Zasada największego prawdopodobieństwa Ref: [ http://www-structmed.cimr.cam.ac.uk/Course/Likelihood/likelihood.html] Kolejny cytat Matematyczne prawdopodobieństwo jest zdefiniowane jako prawdopodobieństwo wykonania zestawu pomiarów (to samo odniesienie). Krótko mówiąc, prawdopodobieństwo, że dotarłeś do próbki, którą masz pod ręką.

dżin
źródło
0

Celem metody największej wiarygodności jest znalezienie estymatora, który maksymalizuje prawdopodobieństwo zaobserwowania wartości pewnej zmiennej (endogenicznej). To jest powód, dla którego musimy pomnożyć prawdopodobieństwa wystąpienia.

Na przykład: wyobraź sobie, że liczba połączeń telefonicznych, które sekretarka może odebrać w ciągu godziny, jest zgodna z rozkładem Poissona. Następnie wyodrębniasz 2 wartości próbki (5 połączeń telefonicznych i 8 połączeń telefonicznych na godzinę). Teraz musisz odpowiedzieć na to pytanie. Jaka jest wartość parametru, która maksymalizuje prawdopodobieństwo jednoczesnego obserwowania 5 i 8 połączeń telefonicznych ?. Następnie spróbuj odpowiedzieć z prawdopodobieństwem zaobserwowania wszystkich wartości sam

Ze względu na niezależne zmienne losowe

f (y1 = 5 połączeń telefonicznych) * f (y2 = 8 połączeń telefonicznych) = ∏if (y, θ) = L (θ, y1, y2)

Na koniec spróbuj odpowiedzieć, prawdopodobieństwo zaobserwowania wszystkich wartości próbki.

Enzo Cabañas
źródło