Studiuję o oszacowaniu maksymalnego prawdopodobieństwa i czytam, że funkcja prawdopodobieństwa jest iloczynem prawdopodobieństwa każdej zmiennej. Dlaczego to jest produkt? Dlaczego nie suma? Próbowałem szukać w Google, ale nie mogę znaleźć żadnych sensownych odpowiedzi.
maximum-likelihood
RuiQi
źródło
źródło
80% + 75% = 155%
? jak o80% * 75% = 60%
?Odpowiedzi:
To bardzo podstawowe pytanie i zamiast używać formalnego języka i notacji matematycznej, postaram się na nie odpowiedzieć na poziomie, na którym każdy, kto rozumie pytanie, może również zrozumieć odpowiedź.
Wyobraź sobie, że mamy rasę kotów. Mają 75% prawdopodobieństwa urodzenia się na biało i 25% prawdopodobieństwa urodzenia się na szaro, bez innych kolorów. Ponadto mają one 50% prawdopodobieństwa posiadania zielonych oczu i 50% prawdopodobieństwa posiadania niebieskich oczu, a kolor sierści i kolor oczu są niezależne.
Spójrzmy teraz na miot ośmiu kociąt:
Zobaczysz, że 1 na 4, czyli 25%, jest szary. Ponadto 1 na 2 lub 50% ma niebieskie oczy. Teraz pytanie brzmi:
Możesz je policzyć, odpowiedź jest jedna. To znaczy lub 12,5% z 8 kociąt.14×12=18
Dlaczego tak się dzieje Ponieważ każdy kot ma szary 1 na 4 prawdopodobieństwo. Wybierz cztery koty i możesz oczekiwać, że jeden z nich będzie szary. Ale jeśli wybierzesz tylko cztery koty z wielu (i uzyskasz oczekiwaną wartość 1 szarego kota), ten, który jest szary, ma prawdopodobieństwo 1 na 2 posiadania niebieskich oczu. Oznacza to, że spośród wszystkich wybranych kotów najpierw pomnożymy sumę o 25%, aby uzyskać szare koty, a następnie pomnożymy wybrane 25% wszystkich kotów przez 50%, aby uzyskać te z niebieskimi oczami. Daje to prawdopodobieństwo wystąpienia szarych niebieskookich kotów.
Podsumowanie ich dałoby , co daje314+12 lub 6 na 8. Na naszym zdjęciu odpowiada to sumowaniu kotów o niebieskich oczach z kotami o szarym futrze - i liczeniu jednego szarego niebieskookiego kociaka dwa razy! Takie obliczenia mogą mieć swoje miejsce, ale są dość niezwykłe w obliczeniach prawdopodobieństwa i na pewno nie są to te, o które pytasz.34
źródło
źródło
Zatem jeśli przyjmiesz, że wszystkie twoje obserwacje są niezależne, prawdopodobieństwo zaobserwowania wszystkich wartości, które zobaczyłeś, jest równe iloczynowi poszczególnych prawdopodobieństw.
źródło
Dlaczego nie dodać?
Ponieważ to wyraźnie nie ma sensu. Załóżmy, że masz ćwierć i nikiel i chcesz je obrócić. Istnieje 50% szans, że ćwiartka podejdzie do głowy, i 50% szansy, że nikiel się pojawi. Gdyby szansa na pojawienie się obu głów była sumą, dałoby to 100% szansy, co oczywiście jest błędne, ponieważ nie pozostawia szans na HT, TH i TT.
Dlaczego pomnażać?
Ponieważ to ma sens. Po pomnożeniu 50% szansy, że ćwiartka zbliża się do głów przez 50% szansy, że nikiel zbliży się do głów, otrzymujesz 0,5 x 0,5 = 0,25 = 25% szansy, że obie monety będą główkami. Biorąc pod uwagę, że istnieją cztery możliwe kombinacje (HH, HT, TH, HT) i każda jest równie prawdopodobna, to pasuje idealnie. Oceniając prawdopodobieństwo wystąpienia dwóch niezależnych zdarzeń, mnożymy ich indywidualne prawdopodobieństwa.
źródło
Czytam te posty, ponieważ podobnie jak oryginalny plakat, muszę zrozumieć, dlaczego fn „ Prawdopodobieństwo ” jest „ produktem ” gęstości każdej wartości próbki - „ x ”. Czytelny i logiczny powód podany jest pod nagłówkiem Zasada największego prawdopodobieństwa Ref: [ http://www-structmed.cimr.cam.ac.uk/Course/Likelihood/likelihood.html] Kolejny cytat Matematyczne prawdopodobieństwo jest zdefiniowane jako prawdopodobieństwo wykonania zestawu pomiarów (to samo odniesienie). Krótko mówiąc, prawdopodobieństwo, że dotarłeś do próbki, którą masz pod ręką.
źródło
Celem metody największej wiarygodności jest znalezienie estymatora, który maksymalizuje prawdopodobieństwo zaobserwowania wartości pewnej zmiennej (endogenicznej). To jest powód, dla którego musimy pomnożyć prawdopodobieństwa wystąpienia.
Na przykład: wyobraź sobie, że liczba połączeń telefonicznych, które sekretarka może odebrać w ciągu godziny, jest zgodna z rozkładem Poissona. Następnie wyodrębniasz 2 wartości próbki (5 połączeń telefonicznych i 8 połączeń telefonicznych na godzinę). Teraz musisz odpowiedzieć na to pytanie. Jaka jest wartość parametru, która maksymalizuje prawdopodobieństwo jednoczesnego obserwowania 5 i 8 połączeń telefonicznych ?. Następnie spróbuj odpowiedzieć z prawdopodobieństwem zaobserwowania wszystkich wartości sam
Ze względu na niezależne zmienne losowe
f (y1 = 5 połączeń telefonicznych) * f (y2 = 8 połączeń telefonicznych) = ∏if (y, θ) = L (θ, y1, y2)
Na koniec spróbuj odpowiedzieć, prawdopodobieństwo zaobserwowania wszystkich wartości próbki.
źródło