Szacowanie prawdopodobieństwa sukcesu na podstawie populacji odniesienia

11

Załóżmy, że masz następującą sytuację:

Z biegiem czasu zaobserwowałeś 1000 graczy w kręgle, którzy grali w stosunkowo niewielką liczbę gier (powiedzmy od 1 do 20). Zanotowałeś procent uderzeń dla każdego z tych graczy w stosunku do liczby gier, w które każdy z nich grał.

Wchodzi nowy gracz w kręgle, który gra w 10 gier i otrzymuje 3 uderzenia.

Zakłada się, że rozkład liczby uderzeń dla dowolnego gracza jest dwumianowy.

Chcę oszacować „prawdziwe” prawdopodobieństwo sukcesu dla tego gracza.

Proszę zwrócić uwagę na następujące kwestie:

  1. To nie jest prawdziwa sytuacja ani problem szkolny, tylko problem z samoświadomością.
  2. Jestem studentem z wykształceniem statystycznym niewiele wyższym niż kurs Stats 101. Wiem trochę o wnioskowaniu, takim jak oszacowanie maksymalnego prawdopodobieństwa ... Więc śmiało powiedz mi obszary w statystykach, o których powinienem przeczytać.
  3. Mój problem może nie zawierać informacji lub jeśli byłoby korzystne, powiedzmy, rozkład prawdopodobieństwa sukcesu w przybliżeniu normalny, proszę o informację.

Dziękuję Ci bardzo

Uwat
źródło
Jak myślisz, jaki jest związek między prawdopodobieństwem tego gracza a prawdopodobieństwem każdego z pozostałych 1000 graczy? Innymi słowy, dlaczego w ogóle mielibyśmy brać pod uwagę pozostałe 1000 przy szacowaniu prawdopodobieństwa tego gracza?
rolando2
1
Zakładam, że prawdziwy procent uderzeń gracza jest zasadniczo realizacją tego samego rozkładu procentów uderzeń jak 1000 innych graczy. Innymi słowy, w tym nowym graczu nie ma nic specjalnego, to tylko kolejny losowy gracz. Mam nadzieję, że to ma sens.
Uwat

Odpowiedzi:

10

Jest to świetny przykład ilustrujący różnicę między podejściem częstym a bayesowskim do wnioskowania.

Moja pierwsza, uproszczona odpowiedź częstokroć: jeśli już założyłeś, że rozkład strajków jest dwumianowy, nie musisz nic wiedzieć o pozostałych 1000 graczach (poza być może możesz użyć ich do sprawdzenia twojego dwumianowego założenia).

Po oczyszczeniu założenia dwumianowego twoje oszacowanie jest bardzo proste: 3/10. Wariacją tego oszacowania jest zwykle p (1-p) / n = 0,021.

Zasadniczo 1000 innych graczy nie ma znaczenia, chyba że uważasz, że jest coś interesującego i nie dwumianowego w dystrybucji strajków (np. Ludzie stają się lepsi, gdy grają w więcej gier).

Bardziej przemyślany bayesowski sposób patrzenia na to: Alternatywnie, jeśli jesteś zainteresowany zastosowaniem wcześniejszej wiedzy od innych graczy i uważasz, że nowy gracz jest w zasadzie nową próbką z tej samej populacji, powinieneś pomyśleć o tym w bayesowskim warunki .

Oszacuj wcześniejszą dystrybucję graczy. Aby to zrobić, musisz spojrzeć na swoje 1000 punktów danych - 1000 obserwowanych już graczy, dla każdego z nich masz oszacowane prawdopodobieństwo ich wykonania. Każdy z tych 1000 punktów może przyjąć tylko jedną z 21 wartości (od zera do dwudziestu uderzeń z dwudziestu), a zobaczysz rozkład na całym polu. Jeśli przekonwertujesz te wyniki na proporcje (tj. Od zera do jednego), ten rozkład może być prawdopodobnie dość dobrze przybliżony przez rozkład prawdopodobieństwa zmiennej losowej o rozkładzie Beta. Dystrybucja beta w pełni charakteryzuje się tylko dwoma parametrami - powiedzmy a i b - ale ponieważ parametry te nie mają tak naprawdę związku z rozkładem, o który nas pytałeś (prawdopodobieństwo konkretnego gracza o strajku), ale rozkładem wyższego poziomu nazywaj je hiperparametrami. Możesz opracować oszacowania tych hiperparametrów na podstawie 1000 punktów danych na jeden z wielu sposobów, które tak naprawdę nie są istotne dla głównego punktu pytania.

Zanim w ogóle będziesz mieć jakiekolwiek informacje o swoim graczu, twoje najlepsze przypuszczenie co do jego / jej udziału w zdobywaniu uderzenia (nazwijmy to p) będzie po prostu najbardziej prawdopodobną wartością p z rozkładu Beta, który właśnie dopasowaliśmy.

Mamy jednak dane dotyczące naszego gracza, nie tylko ogólnej populacji! W Bogu ufamy, wszyscy inni muszą przynieść dane (przypisałbym ten cytat, gdybym pamiętał, gdzie go znalazłem, przepraszam). Za każdym razem, gdy obserwujemy, jak nasz gracz gra w grę i otrzymuje ostrzeżenie, czy nie, otrzymujemy nowe informacje, które pozwolą nam precyzyjnie oszacować jego proporcje.

Jedną z ciekawych rzeczy na temat rozkładu beta jako rozkładu prawdopodobieństwa dla proporcji jest to, że kiedy zbieramy nowe informacje z danych i tworzymy nowe, ulepszone oszacowanie proporcji, teoria prawdopodobieństwa może wykazać, że nowe, ulepszone oszacowanie jest również beta dystrybucja - tylko bardziej skoncentrowana wersja. Wynika to z tego, że rozkład beta jest wcześniej określany jako koniugat podczas próby oszacowania modelu dwumianowego.

To znaczy, jeśli obserwujemy z spośród udanych zdarzeń (w tym przypadku gry ze strajkami); a poprzednia dystrybucja była beta (a, b); rozkład tylny (jest oszacowaniem rozkładu prawdopodobieństwa p, biorąc pod uwagę zarówno pierwotne 1000 punktów danych i są nową obserwacją dziesięciu gier), to beta (a + z, b + nz) lub (w naszym przypadku) beta (a + 3, b + 7). Jak widać, im więcej danych otrzymasz, tym mniej ważne są wartości a i b. Matematyka tego jest dość prosta i w wielu tekstach, ale nie tak interesująca (w każdym razie dla mnie).

Jeśli masz R, możesz zobaczyć przykład, uruchamiając poniższy kod (a jeśli nie masz R, powinieneś go zdobyć - jest bezpłatny i jest niesamowity, ponieważ pomaga w rozwiązywaniu tego rodzaju problemów). Zakłada się, że wcześniejszą dystrybucję graczy można modelować w wersji beta (2,5) - właśnie to wymyśliłem. W rzeczywistości istnieją sposoby, które pozwalają lepiej oszacować liczby dla aib, niż tylko uzupełnienie 2 i 5, ponieważ myślę, że krzywa wygląda dobrze.

Jak zobaczysz, jeśli uruchomisz ten stylizowany przykład, oszacowanie punktowe prawdopodobieństwa trafienia gracza przez gracza, biorąc pod uwagę wcześniejszy rozkład beta (2,5), wynosi 0,29 zamiast 0,30. Możemy również stworzyć przedział wiarygodności, który jest szczerze mówiąc bardziej intuicyjny i łatwiejszy do wyjaśnienia niż przedział ufności (zobacz wiele pytań i dyskusji w Internecie na temat różnicy między nimi, w tym na temat CrossValidated).

plot(0:100/100,dbeta(0:100/100,2,5), type="l", ylim=c(0,4), bty="l")
lines(0:100/100,dbeta(0:100/100,2+3,5+7), type="l", lty=2)
legend(0.6,3.5,c("Posterior distribution", "Prior distribution"), 
    lty=2:1, bty="n")
qbeta(c(0.025, 0.975), 2, 5) # credibility interval prior to any new data
qbeta(c(0.025, 0.975), 2+3, 5+7) # credibility interval posterior to data
qbeta(0.5, 2+3, 5+7) # point estimate of p, posterior to data

Następnie obserwuj swojego nowego gracza; i obliczyć nowy rozkład boczny dla nowego gracza. Skutecznie mówi to: „biorąc pod uwagę to, co właśnie zaobserwowaliśmy, gdzie według rozkładu graczy według nas ta osoba najprawdopodobniej będzie?”

Peter Ellis
źródło
2
Nie sądzę, żeby to było poprawne. Załóżmy, że zdecydowana większość (99%) osób spośród 1000 osób ma odsetek strajków od 5% do 15%, a garstka ma odsetki strajków wyższe niż 25%. Następnie twierdziłbym, że bardziej prawdopodobne jest, że nowy gracz, którego zaobserwowaliśmy, ma prawdziwy procent uderzeń niższy niż 30%, ale po prostu „miał szczęście”.
Uwat
ok, dobra uwaga - dodałem edycję, aby uwzględnić tę sytuację. Zasadniczo masz dobre stwierdzenie problemu wnioskowania bayesowskiego.
Peter Ellis,
@Peter - wszystko ładnie argumentowane.
rolando2
Dziękuję za odpowiedź. Nie do końca jednak rozumiem, co masz na myśli: „potrzebujesz faktycznego rozkładu wskaźników strajków poszczególnych osób, który prawdopodobnie będzie jakimś rodzajem Beta”. Czy możesz wyjaśnić to trochę? Dzięki
Uwat
Dzięki, naprawdę dobre pytanie, w odpowiedzi znacznie poszerzyłem swoją odpowiedź.
Peter Ellis