Porównywanie 0/10 do 0/20

10

Czy omawiając wskaźniki realizacji zadań, można pokazać, że 0 na 20 prób jest „gorszych” niż 0 na 10 prób?

vinne
źródło
1
Możesz spróbować użyć en.wikipedia.org/wiki/Additive_smoothing, ale będzie raczej machać rękami niż solidnym dowodem
abukaj
Skąd wiesz, że jest gorzej? Np. Jeśli możliwe jest tylko 10 prób, nie wiesz, jaki byłby wynik przy większej liczbie prób.
Tim
4
Być może przedział ufności dla oszacowanej proporcji?
mdewey,
5
To wydaje mi się rozsądnym pytaniem. Opiera się na całkowicie normalnej intuicji, którą można omówić, i istnieją statystyczne sposoby (np. Bayesian) na rozwiązanie tego problemu. Głosuję za pozostawieniem otwartego.
Gung - Przywróć Monikę
1
Zgadzam się z @gung. To dobre pytanie.
Alexis,

Odpowiedzi:

3

Załóżmy, że znamy prawdopodobieństwo sukcesu w próbie. W tym przypadku obliczamy prawdopodobieństwo 0 na 10 i 0 na 20 przypadków.

Jednak w tym przypadku idziemy na odwrót. Nie znamy prawdopodobieństwa, mamy dane i staramy się oszacować prawdopodobieństwo.

Im więcej przypadków mamy, tym bardziej możemy być pewni wyników. Jeśli przerzucę monetę i będzie to głowa, nie będziecie pewni, że jest ona podwójna. Jeśli rzucę go 1000 razy, a będą to wszystkie głowy, jest mało prawdopodobne, aby był wyważony.

Istnieją metody, które zostały zaprojektowane w celu uwzględnienia liczby szlaków przy podawaniu oszacowań. Jednym z nich jest addytywne wygładzanie, które @abukaj komentuje powyżej. W wygładzaniu dodatkowym uwzględniamy dodatkowe pseudopróbki. W naszym przypadku zamiast szlaku, który widzieliśmy, dodajemy dwa kolejne - jeden udany, a drugi nieudany.

  • W pierwszym przypadku wygładzonym prawdopodobieństwem będzie = ~ 8,3% 11+010+1+1112
  • W drugim przypadku otrzymamy = ~ 4,5% 11+020+1+1122

Należy pamiętać, że wygładzanie addytywne jest tylko jedną metodą szacowania. Otrzymasz różne wyniki za pomocą różnych metod. Nawet przy samym wygładzaniu addytywnym uzyskałbyś różne wyniki, gdybyś dodał 4 pseudo próbki.

Inną metodą jest użycie przedziału ufności, jak sugeruje @mdewey. Im więcej próbek mamy, tym krótszy będzie przedział ufności. Rozmiar przedziału ufności jest proporcjonalny do pierwiastka kwadratowego z próbek - . Dlatego podwojenie liczby próbek spowoduje skrócenie przedziału ufności .1n2)

Średnia w obu przypadkach wynosi 0. Przyjmujemy poziom ufności 90% (z = 1,645)

  • W pierwszym przypadku otrzymamy 0 + ~ 52%1.64510
  • W drugim przypadku otrzymamy 0 + ~ 36%1.64520

W przypadku brakujących danych istnieje niepewność. Twoje założenia i dane zewnętrzne, które wykorzystasz, zmienią to, co otrzymasz.

DaL
źródło
1
Dziękuję bardzo Dan Levin. Twoja odpowiedź była na tyle jasna, że ​​podążył za nią nie-matematyk, a jednak wystarczająco mocna, abym intuicyjnie zaakceptował twoje wyjaśnienie. Dziękuję wszystkim komentującym za Twój wkład.
vinne
1

Rozszerzając ideę wywoływania przedziałów ufności, istnieje koncepcja dokładnego przedziału dwumianowego.

Rozkład dwumianowy to łączna liczba sukcesów w niezależnych próbach, które kończą się 0 (niepowodzenie) lub 1 (sukces). Prawdopodobieństwo uzyskania 1 (sukcesu) tradycyjnie oznacza się , a jego dopełnieniem jest . Zatem standardowy wynik prawdopodobieństwa jest taki, że prawdopodobieństwo dokładnie sukcesów w próbach wynosiq = 1 - p k npq=1-pkn

pn,k=(nk)pkqn-k=n!k!(n-k)!pkqn-k

Pojęcie przedziału ufności polega na powiązaniu zestawu możliwych wartości parametrów modelu (tutaj prawdopodobieństwa sukcesu ), abyśmy mogli wydawać twierdzenia probabilistyczne (cóż, częstokroć ) o tym, czy prawdziwa wartość parametru mieści się w tym przedziale (mianowicie , że jeśli powtórzymy eksperyment probabilistyczny polegający na wykonaniu 10 lub 20 prób i skonstruujemy przedział ufności w określony sposób, zauważymy, że prawdziwa wartość parametru mieści się w przedziale 95% czasu).p

W tym przypadku możemy rozwiązać dla w tej formule: p n , 0 = ( 1 - p ) np

pn,0=(1-p)n

Gdybyśmy chcieli 95% jednostronnego przedziału, ustawilibyśmy aby rozwiązać prawdopodobieństwo prawdopodobieństwa, że ​​zaobserwowana liczba zerowa wynosi co najwyżej 5%. Dla odpowiedź wynosi (tzn. Skrajnie, jeśli prawdopodobieństwo sukcesu w każdym badaniu wynosi 13,9%, wówczas prawdopodobieństwo zaobserwowania zerowych sukcesów wynosi 5%). Dla odpowiedzią jest . Tak więc z próbki dowiedzieliśmy się więcej niż z próbki , w tym sensie, że możemy `` wykluczyć '' zakres niż próbka nadal pozostawia jako prawdopodobne.pn,0=5%n=20[0%,13,9%]n=10[0%,25,9%]n=20n=10[13,9%,25,9%]n=10

StasK
źródło
0

Podejście bayesowskie

Funkcja prawdopodobieństwa to Bernoulliego, a rozkład Beta jest sprzężony przed rozkładem Bernoulliego, stąd tylny podąża za rozkładem Beta. Ponadto, tylny jest parametryzowany przez:

α^=α+ja=1nXjaβ^=β+n-ja=1nXja

W konsekwencji:

mi[pX1,,Xn]=α^α^+β^=α+ja=1nXjaα+β+n

Zatem jeśli zobaczysz 10 awarii, twoje oczekiwanie na to , a jeśli zobaczysz 20 awarii, twoje oczekiwanie na to . Im więcej awarii widzisz, tym niższe jest Twoje oczekiwanie na .pαα+β+10pαα+β+20p

Czy to rozsądny argument? Zależy to od tego, co sądzisz o statystykach bayesowskich, czy chcesz modelować niepewność w odniesieniu do niektórych parametrów stosując mechanikę prawdopodobieństwa. I zależy to od tego, jak rozsądny jest twój wybór przeora.p

Matthew Gunn
źródło