Estymator dla rozkładu dwumianowego

12

Jak definiujemy estymator dla danych pochodzących z rozkładu dwumianowego? W przypadku bernoulli mogę myśleć o estymatorze szacującym parametr p, ale w przypadku dwumianu nie widzę, jakie parametry należy oszacować, gdy n charakteryzuje rozkład.

Aktualizacja:

Przez estymator rozumiem funkcję obserwowanych danych. Estymator służy do oszacowania parametrów rozkładu generującego dane.

Rohit Banga
źródło
Co rozumiesz przez „estymator”? Zastanawiam się nad tym, ponieważ estymatory nie mają „parametrów”. Martwi mnie to, że nie przekazujesz jasno swojego pytania. Może możesz podać konkretny przykład rzeczywistej sytuacji, którą rozważasz.
whuber
@whuber dodał więcej informacji. daj mi znać, jeśli chcesz, żebym dodał więcej szczegółów lub jeśli moje zrozumienie jest wadliwe.
Rohit Banga,
Edycja jest poprawna, ale konkretny przykład nadal by pomógł. W wielu zastosowaniach rozkładu dwumianowego nie jest parametrem: jest podane, a jest jedynym parametrem, który można oszacować. Na przykład liczba sukcesów w niezależnych identycznie rozmieszczonych próbach Bernoulliego ma rozkład dwumianowy ( , ), a jednym estymatorem jedynego parametru jest . p k n n p p k / nnpknnppk/n
whuber
2
Bardzo chciałbym zobaczyć przykład, nawet wymyślony, oszacowania zarówno jak i (w ustawieniach częstych). Pomyśl o tym: obserwujesz pojedynczą liczbę, k , powiedzmy . Oczekujemy, że przybliżeniu równe . Czy zatem szacujemy, że , ? A może , ? Czy prawie coś jeszcze? :-) Czy sugerujesz, że możesz mieć serię niezależnych obserwacji wszystkie ze wspólnego rozkładu dwumianowego z ip k = 5 k n p n = 10 p = 0,5 n = 5000 p = 0,001 k 1 , k 2 , , k m ( n , p ) p nnpk=5knpn=10p=0.5n=5000p=0.001k1,k2,,km(n,p)pnnieznany?
whuber
1
Sugeruję to drugie - zarówno p, jak i n są nieznane. Chcę estymatora zarówno dla ip, jak i funkcji N obserwowanych punktów danych.
Rohit Banga,

Odpowiedzi:

1

Każda dystrybucja ma jakieś nieznane parametry. Na przykład w rozkładzie Bernoulliego ma jeden nieznany parametr prawdopodobieństwo sukcesu (p). Podobnie w rozkładzie dwumianowym ma dwa nieznane parametry n i p. Zależy to od celu, którego nieznany parametr chcesz oszacować. możesz naprawić jeden parametr, a drugi oszacowanie. Aby uzyskać więcej informacji, zobacz to

statystyki miłości
źródło
Co jeśli chcę oszacować oba parametry?
Rohit Banga,
1
Aby oszacować maksymalne prawdopodobieństwo, musisz pobrać pochodną funkcji prawdopodobieństwa w odniesieniu do zainteresowanych parametrów (parametrów) i zrównać to równanie do zera, i rozwiązać równanie. Mam na myśli, że procedura jest taka sama jak podczas szacowania „p”. Musisz zrobić to samo z 'n'. sprawdź to www.montana.edu/rotella/502/binom_like.pdf
love-stats
@love Twoje referencje szacują tylko , przyjmując za ustalone. N.pN
whuber
-1 @ love-stats Na przykład sytuacji, w której funkcja pochodna funkcji prawdopodobieństwa, zrównanie jej do itd. Nie działa , zobacz tę próbę i prawidłowe rozwiązanie0
Dilip Sarwate
1

Powiedzmy, że masz dane .k1,,kmiid binomial(n,p)

Można łatwo dryfu metoda-of-moment estymatory przez ustawienie i i rozwiązując i .k¯=n^p^n tsk2=n^p^(1p^)n^p^

Lub możesz obliczyć MLE (być może tylko liczbowo), np. Używając optimR.

Karl
źródło
Okazuje się, że MLE są naprawdę okropne dla są tendencyjne i niezwykle zmienne, nawet przy dużych próbkach. Po części nie badałem estymatorów MM, ponieważ często nie są nawet zdefiniowane (za każdym razem, gdy ). a 2 / ˉ K > 1p<1/2s2/k¯>1
whuber
@ whuber - nie poprosił o dobry estymator. ;)
Karl
1
Dlaczego więc nie zaproponować = 17 i bez względu na wszystko? :-) Ale masz rację: pytanie nawet nie określa, co należy oszacować. Jeśli potrzebujemy tylko estymatora dla , To jest oczywisty dobry dostępny. s =1/2ntn^p^=1/2)np
whuber
@whuber - Rzeczywiście. I nie zdziwiłbym się, gdybym znalazł dla MLE. n^maxkja
Karl
Zgadza się: zwłaszcza, gdy jest bliskie , maksimum zliczeń to MLE. W takich przypadkach działa całkiem dobrze, jak można sobie wyobrazić. W przypadku mniejszego , nawet przy dużej ilości danych, trudno jest odróżnić to od rozkładu Poissona, dla którego jest faktycznie nieskończone, co prowadzi do ogromnej niepewności w oszacowaniu . 1 p n np1pnn
whuber
0

Myślę, że moglibyśmy zastosować metodę estymacji momentów do oszacowania parametrów rozkładu dwumianowego za pomocą średniej i wariancji.


Zastosowanie metody estymacji momentów do oszacowania Parametry i . [{\ hat {p}} _ n = \ frac {\ overline {X} -S ^ 2} {\ overline {X}}] [\ hat {m} _n = \ frac {\ overline {X} ^ 2} {\ overline {X} -S ^ 2}] Dowód Estymatory parametrów i za pomocą metody momentów są rozwiązaniami układu równań Stąd nasze równania dla metody momentów są następujące: [\ overline {X} = mp] [S ^ 2 = mp (1-p).]pmmp

mp=X¯,mp(1-p)=S.2).

Prosta arytmetyka: [S ^ 2 = mp \ left (1 - p \ right) = \ bar {X} \ left (1 - p \ right)] [S ^ 2 = \ bar {X} - \ bar {X } p] [\ bar {X} p = \ bar {X} -S ^ 2, \ mbox {zatem} \ hat {p} = \ frac {\ bar {X} -S ^ 2} {\ bar {X }}.] Następnie, [\ bar {X} = mp, \ mbox {to znaczy} m \ left (\ frac {\ bar {X} -S ^ 2} {\ bar {X}} \ right)] [\ bar {X} = m \ left (\ frac {\ bar {X} -S ^ 2} {\ bar {X}} \ right), \ mbox {lub} \ hat {m} = \ frac {\ pasek {X} ^ 2} {\ bar {X} -S ^ 2}. ]

Salma
źródło
1
Byłoby dobrze, gdybyś mógł to rozwinąć, na przykład pisząc wzór na estymator MoM. W przeciwnym razie odpowiedź nie jest samodzielna; inni (którzy jeszcze nie znają odpowiedzi) będą musieli szukać w Internecie „metody chwil” itp., dopóki nie znajdą prawdziwej odpowiedzi.
kusznik
czy istnieje sposób, aby poprawnie wyrenderować matematykę?
David Refaeli,