Ujemny rozkład dwumianowy vs rozkład dwumianowy

22

Jaka jest różnica między ujemnym rozkładem dwumianowym a rozkładem dwumianowym?

Próbowałem czytać online i odkryłem, że ujemny rozkład dwumianowy jest używany, gdy punkty danych są dyskretne, ale myślę, że nawet rozkład dwumianowy można zastosować do dyskretnych punktów danych.

alily
źródło
5
zarówno dyskretne.
Glen_b
5
Prosta ilustracja: sprzedajesz cukierki od drzwi do drzwi. Przy każdych drzwiach, które zapukasz, masz prawdopodobieństwo 1/4 sprzedaży 1 batonika i prawdopodobieństwo 3/4 lub sprzedaży 0 batonów. Twoje prawdopodobieństwo sprzedaży n sztabek, jeśli zapukasz do 50 drzwi, jest rozkładem dwumianowym w n. Twoje prawdopodobieństwo pukania do drzwi m w celu sprzedaży 30 prętów jest ujemnym rozkładem dwumianowym wm. Zauważ, że ta pierwsza odcina się od 50, ponieważ nie możesz sprzedać więcej niż 50 barów, podczas gdy druga ma ogon w nieskończoności, ponieważ możesz mieć po prostu okropne szczęście tego dnia i nigdy nie sprzedać 30 baru.
Jerry Guern,

Odpowiedzi:

30

Różnica jest tym, czym jesteśmy zainteresowani. Oba rozkłady zbudowane są z niezależnych prób Bernoulliego ze stałym prawdopodobieństwem sukcesu, str .

Przy rozkładzie dwumianowym zmienna losowa X jest liczbą sukcesów zaobserwowanych w n próbach. Ponieważ istnieje stała liczba prób, możliwe wartości X to 0, 1, ..., n .

Przy ujemnym rozkładzie dwumianowym zmienna losowa Y jest liczbą prób do momentu zaobserwowania r- tego sukcesu. W tym przypadku, wciąż zwiększając liczbę prób, aż docieramy r sukcesy. Możliwe wartości Y to r , r + 1 , r + 2 , ... bez górnej granicy. Ujemny dwumian można również zdefiniować w kategoriach liczby awarii do r- tego sukcesu, zamiast liczby prób do r- tego sukcesu. Wikipedia definiuje w ten sposób ujemny rozkład dwumianowy.

Podsumowując:

Dwumianowy :

  • Naprawiono liczbę prób ( n )
  • Naprawiono prawdopodobieństwo sukcesu ( p )
  • Zmienna losowa to X = liczba sukcesów.
  • Możliwe wartości to 0 ≤ Xn

Ujemny dwumianowy :

  • Naprawiono liczbę sukcesów ( r )
  • Naprawiono prawdopodobieństwo sukcesu ( p )
  • Zmienna losowa to Y = liczba prób aż do r- tego sukcesu.
  • Możliwe wartości to rY

Podziękowania dla Bena Bolkera za przypomnienie mi o wsparciu dla dwóch dystrybucji. Odpowiedział na powiązane pytanie tutaj .

Jelsema
źródło
4
więcej omówienie NB tutaj: stats.stackexchange.com/questions/6728/... . Warto zauważyć, że odpowiedzi dwumianowe są ograniczone [0, N], odpowiedzi NB są nieograniczone [0, ...]
Ben Bolker,
Dobrze, zaktualizowałem swoją odpowiedź, aby ją uwzględnić.
Jelsema,
dzięki jelsema za szczegółową odpowiedź, teraz mogłem to lepiej zrozumieć
alily
19

Ujemny rozkład dwumianowy, pomimo pozornie oczywistego związku z dwumianem, jest w rzeczywistości lepszy w porównaniu z rozkładem Poissona. Wszystkie trzy są dyskretne, przy okazji.

λλ

Jeśli twoje dane sugerują, że wariancja jest większa niż średnia (nadmierna dyspersja), wyklucza to Poissona, to dwumian ujemny byłby kolejnym rozkładem do obejrzenia. Ma więcej niż jeden parametr, więc jego wariancja może być większa niż średnia.

Relacja NB do dwumianu pochodzi z procesu leżącego u podstaw, jak opisano w odpowiedzi @ Jelsemy. Proces jest powiązany, więc rozkłady również są, ale jak wyjaśniłem tutaj, związek z rozkładem Poissona jest bliższy w praktycznych zastosowaniach.

AKTUALIZACJA: Kolejnym aspektem jest parametryzacja. Rozkład dwumianowy ma dwa parametry: p i n. Jego domena bona fide ma wartość od 0 do n. W tym jest nie tylko dyskretny, ale także zdefiniowany na skończonym zbiorze liczb.

λn

Aksakal
źródło
3
Nie rozumiem, co masz na myśli przez „lepiej w porównaniu z rozkładem Poissona”. Pierwotne pytanie nie mówi, jaki rodzaj modelowania jest pożądany. Nie oznacza to nawet, że w ogóle interesuje się modelowaniem.
heropup
@heropup, OP jest wyraźnie zainteresowany aplikacjami i bezpośrednio porównuje NB z Binomial. Dlatego moja odpowiedź dotyczy tego porównania, a to porównanie z Poissonem jest bardziej odpowiednie w typowych zastosowaniach.
Aksakal
7

Są zarówno dyskretne, jak i reprezentują liczby podczas próbkowania.

reN.S.=(rerere,rereN.,reN.re,reN.N.,N.rere,N.reN.,N.N.re,N.N.N.)

S.=(re,N.re,N.N.re,N.N.N.re,...)

p

Bahgat Nassour
źródło