Jak modelować sumę zmiennych losowych Bernoulliego dla danych zależnych?

9

Mam prawie takie same pytania: Jak mogę skutecznie modelować sumę losowych zmiennych Bernoulliego?

Ale ustawienie jest zupełnie inne:

  1. S=i=1,NXi , , ~ 20, ~ 0,1P(Xi=1)=piNpi

  2. Mamy dane dotyczące wyników zmiennych losowych Bernoulliego: ,Xi,jSj=i=1,NXi,j

  3. Jeśli oszacujemy z oszacowaniem maksymalnego prawdopodobieństwa (i uzyskamy ), okaże się, że jest znacznie większy niż oczekiwane według innych kryteriów:pip^iMLEP^{S=3}(p^iMLE)P^{S=3}(p^iMLE)P^expected{S=3}0.05

  4. Tak więc i nie mogą być traktowane jako niezależne (mają małą zależność).XiXj (j>k)

  5. Istnieje kilka takich ograniczeń: i (znane), które powinny pomóc w oszacowaniu .pi+1pis2P^{S=s}=AP{S}

Jak moglibyśmy spróbować modelować sumę losowych zmiennych Bernoulliego w tym przypadku?

Jaka literatura może być przydatna do rozwiązania zadania?

AKTUALIZACJA

Istnieje kilka innych pomysłów:

(1) Można założyć, że nieznana zależność między Xizaczyna się po 1 lub więcej sukcesach w serii. Więc kiedyi=1,KXi>0, pK+1pK+1 i pK+1<pK+1.

(2) Aby korzystać z MLE, potrzebujemy najmniej wątpliwego modelu. Oto wariant:

P{X1,...,Xk}=(1p1)...(1pk)if dla dowolnego k i=1,kXi=0P{X1,...,Xk,Xk+1,...,XN}=(1p1)...pkP{Xk+1,...,XN} jeślii=1,k1Xi=0i , a dla dowolnego k.Xk=1P{Xk+1=1,Xk+2=1,...,XN=1}pk+1pk+2...pN

(3) Ponieważ interesujemy się tylko , możemy ustawić (prawdopodobieństwo sukcesów dla sum N- (k + 1) +1 od ogona). I użyj parametryzacjiP{S}P{Xk+1,...,XN}P{i=1,kXi=s;N(k+1)+1=l}i=k+1,NXiP{i=k,NXi=s;Nk+1=l}=ps,l

(4) Użyj MLE dla modelu opartego na parametrach i z dla (i dowolnego ) oraz niektórych innych ograniczeń natywnych .p1,...,pNp0,1,p1,1;p0,2,p1,2,p2,2;...ps,l=0s6l

Czy wszystko jest w porządku z tym planem?

AKTUALIZACJA 2

Niektóre przykłady rozkładu empirycznego (czerwony) w porównaniu z rozkładem Poissona (niebieski) (średnie Poissona to 2,22 i 2,45, rozmiary próbek to 332 i 259):P{S}

próbka 1 próbka 2

Dla próbek (A1, A2) ze środkami Poissona 2.28 i 2.51 (wielkości próbek wynoszą 303 i 249):

próbka 3 próbka 4

W przypadku połączonych próbek A1 + A2 (wielkość próby wynosi 552):

próbka 3 + próbka 4

Wygląda na to, że poprawka Poissona powinna być najlepszym modelem :).

Andrey
źródło
2
Co to jest ? Xi,j
chl
1
@Andrey Wzory w (2) i drugie ograniczenie w (4) nie mają sensu: co oznaczają czapki w (4)? Co to jest ? (Zdefiniowałeś tylko , nie ) Czy wyrażenie w (4) jest sumą trzech produktów, czy czegoś innego? SSjS
whuber
Xi,j to losowe wyniki Bernoulliego (i-ty wynik w j-tej serii), to j-ty wynik sumy (suma nad serią). jest losową zmienną sumy; Czapki w (4) oznaczają szacunki. Więc jest jakaś dodatkowa informacja o sumę najniższych wartościach . Przepraszam za zamieszanie. SjSS
Andrey

Odpowiedzi:

3

Jednym podejściem byłoby modelowanie za pomocą uogólnionego modelu liniowego (GLM). W tym przypadku sformułujesz , prawdopodobieństwo sukcesu w próbie jako funkcję (logistyczną liniową) najnowszej historii obserwacji. Więc zasadniczo dopasowujesz autoregresyjny GLM, w którym szum to Bernoulli, a funkcja link jest logit. Konfiguracja jest następująca:Xpii

pi=f(b+a1Xi1+a2Xi2+akXik) , gdzie

f(x)=11+exp(x) i

XiBernoulli(pi)

Parametry modelu to , które można oszacować za pomocą regresji logistycznej. (Wszystko, co musisz zrobić, to skonfigurować macierz projektową przy użyciu odpowiedniej części historii obserwacji na każdej próbie i przekazać ją do funkcji szacowania regresji logistycznej; prawdopodobieństwo logarytmiczne jest wklęsłe, więc istnieje unikalne globalne maksimum dla parametrów). Jeżeli wyniki są rzeczywiście niezależne, wówczas wartości zostaną ustawione na zero; dodatnie oznacza, że ​​kolejne wzrastają za każdym razem, gdy obserwuje się sukces.{b,a1,ak}aiaipi

Model nie zapewnić ekspresję proste dla prawdopodobieństwa nad sumy z jest, ale jest łatwo obliczyć na podstawie symulacji (filtr cząsteczek lub MCMC), ponieważ model ten prosty Markowian strukturę.Xi

Ten rodzaj modelu z dużym powodzeniem wykorzystano do modelowania zależności czasowych między „skokami” neuronów w mózgu i istnieje obszerna literatura na temat autoregresywnych modeli procesów punktowych. Patrz np. Truccolo i in. 2005 (chociaż w tym dokumencie wykorzystano Poissona zamiast prawdopodobieństwa Bernoulliego, ale mapowanie między nimi jest proste).

jpillow
źródło
1

Jeśli zależność jest spowodowana zbijaniem, złożonym modelem Poissona może być rozwiązanie jako model Sj. Nieco przypadkowym odniesieniem jest ten autorstwa Barbour i Chryssaphinou.

W zupełnie innym kierunku, skoro to wskazujesz N wynosi 20, a zatem względnie mały, można zbudować model graficzny Xij, ale nie wiem, czy Twoja konfiguracja i dane to umożliwiają. Jak komentuje @chl, przydatne będzie opisanie tego, coXi,jsą.

Jeśli… Xi,jreprezentują sekwencyjne pomiary, np. w czasie, i zależność jest z tym związana, trzecią możliwością - i do pewnego stopnia kompromisem między dwiema powyższymi sugestiami - jest zastosowanie ukrytego modelu Markowa Xi,j„s.

NRH
źródło
Xi,jsą losowymi wynikami Bernoulliego. Przepraszamy za niedokładność. Więc,Xisą sumą wyników drużyn sportowych za sekwencyjne równe przedziały czasu. Okazuje się, że po zdobyciu pierwszego gola prawdopodobieństwo kolejnego gola w przedziale będzie inne.
Andrey