Formuła prawdopodobieństwa dla rozkładu wielowymiarowego-bernoulli

13

Potrzebuję wzoru na prawdopodobieństwo zdarzenia w n-zmiennym rozkładzie Bernoulliego przy danych prawdopodobieństwa dla pojedynczego elementu i dla par elementów . Równoważnie mogę dać średnią i kowariancji .X{0,1}n P ( X i = 1 X j = 1 ) = p i j XP(Xi=1)=piP(Xi=1Xj=1)=pijX

Dowiedziałem się już, że istnieje wiele rozkładów posiadających właściwości, podobnie jak wiele rozkładów posiadających podaną średnią i kowariancję. Szukam kanonicznego na , podobnie jak Gaussian jest rozkładem kanonicznym dla oraz danej średniej i kowariancji. { 0 , 1 } n R n{0,1}n{0,1}nRn

mpiktas
źródło

Odpowiedzi:

11

Zmienna losowa przyjmująca wartości w jest dyskretną zmienną losową. Jego rozkład jest w pełni opisany prawdopodobieństwami z . Podane prawdopodobieństwa i są sumami dla niektórych indeksów .p i = P ( X = i ) i{ 0 , 1 } n p i p i j p i i{0,1}npi=P(X=i)i{0,1}npipijpii

Teraz wydaje się, że chcesz opisać , używając tylko i . Nie jest to możliwe bez przyjęcia pewnych właściwości na . Aby zobaczyć, które próbują czerpać charakterystycznej funkcji z . Jeśli weźmiemy , otrzymamy p i p i j p i n = 3pipipijpiXn=3

p i X

Eei(t1X1+t2X2+t3X3)=p000+p100eit1+p010eit2+p001eit3+p110ei(t1+t2)+p101ei(t1+t3)+p011ei(t2+t3)+p111ei(t1+t2+t3)
Nie można zmienić kolejności tego wyrażenia, aby zniknął. Dla losowej zmiennej gaussowskiej funkcja charakterystyczna zależy tylko od parametrów średniej i kowariancji. Funkcje charakterystyczne jednoznacznie definiują rozkłady, dlatego Gaussa można opisać w unikalny sposób, stosując jedynie średnią i kowariancję. Jak widzimy dla losowej zmiennej tak nie jest.piX

 

mpiktas
źródło
10

Zobacz następujący artykuł:

JL Teugels, Niektóre reprezentacje wielowymiarowych rozkładów Bernoulliego i dwumianowych , Journal of Multivariate Analysis , obj. 32, nr 2, luty 1990, 256–268.

Oto streszczenie:

Wersje wielowymiarowe, ale wektoryzowane dla rozkładów Bernoulliego i dwumianowych są tworzone przy użyciu koncepcji produktu Kroneckera z rachunku macierzowego. Wielowymiarowy rozkład Bernoulliego obejmuje sparametryzowany model, który stanowi alternatywę dla tradycyjnego modelu logarytmiczno-liniowego dla zmiennych binarnych.

Hamed
źródło
2
Dziękuję za podzielenie się tym, Hamed. Witamy na naszej stronie!
whuber
1

Nie wiem, jak nazywa się wynikowa dystrybucja, a nawet jeśli ma ona nazwę, ale uderza mnie oczywisty sposób na skonfigurowanie tego, aby pomyśleć o modelu, którego użyłbyś do modelowania 2 × 2 × 2 × … × 2 tabela z wykorzystaniem modelu logarytmiczno-liniowego (regresja Poissona). Jak wiadomo tylko interakcje pierwszego rzędu, naturalne jest założenie, że wszystkie interakcje wyższego rzędu są zerowe.

Używając notacji pytającego, daje to model:

P(X1=x1,X2=x2,,Xn=xn)=i[pixi(1pi)1xij<i(pijpipj)xixj]
jeden przystanek
źródło
Ta formuła ma problemy z notacją: po lewej i po prawej są litery „ ”. Prawa strona w ogóle nie odwołuje się do indeksu dolnego . Co więcej, wciąż interpretując jako prawdopodobieństwa (jak w pierwotnym pytaniu), rhs wyraźnie jest dodatni, podczas gdy lhs nie może być dodatni. pipi
whuber
@whuber Całkiem słusznie! Trzymam się modelu, który przedstawiłem w pierwszym akapicie, ale moje równanie zostało spreparowane na kilka sposobów ... Pokazuje, że tak naprawdę nie używałem logarytmicznego modelowania tabel kontyngencji od czasu mojego magistra i nie Mam pod ręką notatki lub książki. Myślę jednak, że teraz to naprawiłem. Daj mi znać, jeśli się zgadzasz! Apele za opóźnienie. Czasami mój mózg po prostu nie robi algebry.
onestop
1
Nie sądzę, że to działa. Załóżmy a . Jest to ważne, kombinacja prawdopodobieństw realizowanych podczas jest jednorodną zmienną losową i i wszystkie . Nadal powyższa formuła wynosiłaby 0 dla wszystkich zdarzeń. Wciąż dziękuję za pomoc! t i j = 0 i j I { 1 , . . . , n } X I = 1 X j = 0 j Ipi=1/npij=0ijI{1,...,n}XI=1Xj=0jI