Upraszczam pytanie badawcze, które mam w pracy. Wyobraź sobie, że mam 5 monet i zadzwońmy do głów sukcesu. Są to BARDZO stronnicze monety z prawdopodobieństwem sukcesu p = 0,1. Teraz, gdy monety były niezależne, to prawdopodobieństwo uzyskania co najmniej 1 lub więcej głowy jest bardzo prosta, . W moim scenariuszu moje próby Bernoulliego (rzuty monetą) nie są niezależne. Jedyne informacje, do których mam dostęp, to prawdopodobieństwo sukcesu (każda z nich to p = .1) i teoretyczne korelacje Pearsona między zmiennymi binarnymi.
Czy jest jakiś sposób, aby obliczyć prawdopodobieństwo jednego sukcesu lub więcej tylko dzięki tej informacji? Staram się unikać podejścia opartego na symulacji, ponieważ te teoretyczne wyniki zostaną wykorzystane do ustalenia dokładności badania symulacyjnego. Przyglądałem się wielowymiarowemu rozkładowi Bernoulliego, ale nie sądzę, że mogę go w pełni określić tylko za pomocą korelacji i marginalnych prawdopodobieństw sukcesu. Mój przyjaciel zalecił skonstruowanie kopuły Gaussa z marginalami bernoulli (używając pakietu R copula
), a następnie użycie pMvdc()
funkcji na dużej próbce, aby uzyskać prawdopodobieństwo, którego chcę, ale nie jestem pewien, jak sobie z tym poradzić.
Odpowiedzi:
Nie, jest to niemożliwe, gdy masz trzy lub więcej monet.
Przypadek dwóch monet
Zobaczmy najpierw, dlaczego działa dla dwóch monet, ponieważ zapewnia to pewną intuicję na temat tego, co psuje się w przypadku większej liczby monet.
Niech i Y oznaczają zmienne rozproszone Bernoulliego odpowiadające dwóm przypadkom, X ∼ B e r ( p ) , Y ∼ B e r ( q ) . Najpierw przypomnij sobie, że korelacja X i Y jestX Y X∼ B e r ( p ) Y∼ B e r ( q) X Y
Sprawa trzech monet
W takim przypadku obraz z góry wygląda następująco:
Wymiary zostały zderzone o jeden: czerwony wierzchołek stał się kilkoma kolorowymi krawędziami, a krawędź pokryta niebieskim prostokątem stała się całą twarzą. Niebieska płaszczyzna wskazuje tutaj, że znając margines, znasz sumę prawdopodobieństw w nim; dla tego na zdjęciu
To nakłada pewne ograniczenia na możliwe rozkłady połączeń, ale teraz ograniczyliśmy ćwiczenie do ćwiczenia kombinatorycznego polegającego na umieszczaniu liczb na wierzchołkach sześcianu. Bez zbędnych ceregieli, podajmy dwa wspólne rozkłady, których marginesy i korelacje są takie same:
Cztery lub więcej monet
Wreszcie, gdy mamy więcej niż trzy monety, nie powinno dziwić, że możemy przygotować przykłady, które zawiodły, ponieważ mamy teraz jeszcze większą rozbieżność między liczbą parametrów wymaganych do opisania wspólnego rozkładu a parametrami dostarczonymi nam przez marginalnych i korelacje.
Konkretnie, dla dowolnej liczby monet większych niż trzy, możesz po prostu wziąć pod uwagę przykłady, których pierwsze trzy monety zachowują się jak w dwóch powyższych przykładach i dla których wyniki dwóch ostatnich monet są niezależne od wszystkich innych monet.
źródło
Skorelowane próby Bernoulliego prowadzą do rozkładu dwumianowego dla zliczonych wyników. Powinna istnieć możliwość parametryzacji tego rozkładu w celu uzyskania określonej wartości korelacji, a następnie obliczenia pożądanego prawdopodobieństwa.
źródło