n ∈ N 1 , 2 , . . . , a m n jest zestawem z elementami , a są stałymi dodatnimi liczbami całkowitymi mniejszymi lub równymi .
Ponieważ elementy są równie prawdopodobne, próbek jest osobno i niezależnie od bez zamiany, których wielkość wynosi odpowiednio .1 , 2 , . . . , a m
przecięcia próbekma, ogólnie rzecz biorąc, wsparcie równe , ale którą dystrybucję stosuje?
combinatorics
Chłodna woda
źródło
źródło
Odpowiedzi:
Oto inne podejście, które nie wymaga rekurencji. Nadal jednak wykorzystuje sumy i produkty, których długości zależą od parametrów. Najpierw dam wyraz, a potem wyjaśnię.
Mamy
EDYCJA: Pod koniec pisania tego wszystkiego zdałem sobie sprawę, że możemy nieco skonsolidować powyższe wyrażenie, łącząc współczynniki dwumianowe w prawdopodobieństwa hipergeometryczne i współczynniki trójmianowe. Jeśli chodzi o wartość, zmienione wyrażenie to Tutaj jest losową zmienną hipergeometryczną, w której losowania są pobierane z populacji o wielkości mającej stanów powodzenia.
Pochodzenie
Zdobądźmy notację, aby nieco łatwiej śledzić argumenty kombinatoryczne (miejmy nadzieję). Przez cały czas uważamy i naprawione. Użyjemy do oznaczenia kolekcji uporządkowanych -tuple , gdzie każdy , spełniającyS a1,…,am C(I) m (L1,…,Lm) Li⊆S
Użyjemy również dla kolekcji identycznej, z tym że wymagamy zamiast równości.C′(I) L1∩⋯∩Lm⊇I
Kluczową obserwacją jest to, że można stosunkowo łatwo policzyć. Jest tak, ponieważ warunek jest równoważny dla wszystkich , więc w pewnym sensie usuwa interakcje między różnymi wartościami . Dla każdego liczba spełniająca wymagania wynosi , ponieważ możemy zbudować taki , wybierając podzbiór o rozmiarzea następnie unioning z . Wynika, żeC′(I) L1∩⋯∩Lm⊇I Li⊇I i i i Li (|S|−|I|ai−|I|) Li S∖I ai−|I| I
Teraz nasze pierwotne prawdopodobieństwo można wyrazić za pomocą w następujący sposób:C
Możemy od razu wprowadzić dwa uproszczenia. Po pierwsze, mianownik jest taki sam jak Po drugie, argument permutacji pokazuje, żezależy tylko od poprzez liczność. Ponieważ istnieje podzbiory o liczności wynika, że gdzie jest arbitralnym, stałym podzbiorem o liczności
Cofając się o krok, zredukowaliśmy problem do pokazania, że
Niech będą odrębnymi podzbiorami utworzonymi przez dodanie dokładnie jednego elementu do . Następnie (To po prostu mówi, że jeśli , to zawiera ale również nie zawiera żadnego dodatkowego elementu.) Przekształciliśmy teraz problem zliczania problem zliczania , o którym wiemy więcej, jak sobie z tym poradzić. Mówiąc dokładniej, mamyJ1,…,Jn−k S I0
Możemy zastosować wykluczenie włączenia, aby obsłużyć wielkość wyrażenia unii powyżej. Kluczową zależnością jest tutaj to, że dla każdego niepustego , Dzieje się tak, ponieważ jeśli zawiera pewną liczbę , to również zawiera ich związek. Zauważamy również, że zestaw ma rozmiar. W związku z tymI⊆{1,…,n−k}
Na koniec, podstawiając wyrażenie na końcu do równania napowyżej i konsolidując sumę, otrzymujemy jak twierdzono.|C(I0)|
źródło
Nie znam analitycznego sposobu rozwiązania tego problemu, ale oto rekurencyjny sposób obliczenia wyniku.
Dla wybierasz elementy spośród z których wybrano wcześniej. Prawdopodobieństwo wybrania elementów , które przecinają się z w drugim losowaniu, wynika z rozkładu hipergeometrycznego:m=2 a2 n, a1 k≤min{a1,a2} L1
Możemy nazwać wynikMożemy użyć tej samej logiki do znalezienia gdzie jest licznością przecięcia trzech próbek. Następnie,b2. P(b3=k∣n,b2,a3), b3
Znajdź to dla każdego . To ostatnie obliczenie nie jest trudne numerycznie, ponieważ jest po prostu wynikiem poprzedniego obliczenia, a jest wywołaniem rozkład hipergeometryczny.k∈{0,1,2,…,min(a1,a2,a3)} P(b2=l∣n,a1,a2) P(b3=k∣n,b2=l,a3)
Ogólnie, aby znaleźć , możesz zastosować następujące formuły rekurencyjne: dla i co oznacza, żeP(bm)
Oto w R:
źródło