Oczekiwana liczba duplikatów (trzykrotne itp.) Podczas rysowania z zamiennikiem

10

Mam następujący problem:

Mam 100 unikalnych przedmiotów (n) i wybieram 43 (m) pojedynczo (z wymianą).

Muszę rozwiązać dla oczekiwanej liczby unikatów (wybranych tylko raz, k = 1), podwójnych (wybrane dokładnie dwa razy k = 2), potrójnych (dokładnie k = 3), quadów itp.

Udało mi się znaleźć wiele wyników dotyczących prawdopodobieństwa wystąpienia co najmniej jednego podwójnego (paradoks urodzinowy), ale nie oczekiwanej liczby par w populacji.

Kaitlyn K
źródło
Czy oszacowanie Monte Carlo byłoby dla Ciebie przydatne, czy potrzebujesz odpowiedzi w formie zamkniętej?
David J. Harris,
Wolę formułę w formie zamkniętej, dzięki czemu mogę łatwo zastosować ją do różnych wartości n, m i k.
Kaitlyn K

Odpowiedzi:

7

Iterm zostanie wybrany razy. Na tej podstawie możesz znaleźć wszystkie potrzebne ilości, ponieważ np. Na przykład oczekiwaną liczbę par podaje ithBinom(m,1/n)

E[number of pairs]=i=1nP[ith item appears twice]
nP[Binom(m,1/n)=2].

Możesz uzyskać wartość liczbową w R za pomocą polecenia n * dbinom (k, m, 1 / n).

Stefan Wager
źródło
Czy można zastosować tę formułę dla ak = 0 lub 1?
Kaitlyn K
Tak, może. Przy k = 0 możesz zinterpretować to jako „ile punktów nie pojawi się wśród m wybranych”.
Stefan Wager
Ale te wydarzenia nie są niezależne. Np. Gdy pozycja 1 pojawi się m razy, żadne inne pozycje nigdy się nie pojawią. Nie można po prostu dodać P.
asterix314