Rozważ urnę zawierającą kulek o różnych kolorach, przy czym jest proporcją kulek koloru wśród kulek ( ). Rysuję kulek z urny bez zamiany i patrzę na liczbę różnych kolorów wśród narysowanych piłek. Jakie jest oczekiwanie \ gamma w funkcji n / N , w zależności od odpowiednich właściwości rozkładu \ mathbf {p} ?P p i i N ∑ i p i = 1 n ≤ Nγ n / N p
Aby dać więcej wglądu: jeśli i dla wszystkich , zawsze będę widzieć dokładnie kolorów, czyli . W przeciwnym razie można wykazać, że oczekiwanie wynosi . Dla stałych i wydaje się, że współczynnik pomnożenia byłby maksymalny, gdy jest jednolity; może oczekiwana liczba różnych kolorów będzie ograniczona w funkcji i np. entropia ?
Wydaje się, że jest to związane z problemem kolektora kuponów, z tym wyjątkiem, że próbkowanie odbywa się bez zamiany, a rozkład kuponów nie jest jednolity.
Odpowiedzi:
Załóżmy, że masz kolorów gdzie . Niech oznaczają liczbę kul tak . Niech i pozwolić zapisywać zestaw, na który składa się z podzbiorów elementem . Niech oznacza liczbę sposobów, w których możemy wybrać elementów z powyższego zestawu, tak że liczba różnych kolorów w wybranym zestawie wynosi . Dla wzór jest prosty:k ≤ N b i i ∑ b i = N B = { b 1 , … , b k } E i ( B ) i B Q n , c n c c = 1k k≤N bi i ∑bi=N B={b1,…,bk} Ei(B) i B Qn,c n c c=1
Dla możemy policzyć zestawy kulek o rozmiarze które mają co najwyżej 2 kolory minus liczba zestawów, które mają dokładnie kolor:n 1c=2 n 1
kc1c2kc1≤c2≤k ( k-c1(k−11) to liczba sposobów dodania koloru do ustalonego koloru, dzięki czemu będziesz mieć 2 kolory, jeśli w sumie masz kolorów. Ogólna formuła jest taka, że jeśli masz stałe kolory i chcesz z nich zrobić kolory, mając jednocześnie kolorów ( ) to . Teraz mamy wszystko, aby wyprowadzić ogólną formułę dla :k c1 c2 k c1≤c2≤k Qn,c(k−c1c2−c1) Qn,c
Prawdopodobieństwo, że będziesz mieć dokładnie kolorów, jeśli narysujesz kulek, wynosi:nc n
Zauważ też, że jeśli .y>x(xy)=0 y>x
Prawdopodobnie istnieją specjalne przypadki, w których formułę można uprościć. Tym razem nie zadałem sobie trudu znalezienia tych uproszczeń.
Oczekiwana wartość, której szukasz, liczby kolorów zależnych od to:n
źródło