Załóżmy, że mamy zmienną losową, która przyjmuje wartości nienumeryczne a, b, c i chce określić ilościowo, w jaki sposób rozkład empiryczny próbki tej zmiennej odbiegają od rozkładu rzeczywistego. W tym przypadku obowiązuje następująca nierówność (z Cover & Thomas ).
Twierdzenie 12.4.1 (twierdzenie Sanowa): Niech bądź tam .
Pozwolićbyć zbiorem rozkładów prawdopodobieństwa. Następniegdziejest rozkładem w najbliższym w entropii względnej.
Ta nierówność jest dość luźna dla małych . W przypadku wyników binarnych , a granica Chernoffa-Hoeffdinga jest znacznie ściślejsza.
Czy istnieje podobne ograniczenie dla ?
pr.probability
chernoff-bound
Jarosław Bułatow
źródło
źródło
Odpowiedzi:
Możesz uzyskać całkiem dobre granice, biorąc pod uwagę zmienną losową która wynosi 1, jeśli a zero w przeciwnym razie (dla obejmującego próby i obejmującego kategorie). Dla każdej ustalonej są niezależne, a więc mogą być analizowane przy użyciu granic Chernoffa. Następnie wykonaj związek związany przez .Yij Xi=j 1≤i≤n 1≤j≤3 j Yij ∑iYij j
Jeśli powyższe nie wystarczy, proponuję spojrzeć na model kulek i pojemników, np. W podręczniku Upfala i Mitzenmachera. Ten model jest taki sam jak twój, z tym wyjątkiem, że niektóre z twoich pojemników mogą być bardziej prawdopodobne niż inne, aby wylądowały w nich kule, prawda? Istnieje kilka bardziej wyrafinowanych technik wykorzystujących aproksymacje Poissona w tym modelu, które prawdopodobnie można rozszerzyć na twoje ustawienie z nierównomiernymi prawdopodobieństwami bin.
źródło
Nie ma nic w granicach Chernoffa Hoeffdinga, które są specyficzne dla zmiennych boolowskich. Jeśli są zmiennymi losowymi o wartości rzeczywistej o wartości , możesz zastosować ograniczenie Chernoffa. Dobrym odniesieniem jest „Stężenie miary do analizy algorytmów losowych” ( http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.120.2561&rep=rep1&type=pdf )X1,…,Xn 0≤Xi≤1
źródło