Biorąc pod uwagę sekwencję losowych zmiennych iid, powiedzmy dla , próbuję ograniczyć oczekiwaną liczbę razy średnią empiryczną będzie przekraczać wartość, , gdy będziemy nadal rysować próbki, czyli: i = 1 , 2 , . . . , n 1c≥0T d e f = n ∑ j=1P({ 1
Jeśli założymy, że dla niektórych , możemy użyć nierówności Hoeffdinga, aby dojść doa > 0
Które wygląda ładnie (może), ale w rzeczywistości jest dość luźne, czy są lepsze sposoby na ograniczenie tej wartości? Spodziewam się, że może istnieć sposób, ponieważ różne zdarzenia (dla każdego ) wyraźnie nie są niezależne, nie znam żadnego sposobu na wykorzystanie tej zależności. Byłoby również miło usunąć ograniczenie, że jest większe niż średnia.c
edycja : Ograniczenie powyżej wartości średniej można usunąć, jeśli użyjemy nierówności Markowa w następujący sposób:
Odpowiedzi:
Jest to podejście raczej ręczne i naprawdę doceniłbym kilka komentarzy na ten temat (i te krytyczne są zwykle najbardziej pomocne). Jeśli dobrze rozumiem, OP oblicza , gdzie każda próbka zawiera obserwację poprzedniej próbki +1 z nowego rv rozkład średniej każdej próbki. Potem możemy pisać Fjx¯j Fj
Rozważmy przykładową wielkość , po czym rozkład średniej próbki jest praktycznie normalne, oznaczamy . Potem możemy pisaćGm G^
Rozwiązując otrzymujemy gdzie jest standardową normą cdf, jest standardowym odchyleniem procesu iid, a jest jego średnią. Wkładamy w oprawę i zmieniamy aranżację G J(c)=1-cp( √G^j(c)
Zauważ, że ta granica zależy również od wariancji procesu. Czy to jest lepsze niż to przedstawione w pytaniu? Będzie to zależeć przede wszystkim od tego, jak „szybko” rozkład średniej próbki stanie się „prawie normalny”. Aby podać przykład liczbowy, załóż, że . Załóżmy również, że zmienne losowe są jednolite w . Następnie i . Rozważ 10% odchylenie od średniej, tj. Ustaw . wtedy: już dla granica, którą proponuję (co ma znaczenie dla ) staje się ściślejsza. Dla granica Hoeffdinga wynosim=30 [0,1] σ=112−−√ μ=12 a=0.05 n=34 n>30 n=100 78.5 podczas gdy proponowane mnie ograniczenie to . Hoeffding związany jest zbieżny do gdy związany że proponuje Zwiększając rozbieżność pomiędzy dwiema granicami zredukowane, lecz pozostają widoczne: dla odchylenia 20%, The Hoeffding związany jest zbieżny do natomiast związany Proponuję zbiegać się do (tj. suma normalnych plików cdfs w bardzo niewielkim stopniu przyczynia się do ogólnego ograniczenia).
Nieco bardziej ogólnie zauważamy, że dla granica Hoeffdinga jest zbieżna z36.2 ≈199.5 ≈38.5 a a=0.1 49.5 30.5
n→∞
Ponieważ dla małych wartości (co jest raczej przypadkiem zainteresowania) staje się dużą liczbą, nadal istnieje możliwość, że może przewyższyć ją szczelnością, nawet jeśli próbka jest taka, że rozkład średniej próbki zbiega się powoli do rozkład normalny.a Hb Ab
źródło