Zrozumienie pomiaru nierówności koncentracji

12

W duchu tego pytania. Rozumiejąc dowód lematu stosowanego w nierówności Hoeffdinga , staram się zrozumieć kroki, które prowadzą do nierówności Hoeffdinga.

Najbardziej tajemnicą dla mnie jest część obliczania momentów wykładniczych dla sumy zmiennych iid, po których stosuje się nierówność Markowa.

Moim celem jest zrozumienie: Dlaczego ta technika powoduje ścisłą nierówność i czy jest ona najostrzejsza, jaką możemy osiągnąć? Typowe wyjaśnienie odnosi się do właściwości generujących moment wykładnika. Jednak uważam to za zbyt niejasne.

Post na blogu Tao, http://terrytao.wordpress.com/2010/01/03/254a-notes-1-concentration-of-measure/#hoeff , może zawierać kilka odpowiedzi.

Mając na uwadze ten cel, moje pytanie dotyczy trzech punktów w poście Tao, w których utknąłem i które, mam nadzieję, mogłyby dać wgląd w wyjaśnienie.

  1. Tao wyprowadza następującą nierówność za pomocą k-tego momentu Jeśli jest to prawdą dla dowolnego k, kończy wykładniczą granicę. Tu się zgubiłem. P(|Sn|λ

    P(|Sn|λn)2(ek/2λ)k.     (7)
    P(|Sn|λn)Cexp(cλ2)     (8)
  2. X[a,b]t>0

    EetXetEX(1+O(t2Var(X)exp(O(t(ba)))).     (9)
    EetXetEXexp(O(t2(ba)2)).     (10)
    etX=1+tX+O(t2X2exp(O(t))) .Dlaczego rozszerzenie może być ograniczone tym kwadratowym terminem? i jak przebiega równanie 10?

  3. O(t2(ba)2)t2(ba)2/8

Wszelkie dalsze intuicje \ wyjaśnienia dotyczące dowodu nierówności lub powodu, dla którego nie możemy ustalić ściślejszej granicy, są zdecydowanie mile widziane.

Lew
źródło
Czy przeczytałeś oryginalny artykuł Hoeffdinga?
Alecos Papadopoulos
@AlecosPapadopoulos I tak naprawdę nie. Mam wrażenie, że wyprowadzenie składa się z kroków algebraicznych typowo nauczanych na kursach matematycznych, bez wyjaśnienia, którego szukam. Czy możesz powiedzieć inaczej?
Leo
Sugeruję, żebyś to przeczytał. Stabilny adres URL w jstor to jstor.org/stable/2282952 . To, co „ma dla ciebie największą tajemnicę”, to twierdzenia 1, 2 i 3 artykułu, których dowody znajdują się w części 4 artykułu (nie na końcu) i dla mnie wyglądają dość jasno. Nie wiem, czy szukasz jakiejś „niematematycznej” intuicji - jeśli tak, to nie zawsze istnieje.
Alecos Papadopoulos,

Odpowiedzi:

3

EeXEXXEeXEXEeXEeXeX=1+X+X22+X36+XEXX

gmravi2003
źródło
2
f0eXf(X)
1
ff(x)>0XeX
1
Nie przyjrzałem się temu, ale podejrzewam, że wykładniczy ma pewne szczególne właściwości, w tym te, które wymieniasz, które są krytyczne: wszystkie współczynniki powinny być ściśle dodatnie i dobrze, że zbiega się absolutnie wszędzie. Sądzę jednak, że istnieją głębsze powody, dla których ta funkcja jest niezbędna, związana z właściwościami transformat Fouriera i Laplace'a. Rozsądne może być zbadanie pochodnych nierówności miar, aby zobaczyć, jakie właściwości wykładnicze są rzeczywiście używane! (+1)
whuber
P{x1+x2>0}=E{1[x1+x2>0]}E{exp(tx1)}E{exp(tx2)}E{exp(tx1)}<1
Chciałbym Cię zainteresować pytaniem o szczelność tej granicy: stats.stackexchange.com/questions/77019/…
Leo