Na entropii sumy

12

Szukam oprawionego na entropii H(X+Y) sumy dwóch niezależnych dyskretnych zmiennych losowych i . Oczywiście, Jednak zastosowane do sumy niezależnych zmiennych losowych Bernoulliego , daje to Innymi słowy, granica rośnie liniowo z przy wielokrotnym stosowaniu. Jednak jest obsługiwany na zestawie rozmiaru , więc jego entropia jest co najwyżejY H ( X + Y ) H ( X ) + H ( Y ) ( ) n Z 1 , , Z n H ( Z 1 + Z 2 + + Z n ) n H ( Z 1 ) n Z 1 + Z n n log nXY

H(X+Y)H(X)+H(Y)      ()
nZ1,,Zn
H(Z1+Z2++Zn)nH(Z1)
nZ1+Znnlogn. W rzeczywistości, według centralnego twierdzenia o limicie, domyślam się, że ponieważ jest zasadniczo obsługiwany na zestawie wielkości .H(Z1++Zn)(1/2)lognn

W skrócie, bound w tej sytuacji nieco przewyższa. Po przeczytaniu tego postu na blogu , zbieram wszelkiego rodzaju ograniczenia na są możliwe; czy istnieje granica, która daje właściwe asymptotyki (lub przynajmniej bardziej rozsądne asymptotyki) przy wielokrotnym stosowaniu do sumy zmiennych losowych Bernoulliego?()H(X+Y)

robinson
źródło
2
Nie jestem pewien, o co tak naprawdę pytasz. Jeśli chcesz górnej granicy H (X + Y) w kategoriach H (X) i H (Y), która ma zastosowanie do dowolnych dwóch niezależnych dyskretnych zmiennych losowych X i Y, to H (X + Y) ≤H (X ) + H (Y) jest wyraźnie najlepszym, co możesz uzyskać; rozważmy przypadek, w którym sumy x + y są różne, gdy zakresy x powyżej podparcia zakresów X i y ponad podparcie Y. Jeśli zastosujesz to ogólne ograniczenie do bardzo szczególnego przypadku, to naturalne, że otrzymasz bardzo luźno związany.
Tsuyoshi Ito
1
@TsuyoshiIto - cóż, jedną z możliwości odpowiedzi, która byłaby świetna, jest nierówność taka jak gdzie wyrażenia po minusie są równe zero w opisywanym przypadku i sumują się, aby uzyskać lepsze skalowanie za pomocą nw przypadku sumy zmiennych losowych Bernoulliego ...H(X+Y)H(X)+H(Y)n
robinson
1
... wydaje mi się, że istnienie nierówności takich jak sprawia, że ​​przynajmniej prawdopodobne jest, że odpowiedź, której szukam, istnieje . H(X+Y)3H(XY)H(X)H(Y)
robinson
2
Oznacza to, że to, czego szukasz, nie jest górną granicą H (X + Y) pod względem H (X) i H (Y) . Edytuj pytanie.
Tsuyoshi Ito
1
myślę, że w przypadku, gdy wariancja każdego jest niewielka w porównaniu do n, twoje przypuszczenie jest właściwą odpowiedzią i nie jest trudne do sprecyzowania przy użyciu twierdzenia Berry'ego-EsseenaZin
Sasho Nikolov

Odpowiedzi:

19

W przypadku takich pytań często uzyskuje się właściwą intuicję, myśląc o „płaskich” zmiennych losowych. Oznacza to, że z jako rozkład jednolity na zbiorze A o wielkości 2 H ( X ) i Y jako rozkład jednolity na zbiorze B o rozmiarze 2 H ( Y ) .XA2H(X)YB2H(Y)

Więc pytanie, które zadajesz, to (z grubsza), co możesz powiedzieć o rozmiarze w porównaniu do | A | i | B | . Ogólnie (np. Jeśli byłyby to zestawy losowe), wtedy rzeczywiście będziesz miał | A + B | | A | | B | co odpowiada H ( X + Y ) H ( X ) + H ( Y ) .|A+B||A||B||A+B||A||B|H(X+Y)H(X)+H(Y)

Istnieją pewne szczególne przypadki, kiedy , szczególnie gdy A i B są przedziałami (lub bardziej ogólnie postępami arytmetycznymi). Istnieją wyniki, które mówią, że (przynajmniej pod pewnymi warunkami i jeśli | A + B | jest prawie tak mały, jak to możliwe), jest to jedyny przypadek. Obszar, w którym badane są takie pytania, jest znany jako „kombinatoryka addytywna”, a niektóre wyniki mają smak, który w grupie ( G , + ), jeśli | A +|A+B||A||B|AB|A+B|(G,+) a następnie A , B są w przybliżeniu podgrupami G (jak wspominasz w swoim pytaniu, blog Terence Tao omawia niektóre takie wyniki, ogólnie mówiąc, wyniki rozmiaru zestawu można przenieść do ustawienia entropii).|A+B|=O(|A|+|B|)A,BG

A[a..b]B[0..c](1/2)lognc=1a=0b=kk=1,...,n1akkbk+k|A+B||A|+c

Boaz Barak
źródło
5

nZ1,Z2,...,ZnpZ1+Z2+...+Znnpnp12logn+O(logn)

VSJ
źródło
0

Może mógłbyś użyć równania:

H(Z1+Z2++Zn)=H(Z1)+H(Z2)++H(Zn)H(Z1|Z1+Z2++Zn)H(Z2|Z2+Z3++Zn)H(Zn1|Zn1+Zn)

To mogłoby wyglądać jak termin, który wspomniałeś w komentarzach, niestety nie znam wyników dotyczących liczności negatywnych warunków lub wnikliwych ograniczeń.

Stóg
źródło