Statystyczna odległość między monetą jednolitą a stronniczą

9

Pozwolić U być równomiernym rozkładem n bitów i pozwól D być dystrybucją n bity, w których bity są niezależne, a każdy bit jest 1 z prawdopodobieństwem 1/2ϵ. Czy to prawda, że ​​statystyczna odległość międzyD i U jest Ω(ϵn), kiedy n1/ϵ2?

Manu
źródło
2
Tak. Statystyczna odległość międzyU i V jest przynajmniej PrU(xi>n/2)PrD(xi>n/2), który jest Ω(εn); patrz np. odpowiedź Matusa
Yury
2
Dzięki. Być może wyjaśnij, jak to zrobić z tego, co napisał Matus w odpowiedzi, którą mogę zaakceptować?
Manu,
1
Jeśli chodzi o odpowiedź Matusa, możesz zrobić lepiej niż nierówność Sluda; patrz (2.13,2.14) w arxiv.org/abs/1606.08920
Aryeh

Odpowiedzi:

7

Oznacz losowe bity przez x1,,xn. Z definicji statystyczna odległość międzyU i D jest przynajmniej PrU(xit)PrD(xit)dla każdego . Wybieramy .tt=n/2+n

Zauważ, że dla jakiejś bezwzględnej stałej . Jeśli , to statystyczna odległość wynosi co najmniej i gotowe. Zakładamy więc, że .PrU(xit)c1c1>0PrD(xit)c1/2c1/2PrD(xit)c1/2

Niech dla iid zmiennych losowych Bernoulliego z . Naszym celem jest udowodnienie, że . Według twierdzenia o wartości średniej, dla niektórych . Teraz udowodnimy, że ; oznacza to, że pożądana statystyczna odległość wynosi co najmniej , zgodnie z wymaganiami.f(s)=Pr(xit)x1,,xnPr(xi=1)=1/2sf(0)f(ε)=Ω(εn)

f(0)f(ε)=εf(ξ),
ξ(0,ε)f(ξ)Ω(n)Ω(nε)

Zapis, i Uwaga: A zatem,

f(ξ)=kt(nk)(12ξ)k(12+ξ)nk,
f(ξ)=kt(nk)(k(12ξ)k1(12+ξ)nk+(nk)(12ξ)k(12+ξ)nk1)=kt(nk)(12ξ)k(12+ξ)nkk/2+kξ(nk)/2+(nk)ξ(1/2ξ)(1/2+ξ).
k/2+kξ(nk)/2+(nk)ξ(1/2ξ)(1/2+ξ)=(2kn)/2+nξ(1/2ξ)(1/2+ξ)2(2tn)=4n.
f(ξ)4nkt(nk)(12ξ)k(12+ξ)nk=4nf(ξ)4nf(ε)4n(c1/2).
tym miejscu założenie, że . Pokazaliśmy, że .f(ε)=PrD(x1++xnt)c1/2f(ξ)=Ω(n)
Yury
źródło
5

Nieco bardziej elementarny i nieco niechlujny dowód (a przynajmniej tak mi się wydaje).

Dla wygody napisz , z założeniem .ε=γnγ[0,1)

Wyraźnie dolną granicę wyrażenia : dTV(P,U)

2dTV(P,U)=x{0,1}n|(12+γn)|x|(12γn)n|x|12n|=12nk=0n(nk)|(1+2γn)k(12γn)nk1|12nk=n2+nn2+2n(nk)|(1+2γn)k(12γn)nk1|Cnk=n2+nn2+2n|(1+2γn)k(12γn)nk1|
gdzie jest stałą bezwzględną. Obniżamy każdą granicę osobno: naprawiamy i piszemy , tak aby każdy summand był niżej ograniczony wielkością zbieżną (kiedy ) doC>0k=kn2[n,2n]
(1+2γn)k(12γn)nk=(14γ2n)n/2(1+2γn12γn)(14γ2n)n/2(1+2γn12γn)nne4γ2γ2
ne4γ2γ21>4γ2γ2>2γ ; sugerując, że każdy to . Podsumowując, daje to jak twierdzono.Ω(γ)
2dTV(P,U)Cnk=n2+nn2+2nΩ(γ)=Ω(γ)=Ω(εn)
Klemens C.
źródło
(Używanie Hellingera jako proxy ze względu na jego miłe właściwości, dystrybucje produktów wrt są kuszące i byłyby znacznie szybsze, ale na końcu dolna granica spowodowałaby stratę przez czynnik kwadratowy.)
Clement C.
1
Miły! Lubię podejście elementarne. Powinniśmy być w stanie sprawić, by nie był również asymptotyczny w .... jednym ze sposobów jest użycie , a następnie użyj ładnej nierówności . Trochę bałagan. n(1+z1z)n(1+2z)n1+weww2/2
usul