Czy istnieje formuła zamknięta dla (lub pewnego rodzaju powiązania) EMD między i ?x 2 ∼ N ( μ 2 , Σ 2 )
26
Czy istnieje formuła zamknięta dla (lub pewnego rodzaju powiązania) EMD między i ?x 2 ∼ N ( μ 2 , Σ 2 )
Odpowiedzi:
NiechX∼P=N(μx,Σx) , Y∼Q=N(μy,Σy) .
Dolna granica: według nierówności Jensena, ponieważ normy są wypukłe,E∥X−Y∥≥∥E(X−Y)∥=∥μx−μy∥,
więc EMD jest zawsze przynajmniej odległość między środkami (dla dowolnych rozkładów).
Górna granica oparta naW2 :
Znów nierówność Jensena,
(E∥X−Y∥)2≤E∥X−Y∥2 . Zatem W1≤W2 . Ale Dowson i Landau (1982) ustalili, że
W.2)( P, Q )2)= ∥ μx- μy∥2)+ t r( Σx+ Σy- 2 ( ΣxΣy)1 / 2) ,
podając górną granicę dla E M D = W1 .
Węższa górna granica: rozważ sprzężenie To jest mapa opracowana przez Knott i Smitha (1984) , O optymalnym odwzorowaniu rozkładów , Journal of Optimization Theory and Applications, 43 (1) str. 39–49 jako optymalne odwzorowanie dla ; zobacz także ten post na blogu . Zauważ, że iXY∼ N.( μx, Σx)= μy+ Σ- 12)x( Σ12)xΣyΣ12)x)12)Σ- 12)xZA( X- μx) . W2A=ATEYW.2) A = AT. miYVarY= μy+ A ( EX- μx) = μy= A ΣxZAT.= Σ- 12)x( Σ12)xΣyΣ12)x)12)Σ- 12)xΣxΣ- 12)x( Σ12)xΣyΣ12)x)12)Σ- 12)x= Σ- 12)x( Σ12)xΣyΣ12)x) Σ- 12)x= Σy,
więc połączenie jest prawidłowe.
Odległość wynosi wtedy , gdzie teraz co jest normalne z∥ X- Y∥ ∥ D ∥ re= X- Y= X- μy- A ( X- μx)= ( I- A ) X- μy+ A μx, mireVarre= μx- μy= ( I- A ) Σx( Ja- A )T.= Σx+ A ΣxA - A Σx- ΣxZA= Σx+ Σy- Σ- 12)x( Σ12)xΣyΣ12)x)12)Σ12)x- Σ12)x( Σ12)xΣyΣ12)x)12)Σ- 12)x.
Zatem górna granica dla to . Niestety, forma zamknięta dla tego oczekiwania jest zaskakująco nieprzyjemna w przypadku ogólnych norm wielowymiarowych: patrz to pytanie , jak również to .W.1( P, Q ) mi∥ D ∥
Jeśli wariancja jest sferyczna (np. Jeśli , , wówczas wariancja staje się ), poprzednia pytanie daje odpowiedź w postaci uogólnionego wielomianu Laguerre'a.re Σx= σ2)xja Σy= σ2)yja re (σx−σy)2I
Ogólnie rzecz biorąc, mamy prostą górną granicę dla opartą na nierówności Jensena, wyprowadzoną np. Z tego pierwszego pytania:E∥D∥ (E∥D∥)2≤E∥D∥2=∥μx−μy∥2+tr(Σx+Σy−AΣx−ΣxA)=∥μx−μy∥2+tr(Σx)+tr(Σy)−2tr(Σ−12x(Σ12xΣyΣ12x)12Σ12x)=∥μx−μy∥2+tr(Σx)+tr(Σy)−2tr((Σ12xΣyΣ12x)12)=W2(P,Q)2.
Równość na końcu wynika z tego, że macierze i są podobne , więc mają te same wartości własne, a zatem ich pierwiastki kwadratowe mają ten sam ślad.ΣxΣy Σ12xΣyΣ12x=Σ−12x(ΣxΣy)Σ12x
Ta nierówność jest surowa, o ile nie ulega degeneracji, co w większości przypadków występuje w przypadku .∥D∥ Σx≠Σy
Przypuszczenie : Może ta bliższa górna granica, , jest ciasna. Z drugiej strony, przez długi czas miałem tutaj inną górną granicę, którą przypuszczałem, że jest ciasna, która w rzeczywistości była luźniejsza niż , więc może nie powinieneś zbytnio ufać tej . :)E∥D∥ W2
źródło