Czy istnieje obiektywny estymator odległości Hellingera między dwiema dystrybucjami?

20

W otoczeniu, w którym obserwujemy X1,,Xn rozproszone z rozkładu o gęstości f , zastanawiam się, czy istnieje obiektywny estymator (oparty na Xi ) odległości Hellingera do innego rozkładu o gęstości f0 , mianowicie

H(f,f0)={1Xf(x)f0(x)dx}1/2.
Xi'an
źródło
4
Więc f0 jest znany i naprawiony. Ale czy znany jest f lub pochodzi z rodziny parametrycznej, czy robi to w ramach nieparametrycznej ze wszystkim, co wiesz o f pochodzącym z próbki? Myślę, że to robi różnicę przy próbie odpowiedzi.
Michael R. Chernick
3
@MichaelChernick: załóż, że wszystko, co wiesz o to próbka X 1 , , X n . fX1,,Xn
Xi'an
2
Nie sądzę, żeby to zostało obliczone (jeśli istnieje). Jeśli istnieje, AIC ma zaginionego brata.
4
Atak na ten problem wydaje się możliwy, jeśli założymy, że i f 0 są dyskretne. Prowadzi to do oczywistego estymatora (oblicz odległość Hellingera między EDF i f 0 ). Bootstrapping (teoretycznie, nie poprzez symulację!) Da nam kontrolę nad możliwym uprzedzeniem, a także sposobem na zmniejszenie (a nawet wyeliminowanie) uprzedzenia. Mam nadzieję, że uda mi się odnieść dystans kwadratowy, a nie dystans, ponieważ jest on matematycznie łatwiejszy do pokonania. Założenie dyskretnego f nie stanowi problemu w aplikacjach; przestrzeń dyskretnego f jest zresztą gęstym podzbiorem. ff0f0ff
Whuber
2
Przypomina mi się dowód Rosenblatta, że ​​nie ma obiektywnego estymatora „bona fide” . Czy możemy to przezwyciężyć i uzyskać niespieniony estymator H ( f , f 0 ) ? Nie wiem fH(f,f0)
Zen.

Odpowiedzi:

5

Dla f nie istnieje żaden obiektywny estymator ani ani H 2HH2f z dowolnego stosunkowo szerokim nieparametrycznego klasy dystrybucji.

Możemy to pokazać za pomocą pięknie prostego argumentu

Bickel and Lehmann (1969). Bezstronna ocena w rodzinach wypukłych . The Annals of Mathematical Statistics, 40 (5) 1523–1535. ( euclid projektu )

Napraw niektóre rozkłady , F i G o odpowiednich gęstościach f 0 , f i g . Niech H ( F ) oznaczają H ( f , f 0 ) , niech H ( X ) jest nieco estymatorem H ( F ), na podstawie n próbek IID x ı ~ F .F0FGf0fgH(F)H(f,f0)H^(X)H(F)nXiF

Załóżmy, że H jest obiektywne dla próbek z każdego podziału formy M alfa : = α F + ( 1 - α ) G . Ale potem Q ( α )H^

Mα:=αF+(1α)G.
Q(α)=H(Mα)=x1xnH^(X)dMα(x1)dMα(xn)=x1xnH^(X)[αdF(x1)+(1α)dG(x1)][αdF(xn)+(1α)dG(xn)]=αnEXFn[H^(X)]++(1α)nEXGn[H^(X)],
so that Q(α) must be a polynomial in α of degree at most n.

Now, let's specialize to a reasonable case and show that the corresponding Q is not polynomial.

Let F0 be some distribution which has constant density on [1,1]: f0(x)=c for all |x|1. (Its behavior outside that range doesn't matter.) Let F be some distribution supported only on [1,0], and G some distribution supported only on [0,1].

Now

Q(α)=H(mα,f0)=1Rmα(x)f0(x)dx=110cαf(x)dx01c(1α)g(x)dx=1αBF1αBG,
where BF:=Rf(x)f0(x)dx and likewise for BG. Note that BF>0, BG>0 for any distributions F, G which have a density.

1αBF1αBG is not a polynomial of any finite degree. Thus, no estimator H^ can be unbiased for H on all of the distributions Mα with finitely many samples.

Likewise, because 1αBF1αBG is also not a polynomial, there is no estimator for H2 which is unbiased on all of the distributions Mα with finitely many samples.

This excludes pretty much all reasonable nonparametric classes of distributions, except for those with densities bounded below (an assumption nonparametric analyses sometimes make). You could probably kill those classes too with a similar argument by just making the densities constant or something.

Dougal
źródło
13

I don't know how to construct (if it exists) an unbiased estimator of the Hellinger distance. It seems possible to construct a consistent estimator. We have some fixed known density f0, and a random sample X1,,Xn from a density f>0. We want to estimate

H(f,f0)=1Xf(x)f0(x)dx=1Xf0(x)f(x)f(x)dx
=1E[f0(X)f(X)],
where Xf. By the SLLN, we know that
11ni=1nf0(Xi)f(Xi)H(f,f0),
almost surely, as n. Hence, a resonable way to estimate H(f,f0) would be to take some density estimator fn^ (such as a traditional kernel density estimator) of f, and compute
H^=11ni=1nf0(Xi)fn^(Xi).
Zen
źródło
3
@Zen: Good point! I consider this answer as the answer because it made me realise H sounds very much like a standard deviation, for which there exists no unbiased estimator. As for the variance of H^n2, no worries: E[(f0(X)/f(X))2]=1 implies that this estimator has a finite variance.
Xi'an
1
Thanks for the clarification about the variance of the estimator, Xi'an!
Zen
2
Some work on other consistent estimators: (a) arxiv.org/abs/1707.03083 and related work based on k-NN density estimators; (b) arxiv.org/abs/1402.2966 based on correcting kernel density estimates; (c) ieeexplore.ieee.org/document/5605355 based on a connection to classification. (Many of these are based on samples from both f and f0, because that's the work I knew about offhand, but I think there are variants for known f0.)
Dougal