Czy można zastosować rozbieżność KL między rozkładem dyskretnym a ciągłym?

12

Nie jestem matematykiem. Przeszukałem internet o dywergencji KL. Nauczyłem się, że dywergencja KL mierzy utracone informacje, gdy przybliżamy rozkład modelu w odniesieniu do rozkładu wejściowego. Widziałem je między dowolnymi dwoma ciągłymi lub dyskretnymi rozkładami. Czy możemy to zrobić między ciągłym a dyskretnym lub odwrotnie?

prakash
źródło
Powiązane: stats.stackexchange.com/q/6907/2970
kardynał

Odpowiedzi:

4

Nie: Rozbieżność KL jest definiowana tylko dla rozkładów na wspólnej przestrzeni. Pyta o gęstość prawdopodobieństwa punktu przy dwóch różnych rozkładach, i . Jeśli jest rozkładem na a rozkładem na , to nie ma sensu dla punktów i nie ma sensu dla punktów . W rzeczywistości nie możemy tego zrobić nawet dla dwóch ciągłych rozkładów w przestrzeniach o różnych wymiarach (lub dyskretnych, ani w żadnym innym przypadku, gdy leżące u podstaw przestrzenie prawdopodobieństwa nie pasują).xp(x)q(x)pR3qZq(x)pR3p(z)zZ

Jeśli masz na myśli konkretny przypadek, być może uda ci się wymyślić podobny podobieństwo miary między dystrybucjami. Na przykład sensowne może być zakodowanie ciągłego rozkładu pod kodem dla kodu dyskretnego (oczywiście z utraconą informacją), np. Przez zaokrąglenie do najbliższego punktu w przypadku dyskretnym.

Dougal
źródło
Należy zauważyć, że rozbieżność KL między rozkładami dyskretnymi i absolutnie ciągłymi jest dobrze zdefiniowana.
Olivier
@Olivier Zwykła definicja wymaga wspólnej dominującej miary, prawda?
Dougal
1
Masz rację, gdy P i Q są zdefiniowane w różnych przestrzeniach. Ale na wspólnej mierzalnej przestrzeni taka miara zawsze istnieje (na przykład P + Q), a rozbieżność KL nie zależy od konkretnego wyboru miary dominującej.
Olivier
8

Tak, rozbieżność KL między ciągłymi a dyskretnymi zmiennymi losowymi jest dobrze zdefiniowana. Jeśli i są rozkładami na jakiejś przestrzeni , to zarówno jak i mają gęstości , względem i PQXPQfgμ=P+Q

DKL(P,Q)=Xflogfgdμ.

Na przykład, jeśli , jest miarą Lebesgue'a, a jest masą punktową przy , to , iX=[0,1]PQ=δ00f(x)=11x=0g(x)=1x=0

DKL(P,Q)=.
Olivier
źródło
Jak udowodnić, że jest niezależny od dominującej miary? Xflogfgdμ
Gabriel Romon
Twierdzenie o zmianie miary.
Olivier
1

Nie ogólnie. Rozbieżność KL jest

DKL(P || Q)=Xlog(dPdQ)dP

pod warunkiem że P jest absolutnie ciągły w odniesieniu do Q i oboje P i Qσ- skończony (tj. w warunkach, w których dPdQ jest dobrze zdefiniowany).

W przypadku „ciągłej do dyskretnej” rozbieżności KL między miarami w jakiejś zwykłej przestrzeni, masz przypadek, w którym miara Lebesgue'a jest absolutnie ciągła w odniesieniu do miary liczenia, ale miara liczenia nie jest σ-skończone.

jtobin
źródło