Oszacowanie gęstości jądra w rozkładach asymetrycznych

10

Niech będą obserwacjami zaczerpniętymi z nieznanego (ale z pewnością asymetrycznego) rozkładu prawdopodobieństwa.{x1,,xN.}

Ja jak znaleźć rozkład prawdopodobieństwa stosując podejście Próbowałem jednak użyć jądra Gaussa, ale działało to źle, ponieważ jest symetryczne. Widziałem więc, że niektóre prace dotyczące jąder Gamma i Beta zostały wydane, chociaż nie rozumiałem, jak z nimi pracować.

fa^(x)=1N.hja=1N.K.(x-xjah)

Moje pytanie brzmi: jak poradzić sobie z tym asymetrycznym przypadkiem, zakładając, że obsługa rozkładu podstawowego nie znajduje się w przedziale ?[0,1]

Eleanore
źródło
4
W przypadku gęstości bliskich lognormalowi (które często spotykam w niektórych konkretnych aplikacjach), po prostu przekształcam (biorąc logi), a następnie wykonuję KDE, a następnie przekształcam KDE z powrotem (musisz pamiętać jakobian podczas transformacji oszacowanie z powrotem). W tym przypadku działa całkiem dobrze.
Glen_b
@Glen_b czy masz jakieś odniesienia lub materiały, w których opisano tę metodę? (Obliczanie KDE na podstawie transformacji oryginalnej zmiennej, a następnie przekształcanie KDE z powrotem)
boscovich
Nie wiem o tym - jestem pewien, że istnieją, ponieważ jest to dość trywialny pomysł, który można łatwo wdrożyć. Tego właśnie spodziewałbym się, że statystyki mogą być w stanie wyprowadzić. W praktyce działa bardzo dobrze.
Glen_b
@glen_b dzięki. Więc jeśli miałbym użyć go w raporcie / publikacji technicznej, czy uważasz, że nie byłoby w porządku podawać żadnych referencji?
boscovich
1
@guy Z pewnością można mieć problemy, szczególnie w przypadku niektórych transformacji i niektórych rodzajów danych. Sytuacje, z których korzystałem, wydają się być dość zbliżone do logarytmicznych, a tam zmiana przepustowości, którą widzisz jako problem, jest dokładnie tym, czego potrzebujesz; radzi sobie znacznie lepiej niż KDE na surowych danych. Z opisu PO brzmiało to dość podobnie, ale nie sugerowałem, że to panaceum .
Glen_b

Odpowiedzi:

5

Po pierwsze, KDE z jądrem symetrycznym może również działać bardzo dobrze, gdy dane są asymetryczne. W przeciwnym razie byłoby to całkowicie bezużyteczne w praktyce.

Po drugie, czy zastanawiałeś się nad przeskalowaniem swoich danych, aby naprawić asymetrię, jeśli uważasz, że to powoduje problem? Na przykład dobrym pomysłem może być pójście do niegolog(x), ponieważ wiadomo, że pomaga to w wielu problemach.

Ma ZAKOŃCZENIE - Anony-Mus
źródło
Jeśli przeskalujesz do log(x), czy musisz również wziąć pod uwagę jakobian?
DilithiumMatrix
0

Hmm Możesz chcieć szerokości jądra, która zmienia się w zależności od lokalizacji.

Gdybym patrzył na problem w eCDF, mógłbym spróbować zrobić liczbowe nachylenie CDF związane z rozmiarem jądra.

Myślę, że jeśli zamierzasz wykonać transformację współrzędnych, musisz mieć całkiem niezłe pojęcie o punktach początkowym i końcowym. Jeśli znasz dobrze rozkład docelowy, nie potrzebujesz przybliżenia jądra.

EngrStudent
źródło
1
Bardzo łatwo mogłem wiedzieć, że moje RV są nieujemne, ale nadal chcę KDE.
facet