Szerokość pasma jądra w szacowaniu gęstości jądra

10

Robię pewne oszacowanie gęstości jądra, z ustawionymi punktami ważonymi (tj. Każda próbka ma wagę, która nie jest konieczna), w wymiarach N. Próbki te znajdują się również w przestrzeni metrycznej (tzn. Możemy zdefiniować odległość między nimi), ale nic więcej. Na przykład nie możemy określić średniej punktów próby ani odchylenia standardowego, ani skalować jednej zmiennej w porównaniu do innej. Odległość ta wpływa na jądro i ciężar każdej próbki:

fa(x)=1.wmijasolhtsjawmijasolhtjahK.mirnmil(rejastzandomi(x,xja)h)

W tym kontekście, staram się znaleźć solidnego oszacowanie dla pasma jądra , ewentualnie przestrzennie zmiennym, a najlepiej co daje dokładną rekonstrukcję na zbiorze treningowym x I . W razie potrzeby możemy założyć, że funkcja jest względnie gładka.hxja

Próbowałem użyć odległości do pierwszego lub drugiego najbliższego sąsiada, ale daje to całkiem złe wyniki. Próbowałem z optymalizacją typu out-one-out, ale mam trudności ze znalezieniem dobrej miary do optymalizacji w tym kontekście w Nd, więc znajduje ona bardzo złe oszacowania, szczególnie dla samych próbek treningowych. Nie mogę użyć chciwej oceny opartej na normalnym założeniu, ponieważ nie mogę obliczyć standardowego odchylenia. Znalazłem referencje za pomocą macierzy kowariancji, aby uzyskać jądra anizotropowe, ale znowu nie byłoby w tej przestrzeni ...

Ktoś ma pomysł lub referencję?

WhitAngl
źródło
Jeśli możesz zmierzyć odległość, możesz zmierzyć średnią. Czy to prawda? Mógłbym powiedzieć „używam odległości cosinusowej dla słów”, więc „wredne słowo nie ma większego znaczenia”, ale nie rozumiem, dlaczego nie można go jeszcze obliczyć. Można powiedzieć, że jesteś w porządkowej przestrzeni, więc średnia nie jest ciągle wyceniana. Dlaczego średnia jest nieokreślona?
EngrStudent

Odpowiedzi:

2

W programie Matlab File Exchange dostępna jest funkcja kde, która zapewnia optymalną przepustowość przy założeniu, że używane jest jądro Gaussa: estymator gęstości jądra .

Nawet jeśli nie korzystasz z Matlaba, możesz przeanalizować ten kod w celu obliczenia optymalnej przepustowości. Jest to wysoko oceniana funkcja wymiany plików i korzystałem z niej wiele razy.

Elpezmuerto
źródło