Robię pewne oszacowanie gęstości jądra, z ustawionymi punktami ważonymi (tj. Każda próbka ma wagę, która nie jest konieczna), w wymiarach N. Próbki te znajdują się również w przestrzeni metrycznej (tzn. Możemy zdefiniować odległość między nimi), ale nic więcej. Na przykład nie możemy określić średniej punktów próby ani odchylenia standardowego, ani skalować jednej zmiennej w porównaniu do innej. Odległość ta wpływa na jądro i ciężar każdej próbki:
W tym kontekście, staram się znaleźć solidnego oszacowanie dla pasma jądra , ewentualnie przestrzennie zmiennym, a najlepiej co daje dokładną rekonstrukcję na zbiorze treningowym x I . W razie potrzeby możemy założyć, że funkcja jest względnie gładka.
Próbowałem użyć odległości do pierwszego lub drugiego najbliższego sąsiada, ale daje to całkiem złe wyniki. Próbowałem z optymalizacją typu out-one-out, ale mam trudności ze znalezieniem dobrej miary do optymalizacji w tym kontekście w Nd, więc znajduje ona bardzo złe oszacowania, szczególnie dla samych próbek treningowych. Nie mogę użyć chciwej oceny opartej na normalnym założeniu, ponieważ nie mogę obliczyć standardowego odchylenia. Znalazłem referencje za pomocą macierzy kowariancji, aby uzyskać jądra anizotropowe, ale znowu nie byłoby w tej przestrzeni ...
Ktoś ma pomysł lub referencję?
źródło
Odpowiedzi:
źródło
W programie Matlab File Exchange dostępna jest funkcja kde, która zapewnia optymalną przepustowość przy założeniu, że używane jest jądro Gaussa: estymator gęstości jądra .
Nawet jeśli nie korzystasz z Matlaba, możesz przeanalizować ten kod w celu obliczenia optymalnej przepustowości. Jest to wysoko oceniana funkcja wymiany plików i korzystałem z niej wiele razy.
źródło