Regresję grzbietu można wyrazić jako gdzie jest przewidywaną etykietą , do identyfikacji macierzy pożądanego obiektu próbują znaleźć etykietę i macierz PRZEDMIOTY, takie, że:
Możemy jądro to w następujący sposób:
gdzie to macierzy funkcji jądra
i n \ razy 1 kolumna wektor funkcji jądra K
Pytania:
(a) jeśli istnieje więcej obiektów niż wymiary ma to sens, aby nie używać jądra? Np. Niech będzie macierzą , a następnie będzie a my skończymy odwracaniem macierzy zamiast macierzy musielibyśmy odwrócić, gdybyśmy użyli jąder. Czy to oznacza, że jeśli nie powinniśmy używać jąder?
(b) czy należy używać najprostszego możliwego jądra? Wydaje się, że jądra w regresji grzbietowej są używane do negowania wpływów wymiarowości i do niewykorzystywania pewnych właściwości przestrzeni cech (w przeciwieństwie do maszyn wektorów nośnych). Chociaż jądra mogą zmieniać odległości między obiektami, czy są jakieś popularne jądra często używane w regresji grzbietu?
(c) co jest czas złożoność regresji kalenicy i / lub jądra regresji Ridge?
źródło
Odpowiedzi:
(a) Celem użycia jądra jest rozwiązanie problemu regresji nieliniowej w tym przypadku. Dobre jądro pozwoli ci rozwiązać problemy w potencjalnie nieskończenie wymiarowej przestrzeni cech. Ale użycie liniowego jądra i wykonanie regresji grzbietu jądra w podwójnej przestrzeni jest równoznaczne z rozwiązaniem problemu w przestrzeni pierwotnej , tj. nie przynosi żadnej korzyści (jest po prostu znacznie wolniejszy, gdy liczba próbek rośnie, jak zauważyłeś).K(x,y)=x⊤y
(b) Jednym z najpopularniejszych wyborów jest kwadratowe jądro wykładnicze który jest uniwersalny (patrz odnośnik poniżej). Istnieje wiele różnych jąder, a każde z nich wywoła inny produkt wewnętrzny (a zatem metryczny) do przestrzeni funkcji.K(x,y)=exp(−τ2||x−y||2)
(c) Prosta implementacja wymaga rozwiązania liniowego równania wielkości , więc jest to . Istnieje wiele szybszych metod aproksymacji, takich jak aproksymacja Nyströma. Jest to obszar aktywnych badań.n O(n3)
Bibliografia:
źródło