Splajny vs regresja procesu Gaussa

15

Wiem, że regresja procesu Gaussa (GPR) jest alternatywą dla używania splajnów do dopasowania elastycznych modeli nieliniowych. Chciałbym wiedzieć, w jakich sytuacjach jedna byłaby bardziej odpowiednia niż druga, szczególnie w ramach regresji bayesowskiej.

Już spojrzałem na Jakie są zalety / wady używania splajnów, wygładzonych splajnów i emulatorów procesu gaussowskiego? ale w tym poście nie ma nic na temat GPR.

wed
źródło
Powiedziałbym, że GP jest bardziej opartym na danych podejściem do dopasowania funkcji nieliniowej. Splajny są zwykle ograniczone do n-tego wielomianu. GP mogą modelować bardziej złożone funkcje niż wielomiany (choć nie jest to w 100% pewne).
Vladislavs Dovgalecs

Odpowiedzi:

15

Zgadzam się z odpowiedzią @j __.

Chciałbym jednak podkreślić fakt, że splajny są tylko szczególnym przypadkiem regresji / krigingu Procesu Gaussa .

Jeśli weźmiesz pewien rodzaj jądra w regresji procesu Gaussa, uzyskasz dokładnie model dopasowania splajnu.

Fakt ten potwierdzają w tym artykule Kimeldorf i Wahba (1970) . Jest to raczej techniczne, ponieważ wykorzystuje połączenie między jądrami używanymi w krigingu a reprodukcją jądra Hilbert Spaces (RKHS).

Muzyka pop
źródło
2
Jako przykład, w przypadku jednowymiarowym, model GP słynnego wygładzającego splajnu jest po prostu podwójnie zintegrowanym białym szumem Gaussa. Zostało to wykorzystane przez Craiga Ansleya i Roberta Kohna do zaprojektowania wydajnych algorytmów pod koniec lat osiemdziesiątych. Uważam, że tę równoważność można częściowo zrozumieć bez nurkowania w głębokiej matematyce RKHS.
Yves
To bardzo dobra odpowiedź.
Astrid
6

To bardzo interesujące pytanie: ekwiwalent między procesami Gaussa a wygładzaniem splajnów wykazano w Kimeldorf i Wahba 1970. Uogólnienie tej korespondencji w przypadku ograniczonej interpolacji opracowano w Bay et al. 2016 r.

Bay i in. 2016. Uogólnienie korespondencji Kimeldorf-Wahba dla ograniczonej interpolacji. Electronic Journal of Statistics.

W tym artykule omówiono zalety podejścia bayesowskiego.

maatouk Hassan
źródło
2

Zgadzam się z komentarzem @ xeon, również GPR stawia rozkład prawdopodobieństwa na nieskończoną liczbę możliwych funkcji, a funkcja średnia (która jest podobna do splajnu) jest tylko oszacowaniem MAP, ale ty też masz w tym wariancję. Daje to ogromne możliwości, takie jak projektowanie eksperymentalne (wybór danych wejściowych, które są maksymalnie informacyjne). Również jeśli chcesz przeprowadzić integrację (kwadraturę) modelu, lekarz ogólny uzyska wynik gaussowski, który pozwoli ci zaufać twojemu wynikowi. Przynajmniej w przypadku standardowych modeli splajnów nie jest to możliwe.

W praktyce GPR daje bardziej pouczający wynik (z mojego doświadczenia), ale modele splajnu wydają się być szybsze z mojego doświadczenia.

jot__
źródło