Interesuje mnie nauka (i wdrażanie) alternatywy dla interpolacji wielomianowej.
Mam jednak problem ze znalezieniem dobrego opisu działania tych metod, ich powiązań i porównania.
Byłbym wdzięczny za Twój wkład w zalety / wady / warunki, w których te metody lub alternatywy byłyby przydatne, ale wystarczą dobre odniesienia do tekstów, slajdów lub podcastów.
interpolation
splines
David LeBauer
źródło
źródło
Odpowiedzi:
Podstawowa regresja OLS jest bardzo dobrą techniką dopasowania funkcji do zestawu danych. Jednakże Regresja pasuje tylko do linii prostej, która jest stała w całym możliwym zakresie . Może to nie być odpowiednie w danej sytuacji. Na przykład dane czasami pokazują związek krzywoliniowy . Można temu zaradzić poprzez regresję Y na transformację X , f ( X ) . Możliwe są różne transformacje. W sytuacjach, w których związek między X i Y jest monotoniczny , ale stale się zmniejsza, transformacja logówX Y X f(X) X Y może być użyte. Innym popularnym wyborem jest użycie wielomianu, w którym nowe warunki są tworzone przez podniesienie do szeregu potęg (np. X 2 , X 3 itd.). Ta strategia jest łatwa do wdrożenia i można zinterpretować dopasowanie jako wskazujące, ile „zagięć” istnieje w danych (gdzie liczba zagięć jest równa najwyższej potrzebnej mocy minus 1). X X2 X3
Jednak regresje oparte na logarytmie lub wykładniku współzmiennej pasują optymalnie tylko wtedy, gdy taka jest dokładna natura prawdziwej relacji. Rozsądne jest wyobrażenie sobie, że istnieje zależność między krzywiznami między a YX Y która różni się od możliwości, jakie dają te transformacje. Tak więc dochodzimy do dwóch innych strategii. Pierwszym podejściem jest less , seria ważonych regresji liniowych obliczonych nad ruchomym oknem. To podejście jest starsze i lepiej nadaje się do analizy danych eksploracyjnych .
Inne podejście polega na użyciu splajnów. Na to najprostszy, splajnem to nowy termin, który odnosi się tylko do części z zakresu . Na przykład X może mieścić się w zakresie od 0 do 1, a składnik splajnu może mieścić się w zakresie od 0,7 do 1. W tym przypadku .7 jest węzłem . Prosty, liniowy składnik splajnu zostałby obliczony w następujący sposób: X s p l i n e = { 0X X
i zostanie dodany do twojego modelu,opróczoryginalnegoterminuX. Dopasowany model będzie wykazywał ostre zerwanie na 0,7 z linią prostą od 0 do 0,7, a linia będzie kontynuowała z innym nachyleniem od 0,7 do 1. Jednak składnik splajnu nie musi być liniowy. W szczególności ustalono, że splajny sześcienne są szczególnie przydatne (tj.X 3 s p l i n e
Najprostsze wprowadzenie do tych tematów, które znam, to:
źródło
Internetowe notatki Cosmy Shalizi na temat jego wykładu Zaawansowana analiza danych z podstawowego punktu widzenia są dość dobre na ten temat, patrząc na rzeczy z perspektywy, w której interpolacja i regresja są dwoma podejściami do tego samego problemu. Chciałbym szczególnie zwrócić uwagę na rozdziały dotyczące metod wygładzania i splajnów .
źródło