Różnica między LOESS a LOWESS

17

Jaka jest różnica między LOESS a LOWESS? Z Wikipedii widzę tylko, że LOESS jest uogólnieniem LOWESS. Czy mają nieco inne parametry?

pir
źródło

Odpowiedzi:

19

Myślę, że ważne jest, aby odróżnić metody od ich implementacji w oprogramowaniu. Główną różnicą w stosunku do pierwszego jest to, że lowess pozwala tylko na jeden predyktor, podczas gdy less może być użyty do wygładzenia danych wielowymiarowych na pewnego rodzaju powierzchni. Daje również przedziały ufności. W tych zmysłach less jest uogólnieniem. Podczas gdy domyślnym ustawieniem lowess jest użycie ważenia trójkołowego, Loess domyślnie wykonuje dopasowanie nieważone.

Teraz do wdrożenia. W niektórych programach lowess używa wielomianu liniowego, natomiast lessess używa wielomianu kwadratowego (choć można to zmienić). Domyślne i skróty używane przez algorytmy są często całkiem różne, więc trudno jest dokładnie dopasować wyjścia jednowymiarowe. Z drugiej strony nie znam przypadku, w którym wybór między tymi dwoma istotnie zmienił się.

Dimitriy V. Masterov
źródło
2
Artykuł Cleveland's LOWESS z 1979 r. W JASA . ma do tego wagę trójkołową. Zostało to wyraźnie wspomniane w kroku 4 na str. 831 „Solidnej lokalnie ważonej regresji i wygładzania wykresów rozrzutu”, William S. Cleveland, Journal of the American Statistics Association , t. 74 , nr 368 . (Dec., 1979), s. 829–836. Jeśli artykuł w Wikipedii jest dokładny, LOESS nie zmienił tego domyślnego - oboje to robią.
Glen_b
Może jednak nie jest to standardowe użycie. Wydaje mi się, że lowess zazwyczaj używa wielomianu liniowego, podczas gdy lessess używa wielomianu kwadratowego.
Dimitriy V. Masterov,
Kiedy jedno jest preferowane?
pir
8
Dokładne wyśledzenie różnic może być trudne, ponieważ Lowess ewoluowała w czasie, a less był po prostu tym, jak Bill Cleveland zaczął go nazywać po tym, jak niektórzy geolodzy, z którymi rozmawiał o lowess, powiedzieli mu, dlaczego przypomina im to less. W tym momencie przyjął nową nazwę, a potem to, co było „typowe”, dalej ewoluowało (nieznacznie). Istnieje więcej różnic między opcjami w dokumencie z 1979 r., Na który wskazałem powyżej, niż między typowymi implementacjami tych dwóch. Być może będziemy musieli wziąć pod uwagę dwa konkretne punkty tej ewolucji, aby zidentyfikować konkretne różnice.
Glen_b
6

Różnica jest niewielka, szczególnie w przypadku R. Oto bardzo szczegółowe wyjaśnienie: https://support.bioconductor.org/p/2323/

Zauważ jednak, że lowess () na liście danych wyjściowych R, podczas gdy loess () wypisuje model, który można wprowadzić do przewidywania ().

Guangbo Chen
źródło
1
dyskusja w linku jest doskonała. pokazuje dokładny związek między argumentem
cmo