Mam zestaw danych, który reprezentuje rozkład wykładniczy. Chciałbym dopasować funkcję wykładniczą do tych danych. Próbowałem log przekształcić zmienną odpowiedzi, a następnie użyć najmniejszych kwadratów, aby dopasować linię; z zastosowaniem uogólnionego modelu liniowego z funkcją logarytmiczną i rozkładem gamma wokół zmiennej odpowiedzi; i używając nieliniowych najmniejszych kwadratów. Otrzymuję inną odpowiedź dla moich dwóch współczynników dla każdej metody, chociaż wszystkie są podobne. Jeśli mam zamieszanie, nie jestem pewien, którą metodę najlepiej zastosować i dlaczego. Czy ktoś może porównać i porównać te metody? Dziękuję Ci.
modeling
generalized-linear-model
least-squares
nonlinear-regression
curve-fitting
gdzie siła
źródło
źródło
Odpowiedzi:
Różnica jest w zasadzie różnicą w założonym rozkładzie losowego komponentu i tego, jak losowy komponent wchodzi w interakcję z leżącą u jego podstaw średnią.
Zastosowanie nieliniowych najmniejszych kwadratów skutecznie zakłada, że szum jest addytywny, ze stałą wariancją (a najmniejsze kwadraty to maksymalne prawdopodobieństwo normalnych błędów).
Pozostałe dwa zakładają, że szum jest multiplikatywny, a wariancja jest proporcjonalna do kwadratu średniej. Biorąc logi i dopasowując linię najmniejszych kwadratów, maksymalne prawdopodobieństwo dla logarytmicznego, podczas gdy GLM, który dopasowałeś, jest maksymalnym prawdopodobieństwem (przynajmniej dla jego średniej) dla gamma (nic dziwnego). Te dwa będą dość podobne, ale Gamma przyłoży mniejszą wagę do bardzo niskich wartości, a logarytmiczna przyłoży stosunkowo mniejszą wagę do najwyższych wartości.
(Należy zauważyć, że aby właściwie porównać oszacowania parametrów dla tych dwóch parametrów, należy poradzić sobie z różnicą między oczekiwaniami w skali logarytmicznej a oczekiwaniami w skali pierwotnej. Średnia transformowanej zmiennej nie jest ogólnie transformowaną średnią).
źródło