Czytałem następujący link o regresji nieliniowej SAS Nieliniowy . Rozumiem po przeczytaniu pierwszego rozdziału „Regresja nieliniowa vs. regresja liniowa”, że poniższe równanie jest w rzeczywistości regresją liniową, czy to prawda? Jeśli tak to dlaczego?
Czy mam również zrozumieć, że w regresji nieliniowej wielokoliniowość nie stanowi problemu? Wiem, że wielokoliniowość może być problemem w regresji liniowej, więc na pewno, jeśli powyższy model jest w rzeczywistości regresją liniową, istniałaby wielokoliniowość?
Odpowiedzi:
Istnieją (przynajmniej) trzy zmysły, w których regresję można uznać za „liniową”. Aby je rozróżnić, zacznijmy od wyjątkowo ogólnego modelu regresji
Aby uprościć dyskusję, weź zmienne niezależne do ustalenia i dokładnego zmierzenia (zamiast zmiennych losowych). Ich podstawowych obserwacji atrybutów każda, która prowadzi do -wektor odpowiedzi . Konwencjonalnie jest reprezentowane jako macierz , a jako kolumna wektor. (Skończony wektor) zawiera parametry . jest losową zmienną o wartości wektorowej. Zwykle man p n Y X n × p Y n q θ ε n f n Y θ εX n p n Y X n×p Y n q θ ε n elementy, ale czasami ma mniej. Funkcja ma wartość wektorową (z składnikami pasującymi do ) i zwykle przyjmuje się, że jest ona ciągła w dwóch ostatnich argumentach ( i ).f n Y θ ε
Archetypowym przykładem dopasowania linii do danych jest przypadek, gdy jest wektorem liczb - wartości x; jest wektorem równoległym liczb ; podaje punkt przecięcia i nachylenie ; i jest wektorem „błędów losowych”, których składniki są niezależne (i zwykle przyjmuje się, że mają identyczne, ale nieznane rozkłady średniej wartości zerowej). W poprzednim zapisieX ( x i ,(x,y) X Y n ( y i ) θ = ( α , β ) α β ε = ( ε 1 , ε 2 , … , ε n )(xi,i=1,2,…,n) Y n (yi) θ=(α,β) α β ε=(ε1,ε2,…,εn)
z .θ=(α,β)
Funkcja regresji może być liniowa w dowolnym (lub we wszystkich) z trzech argumentów:
„Regresja liniowa lub„ model liniowy ”zwykle oznacza, że jest liniowy jako funkcja parametrów . W tym znaczeniu znaczenie SAS oznacza„ regresja nieliniowa ” , z dodatkowym założeniem, że jest różniczkowalna w drugim argument (parametry) To założenie ułatwia znalezienie rozwiązań.θ ff θ f
Określenie „liniowa zależność między i ” środki jest liniowy w funkcji .Y f XX Y f X
Model ma błędy addytywne, gdy jest liniowe w . W takich przypadkach zawsze zakłada się, że . (W przeciwnym razie nie byłoby słuszne myśleć o jako „błędach” lub „odchyleniach” od „poprawnych” wartości).ε E ( ε ) = 0 εf ε E(ε)=0 ε
Każda możliwa kombinacja tych cech może się zdarzyć i jest przydatna. Zbadajmy możliwości.
Model liniowy relacji liniowej z błędami addytywnymi. Jest to zwykła (wielokrotna) regresja, już pokazana powyżej i bardziej ogólnie zapisana jako
θ strX został zwiększony, jeśli to konieczne, poprzez przyleganie do kolumny stałych, a jest wektorem .θ p
Model liniowy relacji nieliniowej z błędami addytywnymi. Można to sformułować jako regresję wielokrotną, rozszerzając kolumny o nieliniowe funkcje samegoNa przykład,XX X
jest w tej formie. Jest liniowy w ; ma błędy addytywne; i jest liniowy w wartościach mimo że jest nieliniową funkcją .( 1 , x 2 i ) x 2 i x iθ=(α,β) (1,x2i) x2i xi
Model liniowy relacji liniowej z błędami nieaddytywnymi. Przykładem jest błąd multiplikatywny,
(W takich przypadkach można interpretować jako „błędy multiplikatywne”, gdy lokalizacja wynosi Jednak właściwym wyczuciem lokalizacji niekoniecznie jest oczekiwanie : może to być na przykład mediana lub średnia geometryczna. Podobny komentarz na temat założeń dotyczących lokalizacji stosuje się mutatis mutandis również we wszystkich innych kontekstach nieaddytywnych).εi εi 1 E(εi)
Model liniowy relacji nieliniowej z błędami nieaddytywnymi. na przykład ,
Nieliniowy model zależności liniowej z błędami addytywnymi. Model nieliniowy obejmuje kombinacje jego parametrów, które nie tylko są nieliniowe, ale nie można ich nawet zlinearyzować poprzez ponowne wyrażenie parametrów.
Jako przykład nie rozważ tego
Poprzez zdefiniowanie i i ograniczenie , model ten można przepisaćα′=αβ β′=β2 β′≥0
pokazując go jako model liniowy (relacji liniowej z błędami addytywnymi).
Jako przykład rozważ
Niemożliwe jest znalezienie nowego parametru , w zależności od , który zlinearyzuje go jako funkcję (jednocześnie zachowując liniowość również w ).α′ α α′ xi
Nieliniowy model relacji nieliniowej z błędami addytywnymi.
Nieliniowy model zależności liniowej z nieaddytywnymi błędami.
Nieliniowy model relacji nieliniowej z nieaddytywnymi błędami.
Chociaż wykazują one osiem różnych form regresji, nie stanowią one systemu klasyfikacji, ponieważ niektóre formy można przekształcić w inne. Standardowym przykładem jest konwersja modelu liniowego z błędami nieaddytywnymi (zakłada się, że ma wsparcie dodatnie)
do modelu liniowego relacji nieliniowej z błędami addytywnymi za pomocą logarytmu,
Tutaj średnia geometryczna dziennika została usunięta ze składników błędów (aby upewnić się, że mają zero środków, zgodnie z wymaganiami) i została włączona do innych warunków (gdzie należy oszacować jego wartość). Rzeczywiście, jednym z głównych powodów ponownego wyrażenia zmiennej zależnej jest stworzenie modelu z błędami addytywnymi. Ponowna ekspresja może również zlinearyzować jako funkcję jednego (lub obu) parametrów i zmiennych objaśniających.μi=E(log(εi)) Y Y
Kolinearność
Kolinearność (wektorów kolumnowych w ) może być problemem w dowolnej formie regresji. Kluczem do zrozumienia tego jest uznanie, że kolinearność prowadzi do trudności w oszacowaniu parametrów. Streszczenie i całkiem ogólnie, porównaj dwa modele i gdzie to z jedną kolumną nieznacznie zmienione. Jeśli to powoduje ogromne zmiany w szacunkach i , to oczywiście mamy problem. Jednym ze sposobów powstania tego problemu jest model liniowy, liniowy wY = F ( x , θ , ε ) T = f ( x ' , θ , ε ' ) X ' X θ θ ' X θ XX Y=f(X,θ,ε) Y=f(X′,θ,ε′) X′ X θ^ θ^′ X (to jest typu (1), lub (5) powyżej), przy czym składniki są odpowiednio jeden do jednego z kolumny . Gdy jedna kolumna jest nietrywialną liniową kombinacją innych, oszacowanie odpowiadającego jej parametru może być dowolną liczbą rzeczywistą. To skrajny przykład takiej wrażliwości.θ X
Z tego punktu widzenia powinno być jasne, że kolinearność jest potencjalnym problemem dla liniowych modeli zależności nieliniowych (niezależnie od addytywności błędów) i że ta uogólniona koncepcja kolinearności jest potencjalnie problemem w każdym modelu regresji. Gdy masz nadmiarowe zmienne, będziesz mieć problemy z identyfikacją niektórych parametrów.
źródło
Powinieneś zacząć już teraz, wprowadzając różnicę między rzeczywistością a modelem, którego używasz do jej opisu
Wspomniane równanie jest równaniem wielomianowym (moc x ^), tj. nieliniowy ... ale nadal można go modelować za pomocą uogólnionego modelu liniowego (za pomocą funkcji łącza) lub regresji wielomianowej, ponieważ parametry są liniowe (b1, b2, b3, c)
miejmy nadzieję, że pomogło, w rzeczywistości jest trochę szkicowe: rzeczywistość / model
źródło
Model jest liniowy, jeśli ma parametry liniowe lub może zostać przekształcony w parametry liniowe (linearyzowalne). Modele liniowe mogą modelować zależności liniowe lub nieliniowe. Rozwińmy każdy z nich.
Model jest liniowy w parametrach, jeśli może być zapisana jako suma warunków, w którym każdy składnik jest albo stała albo parametr pomnożenie predykcyjnych (X I ):
Zauważ, że ta definicja jest bardzo wąska. Tylko modele spełniające tę definicję są liniowe. Każdy inny model jest nieliniowy.
Istnieją dwa typy modeli liniowych, które są mylone z modelami nieliniowymi:
1. Modele liniowe relacji nieliniowych
Na przykład poniższy model modeluje relację nieliniową (ponieważ pochodna Y w odniesieniu do X 1 jest funkcją X 1 ). Tworząc nową zmienną W 1 = X 1 2 i ponownie zapisując równanie z W 1 zastępującym X 1 2 , otrzymujemy równanie, które spełnia definicję modelu liniowego.
2. Modele, które nie są od razu liniowe, ale mogą stać się liniowe po transformacji (linearyzowalne). Poniżej znajdują się 2 przykłady modeli z możliwością linearyzacji:
Przykład 1:
Model ten może wydawać się nieliniowy, ponieważ nie spełnia definicji modelu o parametrach liniowych, jednak może zostać przekształcony w model liniowy, dlatego jest liniowy / transformowalny liniowy, a zatem jest uważany za liniowy Model. Poniższe przekształcenia zlinearyzowałyby go. Zacznij od logarytmu naturalnego obu stron, aby uzyskać:
następnie dokonaj następujących zmian:
aby uzyskać model liniowy poniżej:
Przykład 2:
Model ten może wydawać się nieliniowy, ponieważ nie spełnia definicji modelu o parametrach liniowych, jednak może zostać przekształcony w model liniowy, dlatego jest liniowy / transformowalny liniowy, a zatem jest uważany za liniowy Model. Poniższe przekształcenia zlinearyzowałyby go. Zacznij od wzajemności obu stron, aby uzyskać:
następnie dokonaj następujących zmian:
aby uzyskać model liniowy poniżej:
Każdy model, który nie jest liniowy (nawet poprzez linearyzację), jest nieliniowy. Pomyśl o tym w ten sposób: jeśli model nie spełnia definicji modelu liniowego, jest to model nieliniowy, chyba że można udowodnić, że jest on linearyzowalny, w którym to momencie zyskuje prawo do nazwania go modelem liniowym.
Powyższa odpowiedź Whubera, a także odpowiedź Glen_b w tym linku dodają więcej koloru mojej odpowiedzi. Nieliniowy vs. uogólniony model liniowy: jak odnosisz się do regresji logistycznej, Poissona itp.?
źródło