Przeprowadziłem regresję liniową, która wyszła ze znaczącym wynikiem, jednak kiedy sprawdziłem liniowość wykresu rozrzutu, nie byłem pewien, czy dane są liniowe.
Czy istnieją inne sposoby testowania liniowości bez sprawdzania wykresu rozrzutu?
Czy regresja liniowa może być znacząca, jeśli nie jest liniowa?
[Edytowane w celu uwzględnienia wykresów rozrzutu]
regression
IntoTheBlue
źródło
źródło
Odpowiedzi:
Monotoniczne relacje nieliniowe prawie zawsze będą znaczące podczas modelowania jako modele liniowe. Jeśli związek jest nieliniowy i nie monotoniczny, to zależy od próbki.
Przykładami relacji monotonicznych jest logarytm i potęgi nieparzyste, takie jak . Przykładem związków niemonotonicznych są nawet moce i funkcje trygonomiczne, takie jak .y = x 3 y = x 2 y = sin xy=lnx y=x3 y=x2 y=sinx
Na przykład, jeśli twoja próbka jest dla , to zamodelowany jako będzie prawdopodobnie znaczący, zobacz wykres:y = sin x y ∼ xx∈[−1,1] y=sinx y∼x
Jeśli jednak twoja próbka jest w , modelowanie liniowe w ogóle nie będzie działać:x∈[0,π]
źródło
Tak, Aksakal ma rację, a regresja liniowa może być znacząca, jeśli prawdziwy związek jest nieliniowy. Regresja liniowa znajduje linię najlepszego dopasowania danych i po prostu sprawdza, czy nachylenie jest znacząco różne od 0.
Zanim spróbuję znaleźć statystyczny test nieliniowości, sugeruję zastanowienie się nad tym, co chcesz modelować w pierwszej kolejności. Czy spodziewasz się liniowej (nieliniowej) zależności między dwiema zmiennymi? Co dokładnie próbujesz odkryć? Jeśli ma sens założenie, że istnieje nieliniowa zależność, na przykład między prędkością samochodu i drogą hamowania, możesz dodać kwadratowe wyrażenia (lub inne transformacje) zmiennej niezależnej.
Również wizualna kontrola twoich danych (wykres rozrzutu) jest bardzo skuteczną metodą i niezbędnym pierwszym krokiem w twojej analizie.
źródło
Zgadzam się ze wszystkim, co mówi Aksakal. Ale co do pierwszego pytania, myślę, że odpowiedzią jest korelacja. Korelacja mierzy stopień, w jakim istnieje liniowa zależność między zbiorami danych x i y.
źródło