Jako założenie regresji liniowej normalność rozkładu błędu jest czasami błędnie „rozszerzana” lub interpretowana jako potrzeba normalności y lub x.
Czy można skonstruować scenariusz / zestaw danych, w którym X i Y są nienormalne, ale wartość błędu jest, a zatem uzyskane szacunki regresji liniowej są prawidłowe?
Odpowiedzi:
Rozszerzanie komentarza Hong Oois o obraz. Oto obraz zestawu danych, w którym żaden z marginesów nie jest normalnie rozłożony, ale reszty nadal są, dlatego założenia regresji liniowej są nadal aktualne:
Obraz został wygenerowany przez następujący kod R:
źródło