Chcę przeprowadzić regresję z 4 do 5 zmiennymi objaśniającymi, ale mam tylko 15 obserwacji. Nie będąc w stanie założyć, że te zmienne są normalnie rozmieszczone, czy istnieje nieparametryczna lub inna poprawna metoda regresji?
9
Chcę przeprowadzić regresję z 4 do 5 zmiennymi objaśniającymi, ale mam tylko 15 obserwacji. Nie będąc w stanie założyć, że te zmienne są normalnie rozmieszczone, czy istnieje nieparametryczna lub inna poprawna metoda regresji?
Odpowiedzi:
@Glen_b ma rację co do natury założenia normalności w regresji 1 .
Myślę, że twoim większym problemem będzie brak wystarczających danych do obsługi od 4 do 5 zmiennych objaśniających. Standardowa zasada 2 polega na tym, że powinieneś mieć co najmniej 10 danych na zmienną objaśniającą, tj. 40 lub 50 danych w twoim przypadku (i dotyczy to idealnych sytuacji, w których nie ma wątpliwości co do założeń). Ponieważ twój model nie byłby całkowicie nasycony 3(masz więcej danych niż parametrów do dopasowania), możesz uzyskać oszacowania parametrów (nachylenie itp.), aw idealnych okolicznościach oszacowania są asymptotycznie obiektywne. Jednak jest całkiem prawdopodobne, że twoje oszacowania będą dalekie od prawdziwych wartości, a twoje SE / CI będą bardzo duże, więc nie będziesz miał mocy statystycznej. Pamiętaj, że użycie nieparametrycznej lub innej alternatywnej analizy regresji nie wyciągnie Cię z tego problemu.
Musisz tutaj wybrać jedną zmienną objaśniającą (zanim spojrzysz na dane!) Na podstawie wcześniejszych teorii w twojej dziedzinie lub przeczuć albo powinieneś połączyć swoje zmienne objaśniające. Rozsądną strategią dla tej drugiej opcji jest uruchomienie analizy głównych składników (PCA) i użycie pierwszego podstawowego składnika jako zmiennej objaśniającej.
Odniesienia:
1. Co zrobić, jeśli reszty są normalnie rozłożone, ale Y nie jest?
2. Podstawowe zasady dotyczące minimalnej wielkości próby dla regresji wielokrotnej
3. Maksymalna liczba zmiennych niezależnych, które można wprowadzić do równania regresji wielokrotnej
źródło