W kontekście propozycji badań w naukach społecznych zadano mi następujące pytanie:
Zawsze ustalałem minimalną wielkość próby dla regresji wielokrotnej o 100 + m (gdzie m jest liczbą predyktorów). Czy to jest właściwe?
Często otrzymuję podobne pytania, często o różnych regułach. Często czytałem takie praktyczne zasady w różnych podręcznikach. Czasami zastanawiam się, czy popularność reguły pod względem cytowań zależy od tego, jak niski jest standard. Jestem jednak świadomy wartości dobrej heurystyki dla uproszczenia procesu decyzyjnego.
Pytania:
- Jaka jest użyteczność prostych reguł praktycznych dla minimalnych rozmiarów próbek w kontekście badaczy stosowanych opracowujących badania naukowe?
- Czy zasugerowałbyś alternatywną zasadę dotyczącą minimalnej wielkości próby dla regresji wielokrotnej?
- Alternatywnie, jakie alternatywne strategie sugerowałbyś do określenia minimalnej wielkości próby dla regresji wielokrotnej? W szczególności dobrze byłoby, gdyby wartość została przypisana do stopnia, w jakim dowolna strategia może być łatwo zastosowana przez statystykę niestatystyczną.
źródło
(+1) za rzeczywiście kluczowe, moim zdaniem, pytanie.
Większość wielkości próbek jest powiązana z siłą testów hipotezy, którą zamierzasz przetestować po dopasowaniu modelu regresji wielokrotnej.
Jest ładny kalkulator, który może być przydatny w modelach z wieloma regresjami i pewną formułą za kulisami. Wydaje mi się, że taki statystyczny kalkulator mógłby z łatwością zastosować statystyczny.
Prawdopodobnie artykuł K. Kelley i SEMaxwell może być pomocny w odpowiedzi na inne pytania, ale najpierw potrzebuję więcej czasu, aby przestudiować problem.
źródło
źródło
n=k(m+1)
?W psychologii:
Inne zasady, których można użyć to ...
źródło
N = 50 + 8 m
, że kwestionowano, czy rzeczywiście potrzebny jest termin 50Zgadzam się, że kalkulatory mocy są przydatne, szczególnie w celu zobaczenia wpływu różnych czynników na moc. W tym sensie kalkulatory zawierające więcej informacji wejściowych są znacznie lepsze. W przypadku regresji liniowej podoba mi się tutaj kalkulator regresji , który zawiera takie czynniki, jak błąd w X, korelacja między X i więcej.
źródło
( pdf )
Oczywiście, jak również potwierdzono w pracy, (względna) bezstronność niekoniecznie oznacza posiadanie wystarczającej mocy statystycznej. Jednak obliczenia mocy i wielkości próby są zwykle wykonywane przez określenie oczekiwanych efektów; w przypadku regresji wielokrotnej oznacza to hipotezę na temat wartości współczynników regresji lub macierzy korelacji między regresorami, a wynik musi zostać sformułowany. W praktyce zależy to od siły korelacji regresorów z wynikiem i między nimi (oczywiście im silniejsze, tym lepsza korelacja z wynikiem, podczas gdy sytuacja pogarsza się z wielokoliniowością). Na przykład, w skrajnym przypadku dwóch idealnie współliniowych zmiennych, nie można przeprowadzić regresji niezależnie od liczby obserwacji, a nawet przy tylko 2 współzmiennych.
źródło