Powiedzmy, że dopasowuję regresję wielokrotną zmiennych objaśniających. Test t pozwoli mi sprawdzić, czy którykolwiek z nich jest znaczący ( ). Mogę zrobić częściowy F-test, aby sprawdzić, czy jakiś podzbiór z nich jest istotna ( H 0 : β í = β j = . . . = Β k = 0 ).
Często jednak widzę, że ktoś otrzymuje 5 wartości p z 5 testów t (zakładając, że ma 5 zmiennych towarzyszących) i utrzymuje tylko te o wartości p <0,05. To wydaje się trochę niepoprawne, ponieważ tak naprawdę powinna istnieć kontrola wielokrotnego porównania, nie? Czy naprawdę słuszne jest stwierdzenie, że coś w rodzaju i β 2 jest znaczące, ale β 3 , β 4 i β 5 nie są znaczące ?
W powiązanej uwadze powiedzmy, że uruchamiam 2 regresje na 2 osobnych modelach (inny wynik). Czy konieczne jest wielokrotne sprawdzenie porównania istotnych parametrów między tymi dwoma wynikami?
Edycja: Aby odróżnić od podobnego pytania, czy istnieje jakakolwiek inna interpretacja wartości p oprócz: „B_i jest (nie) znaczący przy dostosowywaniu do wszystkich pozostałych zmiennych towarzyszących”? Nie wydaje się, że ta interpretacja pozwala mi spojrzeć na każdy B_i i upuścić te mniej niż 0,5 (co jest podobne do drugiego postu).
Wydaje mi się, że pewnym sposobem na sprawdzenie, czy B_i i Y mają związek, byłoby uzyskanie wartości współczynnika korelacji p dla każdej zmiennej towarzyszącej, a następnie wykonanie multcomp (chociaż na pewno straciłoby to sygnał).
Na koniec, powiedzmy, że obliczyłem korelację między B1 / Y1, B2 / Y1 i B3 / Y1 (a więc trzy wartości p). Niepowiązane również zrobiłem korelację między T1 / Y2, T2 / Y2, T3 / Y2. Zakładam, że poprawna korekta Bonferroniego wyniesie 6 dla wszystkich 6 testów razem (zamiast 3 dla pierwszej grupy i 3 dla drugiej grupy - i w ten sposób otrzymam 2 „p” skorygowane wartości p).
źródło
Odpowiedzi:
Inną możliwą strategią jest zastosowanie procedury dostosowania alfa, takiej jak korekta Bonferroniego. Powinieneś zdawać sobie sprawę, że zrobienie tego zmniejszy twoją moc, a także zmniejszy poziom błędu rodzinnego typu I. O tym, czy warto skorzystać z tego kompromisu, należy dokonać oceny. (FWIW, zwykle nie używam korekt alfa w regresji wielokrotnej).
Jeśli chodzi o pytanie, jak obsługiwać analizy z różnymi zmiennymi zależnymi, to, czy chcesz zastosować jakieś dopasowanie, zależy od tego, jak postrzegasz analizy względem siebie. Tradycyjnym pomysłem jest ustalenie, czy są one uważane za „rodzinę”. Omówiono tutaj: Jaka może być jasna, praktyczna definicja „rodziny hipotez”? Możesz także przeczytać ten wątek: Metody przewidywania wielu zmiennych zależnych .
źródło
Na poziomie praktycznym myślę, że należy również rozważyć, czy Betas odzwierciedlają poziomy zmiennych kategorialnych (tj. Manekinów). W tych okolicznościach uzasadnione jest zainteresowanie uzyskaniem informacji, czy dana Beta jest inna niż (znacząca) referencyjna Beta. Ale nawet przed porównaniem par trzeba się dowiedzieć, czy ogólne poziomy zmiennej kategorialnej są ważne (za pomocą wspólnego testu F lub testu współczynnika prawdopodobieństwa). Zaletą tego jest użycie mniejszej ilości df
źródło