wielokrotna regresja i wielokrotne porównania

10

Powiedzmy, że dopasowuję regresję wielokrotną zmiennych objaśniających. Test t pozwoli mi sprawdzić, czy którykolwiek z nich jest znaczący ( ). Mogę zrobić częściowy F-test, aby sprawdzić, czy jakiś podzbiór z nich jest istotna ( H 0 : β í = β j = . . . = Β k = 0 ).H0:βi=0H0:βi=βj=...=βk=0

Często jednak widzę, że ktoś otrzymuje 5 wartości p z 5 testów t (zakładając, że ma 5 zmiennych towarzyszących) i utrzymuje tylko te o wartości p <0,05. To wydaje się trochę niepoprawne, ponieważ tak naprawdę powinna istnieć kontrola wielokrotnego porównania, nie? Czy naprawdę słuszne jest stwierdzenie, że coś w rodzaju i β 2 jest znaczące, ale β 3 , β 4 i β 5 nie są znaczące ?β1β2β3β4β5

W powiązanej uwadze powiedzmy, że uruchamiam 2 regresje na 2 osobnych modelach (inny wynik). Czy konieczne jest wielokrotne sprawdzenie porównania istotnych parametrów między tymi dwoma wynikami?

Edycja: Aby odróżnić od podobnego pytania, czy istnieje jakakolwiek inna interpretacja wartości p oprócz: „B_i jest (nie) znaczący przy dostosowywaniu do wszystkich pozostałych zmiennych towarzyszących”? Nie wydaje się, że ta interpretacja pozwala mi spojrzeć na każdy B_i i upuścić te mniej niż 0,5 (co jest podobne do drugiego postu).

Wydaje mi się, że pewnym sposobem na sprawdzenie, czy B_i i Y mają związek, byłoby uzyskanie wartości współczynnika korelacji p dla każdej zmiennej towarzyszącej, a następnie wykonanie multcomp (chociaż na pewno straciłoby to sygnał).

Na koniec, powiedzmy, że obliczyłem korelację między B1 / Y1, B2 / Y1 i B3 / Y1 (a więc trzy wartości p). Niepowiązane również zrobiłem korelację między T1 / Y2, T2 / Y2, T3 / Y2. Zakładam, że poprawna korekta Bonferroniego wyniesie 6 dla wszystkich 6 testów razem (zamiast 3 dla pierwszej grupy i 3 dla drugiej grupy - i w ten sposób otrzymam 2 „p” skorygowane wartości p).

użytkownik1357015
źródło
1
To wygląda jak duplikat (tego pytania) [ stats.stackexchange.com/questions/3200/... jeśli nie, proszę powiedzieć, dlaczego nie.
Peter Flom
Cześć, Jest podobny, ale nie do końca taki sam. Być może lepszym pytaniem byłoby, gdy otrzyma się listę wartości p, jedyną możliwą interpretacją jest: „Kontrolując wszystkie pozostałe parametry, ta zmienna jest w / znacząca”. Jak byś na nie spojrzał.
user1357015
Jeśli chcesz edytować swoje pytanie, to w porządku, ale prawdopodobnie lepiej jest zrobić to w samym pytaniu, aby ludzie widzieli je jako pierwsze. Ale nie sądzę, co znaczy „jak byś wyglądał w ogóle na nich”.
Peter Flom

Odpowiedzi:

10

t

α=.051(1α)pp=5.23

Ft-testuje, ale usuwa wszystkie fałszywe kody i zamiast tego wykonuje test modelu zagnieżdżonego.

Inną możliwą strategią jest zastosowanie procedury dostosowania alfa, takiej jak korekta Bonferroniego. Powinieneś zdawać sobie sprawę, że zrobienie tego zmniejszy twoją moc, a także zmniejszy poziom błędu rodzinnego typu I. O tym, czy warto skorzystać z tego kompromisu, należy dokonać oceny. (FWIW, zwykle nie używam korekt alfa w regresji wielokrotnej).

p

b1x1+b2x2b1x1+b2x2+b3x3 .

Jeśli chodzi o pytanie, jak obsługiwać analizy z różnymi zmiennymi zależnymi, to, czy chcesz zastosować jakieś dopasowanie, zależy od tego, jak postrzegasz analizy względem siebie. Tradycyjnym pomysłem jest ustalenie, czy są one uważane za „rodzinę”. Omówiono tutaj: Jaka może być jasna, praktyczna definicja „rodziny hipotez”? Możesz także przeczytać ten wątek: Metody przewidywania wielu zmiennych zależnych .

gung - Przywróć Monikę
źródło
Dziękuję Ci za to. Właśnie tego potrzebowałem. Odnośnie twojego komentarza edogeneity. Ma to sens, ale wydaje się, że jeśli zrobię konserwatywną korektę Bonferroniego na wartościach korelacji p, nawet jeśli istnieje równość, korekta Bonferroniego powinna to uwzględnić, nie?
user1357015
Korekta Bonferroniego nie ma związku z endogennością. Jeśli twoje zmienne towarzyszące są w ogóle skorelowane względem siebie, jednowymiarowe korelacje XY będą tendencyjnymi szacunkami relacji. Powinieneś dopasować model, który chciałeś dopasować, i zatrzymać się na nim. Ogólnie rzecz biorąc, nie ma prawdziwej potrzeby, aby iść dalej. Jeśli potrzebujesz stworzyć prawdziwy model predykcyjny, powinieneś zastosować walidację krzyżową lub inne odpowiednie do tego techniki.
gung - Przywróć Monikę
0

Na poziomie praktycznym myślę, że należy również rozważyć, czy Betas odzwierciedlają poziomy zmiennych kategorialnych (tj. Manekinów). W tych okolicznościach uzasadnione jest zainteresowanie uzyskaniem informacji, czy dana Beta jest inna niż (znacząca) referencyjna Beta. Ale nawet przed porównaniem par trzeba się dowiedzieć, czy ogólne poziomy zmiennej kategorialnej są ważne (za pomocą wspólnego testu F lub testu współczynnika prawdopodobieństwa). Zaletą tego jest użycie mniejszej ilości df

Thomas Speidel
źródło