W przeszłości stosowano regresję krokową w wielu pracach biomedycznych, ale wydaje się, że poprawia się to wraz z lepszą edukacją wielu zagadnień. Jednak wielu starszych recenzentów wciąż o to prosi. Jakie są okoliczności, w których regresja krokowa odgrywa rolę i powinna być stosowana, jeśli w ogóle?
regression
multiple-regression
feature-selection
model-selection
stepwise-regression
bobmcpop
źródło
źródło
Odpowiedzi:
Nie zdaję sobie sprawy z sytuacji, w których preferowanym podejściem byłaby regresja krokowa. Może być w porządku (szczególnie w wersji obniżającej, zaczynając od pełnego modelu) z ładowaniem całego procesu krokowego na bardzo dużych zestawach danych za pomocą . Tutaj to liczba obserwacji w wyniku ciągłym (lub liczba zapisów ze zdarzeniem w analizie przeżycia) to liczba kandydujących predyktorów, w tym wszystkie rozważane interakcje - tj. Gdy jakiekolwiek nawet małe efekty stają się bardzo wyraźne i nie ma to znaczenia w dużej mierze jak budujesz swój model (oznaczałoby to, że byłoby znacznie większe niż niż znacznie więcej niż czasami podawany współczynnik 20).n > > t n p n p
Oczywiście powodem, dla którego większość ludzi ma ochotę zrobić coś takiego jak regresja krokowa, jest:
Oznacza to, że metoda taka jak regresja krokowa byłaby (gdyby miała dobrą charakterystykę operacyjną) szczególnie atrakcyjna w tych sytuacjach, gdy nie ma dobrych charakterystyk operacyjnych.
źródło
Są dwa przypadki, w których nie sprzeciwiałbym się regresji stopniowej
W obu tych bardzo ważnych przypadkach użycia nie obawiasz się tak bardzo tradycyjnego wnioskowania statystycznego, więc fakt, że wartości p itp. Nie są już ważne, nie stanowi problemu.
Na przykład, jeśli artykuł badawczy powiedział: „W naszym badaniu pilotażowym zastosowaliśmy regresję krokową, aby znaleźć 3 interesujące zmienne spośród 1000. W badaniu uzupełniającym z nowymi danymi pokazaliśmy, że te 3 interesujące zmienne były silnie skorelowane z wynik zainteresowania ”, nie miałbym problemu z zastosowaniem regresji stopniowej. Podobnie: „Zastosowaliśmy regresję krokową, aby zbudować model predykcyjny. Ten przeformowany model alternatywny X w naszym zbiorze danych dotyczących MSE” jest dla mnie również w porządku.
Dla jasności nie twierdzę, że regresja stopniowa jest najlepszym sposobem na rozwiązanie tych problemów. Ale jest to łatwe i może dać satysfakcjonujące rozwiązania.
EDYTOWAĆ:
W komentarzach pojawia się pytanie, czy krokowe AIC może być rzeczywiście przydatne do przewidywania. Oto symulacja, która pokazuje, że radzi sobie znacznie lepiej niż regresja liniowa ze wszystkimi zmiennymi towarzyszącymi, a także prawie równie elastycznymi sieciami z karą wybraną w drodze weryfikacji krzyżowej.
Nie wziąłbym tej symulacji za koniec dyskusji; nie jest trudno wymyślić scenariusz, w którym stopniowe AIC będzie gorsze. Ale tak naprawdę nie jest to nieracjonalny scenariusz, a dokładnie taki rodzaj sytuacji, w którym zaprojektowano siatki elastyczne (wysoka korelacja zmiennych towarzyszących z bardzo małą ilością dużych efektów)!
Dygresja:
Naprawdę nie jestem fanem regresji krokowej z wielu, wielu powodów, więc czuję się trochę niezręcznie, przyjmując to stanowisko w obronie tego. Uważam jednak, że ważne jest precyzyjne określenie dokładnie tego, co mi się nie podoba.
źródło