Chciałbym zadać to pytanie w dwóch częściach. Oba dotyczą uogólnionego modelu liniowego, ale pierwszy dotyczy wyboru modelu, a drugi dotyczy regularyzacji.
Tło: Używam modeli GLM (liniowych, logistycznych, regresji gamma) zarówno do prognozowania, jak i do opisu. Kiedy odnoszę się do „ normalnych rzeczy, które robi się z regresją ”, mam na myśli głównie opis z (i) przedziałami ufności wokół współczynników, (ii) przedziałami ufności wokół prognoz i (iii) testami hipotez dotyczącymi liniowych kombinacji współczynników takich jak „jest jest różnica między leczeniem A a leczeniem B? ”.
Czy słusznie tracisz zdolność robienia tych rzeczy, stosując normalną teorię pod każdym z poniższych elementów? A jeśli tak, to czy te rzeczy są naprawdę dobre tylko dla modeli używanych do czystej prognozy?
I. Gdy GLM został dopasowany w procesie wyboru modelu (dla konkretności powiedz, że jest to procedura krokowa oparta na AIC).
II. Kiedy GLM został dopasowany metodą regularyzacji (powiedzmy używając glmnet w R).
Wydaje mi się, że w przypadku I. odpowiedź brzmi technicznie, że powinieneś użyć bootstrapu do „ normalnych rzeczy, które robi się z regresją ”, ale tak naprawdę nikt tego nie przestrzega.
Dodaj:
Po otrzymaniu kilku odpowiedzi i przeczytaniu gdzie indziej, oto moje zdanie na ten temat (dla wszystkich innych korzyści, jak również w celu otrzymania korekty).
I.
A) RE: Błąd uogólnienia. W celu uogólnienia poziomów błędów w nowych danych, gdy nie ma ustalonego wstrzymania, sprawdzanie poprawności krzyżowej może działać, ale trzeba całkowicie powtórzyć proces dla każdego zagięcia - używając zagnieżdżonych pętli - dlatego każdy wybór funkcji, dostrajanie parametrów itp. Musi być wykonywane niezależnie za każdym razem. Pomysł ten powinien dotyczyć wszelkich wysiłków związanych z modelowaniem (w tym metod karanych).
B) RE: Testowanie hipotez i przedziały ufności GLM.W przypadku korzystania z wyboru modelu (wybór funkcji, dostrajanie parametrów, wybór zmiennych) dla uogólnionego modelu liniowego i istnieje zestaw wstrzymania, można trenować model na partycji, a następnie dopasować model do pozostałych danych lub pełnego zestawu danych i użyj tego modelu / danych do przeprowadzenia testów hipotez itp. Jeśli zestaw wstrzymania nie istnieje, można użyć ładowania początkowego, o ile cały proces jest powtarzany dla każdej próbki ładowania początkowego. Ogranicza to testy hipotez, które można wykonać, ponieważ być może zmienna nie zawsze będzie na przykład wybierana.
C) RE: Nie dotyczy przewidywania przyszłych zestawów danych, a następnie dopasuj celowy model kierowany teorią i kilkoma testami hipotez, a nawet rozważ pozostawienie wszystkich zmiennych w modelu (znaczących lub nie) (na wzór Hosmera i Lemeshowa). Jest to klasyczny model regresji z małym zestawem zmiennych, a następnie pozwala na zastosowanie testu CI i testu hipotez.
D) RE: Regresja karana. Żadna rada, być może uważaj to za odpowiednie tylko do przewidywania (lub jako rodzaj wyboru funkcji, aby następnie zastosować go do innego zestawu danych, jak w punkcie B powyżej), ponieważ wprowadzone odchylenie sprawia, że testy CI i hipotezy są nierozsądne - nawet w przypadku ładowania początkowego.
Odpowiedzi:
Możesz przeczytać artykuł Davida Freedmana „ Uwaga na temat równania regresji skriningowej ” .
Wykorzystując całkowicie nieskorelowane dane w symulacji, pokazuje, że jeśli istnieje wiele predyktorów w stosunku do liczby obserwacji, wówczas standardowa procedura przesiewowa wytworzy końcową regresję, która zawiera wiele (więcej niż przez przypadek) znaczących predyktorów i bardzo istotny F Statystyczny. Ostateczny model sugeruje, że jest skuteczny w przewidywaniu wyniku, ale ten sukces jest fałszywy. Ilustruje również te wyniki za pomocą obliczeń asymptotycznych. Sugerowane rozwiązania obejmują badanie przesiewowe na próbce i ocenę modelu na pełnym zbiorze danych oraz wykorzystanie przynajmniej o rząd wielkości więcej obserwacji niż predyktorów.
źródło
Odnośnie 1) Tak, tracisz to. Patrz np. Strategie modelowania regresji Harrella, książka opublikowana przez Wiley lub artykuł, który przedstawiłem Davidowi Cassellowi zatytułowany „Stopping Stepwise” dostępny np. Www.nesug.org/proceedings/nesug07/sa/sa07.pdf
źródło