Jakie są zastosowania lub zalety technik regresji redukcji wymiarów (DRR) lub technik nadzorowanej redukcji wymiarów (SDR) w porównaniu z tradycyjnymi technikami regresji (bez żadnej redukcji wymiarowości)? Ta klasa technik znajduje nisko wymiarową reprezentację zestawu cech dla problemu regresji. Przykłady takich technik obejmują krojenie regresji odwrotnej, główny kierunek Hesji, oszacowanie średniej krojonej wariancji, krojenie krojonej regresji odwrotnej, regresja głównych składników itp.
Jeśli chodzi o cross-validated RMSE, jeśli algorytm działał lepiej w zadaniu regresji bez żadnej redukcji wymiarowości, to jakie jest rzeczywiste zastosowanie redukcji wymiarowości do regresji? Nie rozumiem tych technik.
Czy te techniki są w ogóle wykorzystywane do zmniejszenia złożoności przestrzennej i czasowej regresji? Jeśli jest to podstawowa zaleta, pomocne byłyby niektóre zasoby dotyczące zmniejszania złożoności dla wysokowymiarowych zestawów danych podczas korzystania z tych technik. Dyskutuję o tym z faktem, że samo uruchomienie techniki DRR lub SDR wymaga trochę czasu i przestrzeni. Czy ta regresja SDR / DRR + w słabo przyciętym zestawie danych jest szybsza niż tylko regresja w słabym zestawie danych?
Czy to ustawienie zostało zbadane wyłącznie w sposób abstrakcyjny i nie ma dobrego zastosowania praktycznego?
Na boku: czasami są założenia, że wspólny rozkład cech i odpowiedź leży na różnorodności. Sensowne jest poznanie rozmaitości z obserwowanej próbki w tym kontekście w celu rozwiązania problemu regresji.Y
Odpowiedzi:
Zgodnie z hipotezą różnorodności zakłada się, że dane leżą na wielowymiarowym kolektorze, implikacją jest to, że resztką jest hałas, więc jeśli wykonasz redukcję wymiarów poprawnie, powinieneś poprawić wydajność poprzez modelowanie sygnału, a nie szumu. To nie tylko kwestia przestrzeni i złożoności.
źródło
Celem zmniejszenia wymiarów w regresji jest regularyzacja.
Większość wymienionych przez ciebie technik nie jest zbyt dobrze znana; Nie słyszałem o żadnym z nich oprócz regresji głównych składników (PCR). Odpowiem więc na temat PCR, ale oczekuję, że to samo dotyczy również innych technik.
Dwa kluczowe słowa to nadmierne dopasowanie i regularyzacja . W celu długiego leczenia i dyskusji odsyłam do elementów uczenia statystycznego , ale bardzo krótko, co się stanie, jeśli masz dużo predyktorów ( ), a za mało próbek ( ) jest to, że regresja standardowa zastąpi dane i będziesz skonstruować model, który wydaje się mieć dobrą wydajność na zestawie treningowym, ale w rzeczywistości ma bardzo słabą wydajność na dowolnym zestawie testowym.np n
W skrajnym przykładzie, gdy liczba predyktorów przekracza liczbę próbek (ludzie określają to jako problem ), faktycznie można idealnie dopasować dowolną zmienną odpowiedzi , osiągając pozornie wydajności. To wyraźnie nonsens.y 100 %p>n y 100%
Aby poradzić sobie z nadmiernym dopasowaniem, należy zastosować regularyzację , a istnieje wiele różnych strategii regularyzacji. W niektórych podejściach próbuje się drastycznie zmniejszyć liczbę predyktorów, redukując problem do sytuacji , a następnie zastosować standardową regresję. To właśnie robi regresja głównych składników. Zobacz Elementy , sekcje 3.4--3.6. PCR jest zwykle nieoptymalna i w większości przypadków niektóre inne metody regularyzacji będą działać lepiej, ale łatwo je zrozumieć i zinterpretować.p≪n
Zauważ, że PCR też nie jest arbitralne (np. Losowe utrzymywanie wymiarów prawdopodobnie będzie działało znacznie gorzej). Powodem tego jest to, że PCR jest ściśle związany z regresją kalenicy, która jest standardowym regulatorem skurczu, o którym wiadomo, że działa dobrze w wielu różnych przypadkach. Zobacz moją odpowiedź tutaj dla porównania: Związek między regresją kalenicy a regresją PCA .p
Aby zobaczyć wzrost wydajności w porównaniu ze standardową regresją, potrzebujesz zestawu danych z dużą ilością predyktorów i niezbyt wielu próbek, i zdecydowanie musisz użyć weryfikacji krzyżowej lub niezależnego zestawu testów. Jeśli nie zauważyłeś wzrostu wydajności, być może Twój zestaw danych nie miał wystarczających wymiarów.
Powiązane wątki z dobrymi odpowiedziami:
Regresja w ustawieniu (przewidywanie skuteczności leku na podstawie ekspresji genów za pomocą 30k predyktorów i ~ 30 próbek)p≫N
Regresja w ustawieniu : jak wybrać metodę regularyzacji (Lasso, PLS, PCR, grzbiet)?p>n
źródło