Czy ktoś może skierować mnie w stronę internetowego (rekurencyjnego) algorytmu regularyzacji Tichonowa (uregulowane najmniejsze kwadraty)?
W trybie offline obliczyłem przy użyciu mojego oryginalnego zestawu danych, w którym znaleziono przy użyciu n-krotnej weryfikacji krzyżowej. Nową wartość można przewidzieć dla danego używając .
W trybie online ciągle rysuję nowe punkty danych. Jak mogę zaktualizować gdy narysuję nowe dodatkowe próbki danych bez pełnego przeliczania całego zestawu danych (oryginalny + nowy)?
Odpowiedzi:
NiechM−1n=(XXT+λI)−1 , a następnie
Zgodnie z formułą Woodbury mamy
W rezultacie,
Uśrednianie Polyak wskazuje, że możesz użyć do przybliżenia z zakresami od do . Możesz spróbować w swoim przypadku wybrać najlepszy dla swojej rekurencji.ηn=n−α M−1n1+xTnM−1nxn α 0.5 1 α
Myślę, że to działa również, jeśli zastosujesz algorytm gradientu wsadowego:
źródło
Sprawą, do której nikt dotąd nie zwrócił uwagi, jest to, że utrzymywanie stałego parametru regulowania stałym poziomie w miarę dodawania punktów danych nie ma sensu . Powodem tego jest to, że zwykle rośnie liniowo wraz z liczbą punktów danych, podczas gdy termin regularyzacji nie.λ ∥Xβ−y∥2 ∥λβ∥2
źródło
Być może może tu działać coś w rodzaju stochastycznego spadku . Oblicz przy użyciu powyższego równania w początkowym zestawie danych, który będzie początkowym oszacowaniem. Dla każdego nowego punktu danych można wykonać jeden krok spadku gradientu, aby zaktualizować oszacowanie parametru.β^
źródło
W regresji liniowej jedną z możliwości jest bezpośrednia aktualizacja rozkładu , jak wyjaśniono tutaj . Chyba, że jeśli nie chcesz ponownie oszacować po dodaniu każdego nowego punktu danych, coś bardzo podobnego można zrobić z regresją grzbietu.X λ
źródło
Oto alternatywne (i mniej złożone) podejście w porównaniu do użycia formuły Woodbury. Zauważ, że i można zapisać jako sumy . Ponieważ obliczamy rzeczy online i nie chcemy, aby suma się wysadziła, możemy alternatywnie użyć środków ( i ).XTX XTy XTX/n XTy/n
Jeśli napiszesz i jako:X y
możemy zapisać aktualizacje online do i (obliczone do rzędu) jako:XTX/n XTy/n t
Twój internetowy szacunek wtedyβ
Zauważ, że pomaga to również w interpretacji pozostającej stałej podczas dodawania obserwacji!λ
Ta procedura jest sposobem, w jaki https://github.com/joshday/OnlineStats.jl oblicza szacunki online regresji liniowej / kalenicowej.
źródło