Modele ukarane mogą być wykorzystane do oszacowania modeli, w których liczba parametrów jest równa lub nawet większa niż wielkość próbki. Taka sytuacja może wystąpić w logarytmiczno-liniowych modelach dużych rzadkich tabel danych kategorialnych lub zliczających. W tych ustawieniach często jest również pożądane lub pomocne zwijanie tabel poprzez łączenie poziomów czynnika, przy czym poziomy te nie są rozróżnialne pod względem interakcji z innymi czynnikami. Dwa pytania:
- Czy istnieje sposób na zastosowanie modeli karanych, takich jak LASSO lub elastyczna siatka, do testowania zwijalności poziomów w ramach każdego czynnika?
- Jeśli odpowiedź na pierwsze pytanie brzmi „tak”, czy można i należy to ustawić w taki sposób, aby załamanie poziomów i oszacowanie współczynników modelu nastąpiło w jednym kroku?
Odpowiedzi:
To jest możliwe. W tym celu możemy użyć wariantu stopionego lassa .
Możemy użyć estymatora
Zauważ, że jest funkcją straty dla log-liniowej modele.−1n∑ni=1(yiβTxi−eβTxi)
To zachęca do równości współczynników w grupie. Ta równość współczynników jest równoważna zwijaniu poziomów i razem. W przypadku, gdy , jest to równoważne poziomu z poziomem odniesienia. Parametry strojenia można traktować jako stałe, ale jeśli jest tylko kilka czynników, lepiej traktować je jako osobne.jth kth β^j=0 jth λg
Estymator jest minimalizatorem funkcji wypukłej, dzięki czemu można go skutecznie obliczyć za pomocą dowolnych solverów. Możliwe, że jeśli czynnik ma wiele, wiele poziomów, te pary różnice wymkną się z rąk --- w tym przypadku konieczna będzie większa wiedza na temat możliwych wzorów zapaści.
Pamiętaj, że wszystko to odbywa się w jednym kroku! Jest to część tego, co sprawia, że estymatory typu lasso są tak fajne!
Innym interesującym podejściem jest użycie estymatora OSCAR, który jest podobny do powyższego, z wyjątkiem kary jest zastąpiony przez .∥[−11]⋅[βiβj]′∥1 ∥[βiβj]∥∞
źródło