Czytałem w kilku miejscach, że R Squared nie jest idealną miarą, gdy model jest dopasowany przy użyciu LASSO. Jednak nie jestem do końca pewien , dlaczego tak jest.
Ponadto, czy możesz polecić najlepszą alternatywę?
Czytałem w kilku miejscach, że R Squared nie jest idealną miarą, gdy model jest dopasowany przy użyciu LASSO. Jednak nie jestem do końca pewien , dlaczego tak jest.
Ponadto, czy możesz polecić najlepszą alternatywę?
Celem użycia LASSO jest uzyskanie rzadkiej reprezentacji (przewidywanej wielkości) w sensie braku wielu zmiennych towarzyszących. Porównywanie modeli z ma tendencję do faworyzowania modeli z dużą liczbą zmiennych towarzyszących: w rzeczywistości dodanie zmiennych towarzyszących niezwiązanych z wynikiem nigdy nie zmniejszy i prawie zawsze zwiększa ją przynajmniej trochę. Model LASSO zidentyfikuje model z optymalnym karalnym prawdopodobieństwem logarytmicznym (niezenalizowane prawdopodobieństwo logu jest monotonicznie powiązane z ). Statystyki walidacyjne, które są szerzej stosowane do porównywania modeli LASSO z innymi typami modeli, to na przykład BIC lub cross-validated .R 2 R 2